Modellistica e analisi dei consumi energetici in ambito...
Transcript of Modellistica e analisi dei consumi energetici in ambito...
UNIVERSITÀ DEGLI STUDI LA SAPIENZA DI ROMA
FACOLTÀ DI INGEGNERIA
CORSO DI LAUREA IN INGEGNERIA INFORMATICA
Modellistica e analisi dei consumi energetici
in ambito domestico per l’identificazione
dell’utenza e la rivelazione di anomalie
Relatore: Laureanda:
Ch. mo Prof. Roberto Cusani Manuela Marzotti
Anno Accademico 2007/2008
2
INDICE 1 PREFAZIONE ..........................................................................................................................4
2 L ‘ENERGIA ELETTRICA ....................................................................................................5
2.1 FORME E FONTI DI ENERGIA.................................................................................................5
2.2 EFFICIENZA ENERGETICA....................................................................................................6
2.3 IL CONSUMO DI ENERGIA ELETTRICA...................................................................................8
2.4 ALCUNE SOLUZIONI PER TUTELARE IL CLIMA DEL PIANETA...............................................11
2.5 LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DI ENERGIA ELETTRICA...............................13
3 MODELLISTICA E SIMULAZIONE DEI CONSUMI ENERGETICI NELL’AMBITO DOMESTICO.....................................................................................................15
3.1 INTRODUZIONE..................................................................................................................15
3.2 CARATTERISTICHE DI CONSUMO DEI PRINCIPALI ELETTRODOMESTICI...............................16
3.3 MODELLI PER LA SIMULAZIONE DI CONSUMO ELETTRICO..................................................18 3.3.1 Tipologie di famiglie............................................................................................................. 18 3.3.2 Modello semplice.................................................................................................................. 19 3.3.3 Modello di Markov per i consumi domestici ........................................................................ 23
4 ANALISI STATISTICA DEI CONSUMI DOMESTICI........... .........................................35
4.1 MEDIE E VARIANZE DELLA CURVA DI CONSUMO...............................................................35
4.2 STATISTICHE DI CONSUMO................................................................................................36 4.2.1 Giorni singoli........................................................................................................................ 36 4.2.2 Giorni multipli ...................................................................................................................... 38
4.3 RIVELAZIONE DI ANOMALIE NEI CONSUMI BASATA SUI PARAMETRI STATISTICI ................40
5 IDENTIFICAZIONE PROFILI UTENTE ..................... .....................................................41
5.1 STRATEGIE PER L’ IDENTIFICAZIONE DI PROFILI UTENTE....................................................41
5.2 APPLICAZIONE DELLA METODOLOGIA SVILUPPATA...........................................................47 5.2.1 Prima prova: famiglia-campione senza profili..................................................................... 47 5.2.2 Seconda prova: famiglia-campione con profili .................................................................... 49
5.3 LA SOLUZIONE PROPOSTA.................................................................................................51 5.3.1 Matlab................................................................................................................................... 51 5.3.2 Identificazione profili utente................................................................................................. 53
5.4 RISULTATI .........................................................................................................................53
6 RIVELAZIONE DI ANOMALIE NEL CONSUMO DOMESTICO ...... ..........................58
6.1 STRATEGIA PER LA RIVELAZIONE DI ANOMALIE ................................................................58
6.2 I RISULTATI .......................................................................................................................59
7 CONCLUSIONI......................................................................................................................62
APPENDICE A: RIVELAZIONE DI ANOMALIE NEL TRAFFICO SU INTERNET... ....64
3
APPENDICE B: SOFTWARE MATLAB PER LA MODELLISTICA E L’ANALISI DEI CONSUMI DOMESTICI ........................................................................................................73
APPENDICE C: SOFTWARE MATLAB PER LA IDENTIFICAZIONE E LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DOMESTICI...... ........................................79
BIBLIOGRAFIA..............................................................................................................................83
INDICE DELLE FIGURE ..............................................................................................................85
RINGRAZIAMENTI .......................................................................................................................87
4
1 PREFAZIONE
Il lavoro di Tesi ha riguardato lo sviluppo di un software per ottenere la rivelazione di
anomalie nel consumo di energia elettrica in ambito domestico. Al fine di formulare degli scenari
di consumo energetico, sono state raccolte informazioni riguardanti alcune famiglie tipo ed
elaborate in relazione a varie fasce orarie. Successivamente sono stati creati dei grafici in cui
sono riportati i dati relativi ai consumi, monitorati in un determinato periodo, in modo da
permettere l’individuare di eventuali anomalie nel “sistema energia” e favorire la gestione dei
consumi, ottimizzandone l’utilizzo. Di seguito sono descritte le metodologie adottate per
produrre delle analisi sulle principali fonti energetiche ed i risultati ottenuti. La tesi ha la
seguente struttura:
il capitolo 1 comprende una premessa sul contesto della tesi di laurea e una breve sintesi
degli obiettivi preposti.
il capitolo 2 tratta dell’energia elettrica soprattutto in ambito domestico, dell’importanza
del risparmio energetico e delle normative che la riguardano.
il capitolo 3 descrive i modelli sviluppati per la simulazione dei consumi energetici in
ambito domestico.
il capitolo 4 analizza i consumi simulati con i modelli descritti nel capitolo precedente
per mezzo di parametri statistici.
il capitolo 5 descrive le soluzioni proposte per l’identificazione di profili di utenze nel
consumo energetico in ambito domestico e riporta i risultati ottenuti.
il capitolo 6 descrive le soluzioni proposte per la rivelazione di anomalie di consumo
energetico in ambito domestico e riporta i risultati ottenuti.
5
2 L ‘ENERGIA ELETTRICA
La società attuale è molto sensibile al tema dell’energia elettrica in quanto la sua disponibilità
ed il suo consumo costituiscono aspetti fondamentali per indicare il livello di sviluppo
economico ed industriale di un paese; è però anche di grande importanza il suo monitoraggio e
l’ottimizzazione dei consumi per ottenere un vero e proprio risparmio di energia, simbolo di
un’adeguata organizzazione energetica, che interessa sia l’utente finale, che pagherà una bolletta
meno cara, sia la comunità perché vuol dire ridurre il consumo di combustibili fossili e quindi
l’inquinamento globale.
2.1 Forme e fonti di energia La parola energia deriva dal tardo latino energīa, a sua volta dal greco energheia, parola usata
da Aristotele nel senso di azione efficace, composta da en, particella intensiva, ed ergon,
capacità di agire. Fu durante l'epoca del Rinascimento che, ispirandosi alla poesia aristotelica, il
termine fu associato all'idea di forza espressiva. Ma fu solo nel 1619 che Keplero usò il termine
nell'accezione moderna di energia fisica [12.], che indica un sistema o un corpo che compie
lavoro e per cui l’unità di misura è quella del lavoro (joule): 1 joule esprime l'energia usata (o il
lavoro effettuato) per esercitare una forza di un newton per una distanza di un metro.
Vi sono varie forme, o modi di manifestarsi, di energia in natura. Per esempio l’energia
meccanica per cui si intende la somma di energia cinetica, cioè quella che un corpo possiede in
virtù del suo movimento, e di energia potenziale, cioè quella che un corpo possiede in virtù della
sua posizione all'interno di un campo di forze conservative, attinenti allo stesso sistema. Oppure
l’energia chimica, che varia a causa della formazione o rottura di legami chimici di qualsiasi
tipo, immagazzinata dai combustibili fossili che poi sono bruciati producendo energia termica,
un’altra forma di energia posseduta da qualsiasi corpo che abbia una temperatura superiore allo
zero assoluto.
Nell’art.1 comma 3 della legge 10/91, che titola “Norme per l’attuazione del Piano energetico
nazionale in materia di uso razionale dell’energia, di risparmio energetico e di sviluppo delle
fonti rinnovabili” si classificano le fonti di energia nel seguente modo:
6
• fonti di energia rinnovabili il sole (che per esempio viene trasformato in energia
termica e fotovoltaica), il vento, l’energia idraulica, l’energia geotermica (prodotta dal
calore accumulato all’interno della terra), le maree (causate dall’attrazione lunare sulle
acque degli oceani), il moto ondoso e la trasformazione dei rifiuti organici ed
inorganici o di prodotti vegetali; hanno la peculiarità di non avere limiti temporali al
loro sfruttamento.
• fonti di energia assimilate a quelle rinnovabili la cogenerazione, intesa come
produzione combinata di energia elettrica e calore, se soddisfa la condizione tecnica
per l’assimilabilità definita nel CIP n.6/92; il calore di risulta, fumi di scarico ed altre
forme di energia recuperabile in processi ed impianti; gli scarti di lavorazione e/o di
processi; le fonti fossili prodotte esclusivamente da giacimenti minerari isolati.
• fonti di energia esauribili, definite anche fonti convenzionali, combustibili fossili
commerciali ed altri non rientranti nelle definizioni precedenti; sono denominati fossili
perché sono stati generati da materiale biologico di natura vegetale e/o animale che,
decomponendosi nel tempo, ha dato loro vita, come per esempio il carbone ed il
petrolio, risorse che prima o poi sono destinate ad esaurirsi.
Per l’energia elettrica, una forma di energia legata a forze e campi di origine elettrica e quindi
che coinvolge il movimento di cariche elettriche, si può fare un discorso a parte in quanto
perché, pur non essendo una forma primaria di energia, è generata da tutte le fonti energetiche in
quanto in essa vengono trasformate molte fonti di energia [13.]: combustibili fossili, nucleare,
idroelettrico, geotermico ed altre rinnovabili. “L’energia elettrica, cioè la forma di energia sotto
la cui azione si muovono cariche elettriche, non è disponibile direttamente in natura. Viene
ottenuta prevalentemente per conversione dell’energia potenziale (chimica o cinetica) di fonti
fossili o rinnovabili in energia meccanica, a sua volta trasformata in energia elettrica mediante
gruppi turbo-generativi. Si tratta dunque di una forma di energia “secondaria”, che ha però
l’enorme pregio di poter essere con facilità distribuita capillarmente, nonché trasformata in
altre forme di energia. Attualmente la maggior parte dell’energia elettrica utilizzata nel mondo
viene generata a partire da fonti primarie di origine fossile (petrolio, gas naturale, carbone)”
[2.].
2.2 Efficienza energetica “Conseguire la massima efficienza nella produzione, conversione, trasporto, distribuzione e
impiego dell’energia, per accrescere la sicurezza e ridurre al minimo i problemi dell’ambiente” è
7
uno degli obiettivi primari della Carta Europea dell’Energia adottata nel 1991 dai rappresentanti
dei governi degli Stati e dai rappresentanti della Comunità Europea. L'efficienza e il risparmio
energetico hanno un ruolo fondamentale nella lotta alla protezione dell’ambiente ed ai
cambiamenti climatici ed è questo il motivo per cui risulta necessario investire
significativamente, anche e soprattutto per l'educazione delle nuove generazioni e per la
costruzione di un futuro migliore. Il Bilancio Energetico Regionale (B.E.R.) è lo strumento che
consente di ottenere una visione globale del sistema energetico di una regione; esso svolge
un'importante funzione conoscitiva esprimendo, in un quadro riepilogativo, quanta e che tipo di
energia è stata consumata in un dato periodo di tempo, ad esempio un anno, e come essa è stata
prodotta, reperita sui mercati, trasformata e consumata all'interno della regione, offrendo
un'immagine immediata e sintetica del settore energetico dell'area considerata. All’aumento
costante della popolazione è legato l’aumento del fabbisogno energetico mondiale e per cercare
di contenere le emissioni in atmosfera di sostanze inquinanti e di gas ad effetto serra, si cerca di
emanare normative per i grandi impianti termoelettrici, promuovendo l’efficienza energetica e la
conservazione di energia nell’uso del calore, dell’elettricità e dei mezzi di trasporto, tramite
l’adozione di nuove tecnologie ad alto rendimento per la generazione di energia elettrica [11.].
Al fine di prevenire gravi ed irreversibili mutamenti climatici, nel giugno del 1992 è stata
stipulata e sottoscritta da 166 Paesi, tra cui l’Italia, la Dichiarazione di Rio per tentare di
contenere le emissioni di CO2 anche grazie alla riduzione dei consumi di carburante e
combustibili fossili tramite il miglioramento dell’efficienza nelle attività di produzione,
distribuzione e consumo dell’energia. Con i decreti ministeriali 24 aprile 2001, successivamente
sostituiti dai decreti ministeriali 20 luglio 2004, è stato introdotto nel nostro Paese il meccanismo
dei “titoli commercializzabili di efficienza energetica” (o “certificati bianchi”). Ai sensi
dell’articolo 7, comma 3, dei decreti ministeriali 20 luglio 2004, l'Autorità per l'energia elettrica
e il gas predispone e pubblica annualmente un rapporto sull'attività eseguita in attuazione dei
decreti stessi e sui progetti che sono stati realizzati nel loro ambito includendo eventuali proposte
sulle modalità di conseguimento degli obiettivi, di realizzazione ed esecuzione dei progetti per
gli anni successivi [10.].
Il protocollo di Kyoto, sottoscritto nella città giapponese di Kyoto l'11 dicembre 1997 da più
di 160 paesi ma entrato in vigore il 16 febbraio 2005 dopo la ratifica anche da parte della Russia,
è lo strumento più importante per combattere i cambiamenti climatici. Per l’ambiente è
necessario un ridimensionamento delle emissioni di gas serra, non solo per far fronte all’aumento
termico globale ma anche per offrire una migliore vivibilità alle città di tutto il mondo. Il trattato
riguarda il riscaldamento globale e, premesso che l'atmosfera terrestre contiene 3 milioni di
8
megatonnellate (Mt) di CO2, prevede che i paesi industrializzati riducano del 5% le proprie
emissioni di elementi inquinanti (biossido di carbonio ed altri cinque gas serra, ovvero metano,
ossido di diazoto, idrofluorocarburi, perfluorocarburi ed esafluoruro di zolfo) rispetto alle
emissioni registrate nel 1990, considerato come anno base, nel periodo 2008-2012. Il mondo
immette 6.000 Mt di CO2, di cui 3.000 dai paesi industrializzati e 3.000 da quelli in via di
sviluppo; per cui, con il protocollo di Kyoto, se ne dovrebbero immettere 5.850 anziché 6.000, su
un totale di 3 milioni. Ad oggi, gli obiettivi del Protocollo di Kyoto sono sempre più distanti per
l'Italia [16.]. Il nostro Paese prende voti scarsi nella lotta al surriscaldamento globale e, quel che
è peggio, la soglia della sufficienza si allontana di anno in anno. A dare un giudizio negativo
sulla performance italiana in quanto a misure per la riduzione dei gas serra è il rapporto
internazionale Climate change performance index del German Watch, che mette l'Italia al
44esimo posto nella classifica dei 57 Stati a maggiori emissioni di CO2, cioè quelli che
producono il 90% dei gas serra a livello mondiale [15.].
Efficienza energetica vuol dire risparmiare energia nei processi produttivi e negli usi finali e
sfruttare le fonti energetiche rinnovabili, migliorando la sicurezza energetica del Paese anche in
un'ottica di sostenibilità ambientale. E’ questo l’obiettivo del bando Efficienza energetica di
Industria 2015, nome sintetico del disegno di legge sulla nuova politica industriale varato dal
governo italiano il 22 settembre 2006 le cui previsioni sono state recepite dalla Legge
Finanziaria 2007, che mostra un’Italia che non si arrende alle difficoltà del momento, ma anzi
vuole utilizzare questa fase per creare nuove opportunità di sviluppo e di crescita, per far fare un
salto di qualità al nostro sistema produttivo in aree cruciali come quelle legate all’energia,
all’ambiente, alla lotta al cambiamento climatico. Lunedì 21 gennaio 2009 sono stati definiti i 30
progetti di ricerca e innovazione nel settore dell’Efficienza energetica ammessi ai 200 milioni di
euro di incentivi che coinvolgeranno 234 imprese e 160 enti di ricerca e riguarderanno la
bioenergia e la produzione di energia da rifiuti, il fotovoltaico, il solare termico e termodinamico,
l’eolico, gli elettrodomestici ad elevata efficienza energetica, i materiali per l’edilizia e la
bioarchitettura, le tecniche avanzate per l’illuminazione, motori industriali elettrici a basso
consumo. Iniziative di questo tipo sono strategiche per accrescere la competitività nazionale su
mercati in espansione come quelli dell’efficienza energetica e delle rinnovabili.
2.3 Il consumo di energia elettrica Secondo il Protocollo di Kyoto, L’Italia dovrebbe ridurre entro il 2010 le emissioni del 6,5%
rispetto ai valori registrati nel 1990 poiché ogni anno si consumano complessivamente circa 180
9
milioni di tonnellate equivalenti di petrolio (tep), cioè ciascun italiano, in termini energetici,
costa circa 10 litri di petrolio al giorno.
Fig.1: Emissioni di CO2 (milioni di tonnellate) [17.]
Dalla ricerca svolta dal WWF insieme al Politecnico di Milano emerge che per il superamento
delle barriere più ostiche nella penetrazione dell'efficienza energetica è necessario intervenire
anche nelle singole abitazioni. La stessa Eni ha lanciato una campagna nazionale per l’efficienza
energetica, dando consigli per ridurre gli sprechi ed individuando una serie di misure a costo
zero facilmente adottabili dalle famiglie italiane, sia in casa che durante il lavoro. I suggerimenti
riguardano le piccole azioni quotidiane (come usare le lampadine a basso consumo, non tenere
gli elettrodomestici in stand-by, usare le lavatrici a temperature basse e le lavastoviglie solo a
pieno carico), l’acquisto di elettrodomestici efficienti (come sostituire gli apparecchi vecchi, o
cambiare lo scaldabagno elettrico con uno a gas), la regolazione della temperatura nelle
abitazioni (d’inverso tenere in casa una temperatura di 20° C, d’estate ridurre l’uso del
condizionatore), l’utilizzo intelligente dell’autovettura (mantenere una velocità moderata in
autostrada ed un’andatura regolare in città, usare le marce alte, controllare la pressione dei
pneumatici almeno una volta al mese, evitare di riscaldare il motore a veicolo fermo).
Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti. Ridurre i
consumi irrazionali sin da oggi significa pensare al futuro. Il consumo casalingo di un solo
chilowattora (kWh), corrispondente a circa mezz’ora d’accensione di uno scaldabagno o di una
stufetta elettrici, richiede, nelle centrali dell’ENEL, la combustione di circa 250 g d’olio
combustibile (un quarto di chilo di petrolio!) e l’immissione in atmosfera di 750 g di anidride
carbonica. Ma di chilowattora, nelle famiglie, se ne consumiamo, in media, circa 7 al giorno,
10
bruciando quasi 2 kg di petrolio e scaricando 5 kg di CO2. Nel primo trimestre del 2008 la
domanda complessiva di energia è aumentata del 2,8% in termini tendenziali, avendo avuto
temperature mediamente più rigide rispetto al mite inverno registrato a inizio 2007 che hanno
influenzato pesantemente i consumi, in particolare di gas naturale.
Fig.2: Consumi di energia in fonti primarie (gennaio-marzo) [17.]
Gli interventi per un risparmio energetico in ambito domestico sono numerosi ed a volte è
sufficiente fare un po’di attenzione perché oltre a prevenire l’inquinamento globale evitando lo
spreco di energia, si può ottenere un vero e proprio vantaggio economico; sono sempre di più le
famiglie che si accorgono che, ad incidere sul bilancio non è solo il costo dell’affitto o del
mutuo, ma la spesa per il riscaldamento d’inverno ed il raffreddamento d’estate. Tutti gli edifici
dovrebbero rispettare la normativa sul risparmio energetico (legge 10/91 e DPR 412/93) e quella
sulla sicurezza (legge 46/90 – norme UNI-CIG) verificando ad esempio i limiti previsti per
l’isolamento delle pareti esterne, per le distanze dei camini da finestre, balconi, tetti, per il
rendimento degli impianti termici, le emissioni d’inquinanti, la termoregolazione degli ambienti.
Per ottenere però dei veri e propri risultati si deve esercitare un efficace lavoro di informazione
dei cittadini e formazione di tecnici, nonché una seria attività di monitoraggio e verifica degli
standard richiesti, a partire da semplici prescrizioni; prevedere la presenza di energy manager nei
condomini più grandi, ricostruire il ruolo dell'Amministratore di condominio, ed in modo
particolare dell'amministratore professionista, introducendo un meccanismo che premi i
miglioramenti nell'efficienza. Va spezzato il nesso tra la convenienza dei fornitori a vendere più
combustibile, l'indifferenza dell'amministrazione, la difficoltà di intervento dei condomini che
pagano la bolletta [9.]. E’ per questo che sta nascendo la figura del Certificatore Energetico, il
cui intervento è rivolto al risparmio per i lavori di ristrutturazione in senso energetico, che dovrà
11
preoccuparsi di rilasciare la documentazione per la produzione della certificazione energetica
degli edifici. Tale documentazione, in seguito alle detrazioni del 55% sul Reddito Irpef, per
cambiare gli infissi, installare doppi vetri, pannelli solari e caldaie ad alto rendimento, implica
l’inserimento degli edifici in una classificazione che premia gli immobili più efficienti
innalzando il loro valore sul mercato immobiliare: meno energia consuma la casa e più vale nel
caso la si voglia vendere oppure affittare.
2.4 Alcune soluzioni per tutelare il clima del pianeta Ridurre il consumo energetico per migliorare la qualità della vita è l’obiettivo comune.
Durante la conferenza internazionale sul clima, nel dicembre del 2008, “grandi della Terra” si
sono riuniti a Poznan ed il ministro dell'Ambiente polacco Maciej Nowicki ha presentato “la più
grande mostra di tecnologie per salvare il clima realizzata finora”, la cosiddetta “Disneyland del
cambiamento climatico” ed ha detto: “con questa mostra vogliamo avvicinare la gente a
tecnologie sostenibili che sono già alla portata di tutti. Far capire che non sono solo i grandi
decisori politici che devono impegnarsi con scelte per promuovere risparmio e efficienza
energetica, ma tutti, ciascuno secondo le proprie possibilità”. Sono stati presentati 120
installazioni che mostrano tutte le possibili soluzioni per risparmiare come per esempio: mp3
alimentati da zollette di zucchero attraverso la scissione del glucosio da parte di enzimi organici,
asse da stiro realizzato con un sottile strato di granito che consente di risparmiare il 50% di
energia, contenitori che trasformano l'umidità in acqua, scaldabagno solare a specchio concavo
che permette di riscaldare l’acqua senza utilizzare energia elettrica, pompa di calore in grado di
estrarre grandi quantità di acqua dall’aria funzionando come un mulino a vento, auto ad idrogeno
e generatori di biogas da prodotti di scarto [33.]. Un paesino arroccato sui monti del Cilento,
Torraca, è divenuto sede di un corso di laurea sul rapporto tra ambiente ed energia e si è
trasformato in un laboratorio per i progetti avanzati. E’ stato il primo paese al mondo a sostituire
le vecchie lampadine ad incandescenza di tutti i lampioni con i led, light emitting diode che
rappresentano la tecnologia più avanzata nel campo dell’illuminazione ad alta efficienza, per
fornire luce con meno emissioni serra, meno inquinamento luminoso e risparmiando anche sulla
bolletta; sta per costruire la più lunga monorotaia elettrica, un binario di 5,5 chilometri che
ridurrà al minimo l’impatto ambientale del trasporto sia dal punto di vista delle emissioni
inquinanti che da quello della realizzazione dell’opera; a breve inaugurerà a breve una fabbrica
per produrre pannelli fotovoltaici, che forniscono cioè energia pulita dal sole; ha la prima piscina
autosufficiente dal punto di vista energetico che utilizza i led per l’illuminazione, i pannelli
fotovoltaici per l’alimentazione elettrica, un impianto solare termico per scaldare l’acqua e un
12
telo isotermico per ridurre la dispersione termica [34.]. Sono molte le capitali europee e non solo
sempre alla ricerca di nuove soluzioni a basso impatto ambientale. Friburgo tenta di ridurre del
25% entro il 2010 la quantità di biossido di azoto immessa nell'atmosfera puntando molto sulla
bioenergia prodotta dal vento, dall'acqua e soprattutto dal sole, con pannelli fotovoltaici e a
biomassa. Sostenibilità ambientale e risparmio energetico sono presi molto sul serio in Svezia;
qui si ha infatti come obiettivo quello di diventare entro il 2020 il primo paese al mondo basato
su un sistema economico petrol free. Malmo, definita “città del futuro”, è un’altra eco city nota
per il suo quartiere Porto Ovest, che produce il 100% della propria energia da fonti rinnovabili e
alimenta i veicoli con biogas provenienti dai rifiuti urbani; sotto ciascun edificio è stata creata
una sorta di intercapedine ad acqua per mantenere il calore d’inverno e rinfrescare d’estate; i tetti
delle case sono coperti da manto erboso con funzione isolante e pannelli fotovoltaici. Un po’ più
a nord Stoccolma, altra città modello per l’alta qualità della vita, risponde con un immenso
giardino cittadino, l’Ecoparken. A Barcellona il Consiglio Comunale e l’Agenzia energetica
cittadina hanno stilato il “Plan de mejora energética de Barcelona”: si punta al 20% di emissioni
nocive in meno entro il 2010 e meno 4,2% di consumi energetici. A Los Angeles esiste una
stazione di servizio ecologica chiamata Helios House costituita da 1653 pannelli riciclabili di
acciaio inossidabile e 90 pannelli solari per produrre energia rinnovabile. Copenaghen è la prima
città ciclabile d’Europa: viene infatti utilizzata dal 36% degli abitanti, numero destinato in tempi
brevi ad incrementarsi fino al 50%. E l’Italia? Le statistiche evidenziano che il bel Paese
produce il 20% del totale energetico nazionale da fonte rinnovabile. Basta percorrere l'autostrada
A4 in prossimità di Brescia per vedere uno dei più grandi termovalorizzatori europei.
Fig.3: Termovalorizzatore di Brescia (vista dalla A4)
13
Imponente e colorato è simbolo di un impegno costante contro gli sprechi energetici e il
surriscaldamento terrestre.
2.5 La rivelazione di anomalie nei consumi di energia elettrica
Dalle considerazione fatte nei paragrafi precedenti si deduce l’importanza di avere un
consumo di energia elettrica razionale cercando di evitare inutili sprechi sia per limitare il
surriscaldamento globale sia per veri e proprio motivi economici. Uno studio americano ha
rivelato che in Canada ogni anno si hanno furti di energia elettrica per un costo di 500 milioni di
dollari causati principalmente da coltivazioni illecite di marijuana. In Italia si hanno molteplici
casi di furti e frodi di energia elettrica; sono stati arrestati nomadi che avevano allacciato
numerosi cavi di fortuna ad alcune centraline della società “Acea”, utilizzando illecitamente
l’energia elettrica per l’illuminazione dei campi abusivi. Dopo vari controlli a campione sulle
utenze di fornitura elettrica, sono state scoperte situazioni di illegalità, connesse a furti o frodi di
energia elettrica mediante allacci abusivi ai fili dell’illuminazione pubblica o modifiche del
sistema di lettura del contatore con interruttori nascosti che consentono di regolare il consumo di
energia elettrica. Il furto di energia, oltre ad essere dispendioso, è molto più grave e pericoloso di
quello che sembra, può causare incendi o scosse elettriche; i criminali sono molto furbi e le
tecniche usate a tal fine molto difficili da individuare.
Nel diritto penale italiano il furto è un reato previsto dall'art. 624 ai sensi del quale: “chiunque
si impossessa della cosa mobile altrui, sottraendola a chi la detiene, al fine di trarne profitto per
sé e per altri, è punito con la reclusione da sei mesi a tre anni e con la multa da euro 154 a 526.
Agli effetti della legge penale, si considera cosa mobile anche l'energia elettrica e ogni altra
energia che abbia un valore economico. (art. 624 comma 2 c.p.)”. Il reato di furto di energia
elettrica ha spedito in carcere molte persone che con allacciamenti abusivi alla rete dell'Enel o
mediante manomissioni dei contatori, tali da consentire l'alterazione della normale registrazione
dei consumi, garantivano in maniera gratuita ad abitazioni ed ai negozi la fornitura di energia
elettrica.
Da qui nasce l’esigenza di uno strumento che riconosca e rilevi situazioni di anomalie nei
sistemi elettrici che possono essere causate da malfunzionamenti o manomissioni dei contatori;
solo utilizzando apparecchiature specifiche si può identificare chi, quanto, e quando ha
contribuito a superare la potenza di energia elettrica standard appropriandosene illegalmente. Per
poter rivelare i vari casi di anomalie si inizia con la costruzione di un profilo utente
14
rappresentante il normale uso di energia elettrica per poi passare all’identificazione di deviazioni
da tale profilo come possibili situazioni anomale. Le anomalie in tale ambito sono infatti definite
come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica appartenenti
ad uno specifico profilo utente.
15
3 MODELLISTICA E SIMULAZIONE DEI
CONSUMI ENERGETICI NELL’AMBITO
DOMESTICO
3.1 Introduzione La prima fase di questo lavoro consiste nel generare un consumo energetico in ambito
domestico per diverse tipologie di famiglie. I modelli sviluppati per tale scopo consentono di
produrre vari grafici per rappresentare i livelli di consumo di energia elettrica e di analizzare i
dati monitorati in un determinato periodo. A tale scopo si è cercato di simulare il consumo di
energia elettrica per tre differenti esemplari di nuclei familiari composti da 2, 3 e 4 persone.
Utilizzando un misuratore di consumo elettrico, il quale applicato alla presa della corrente
calcola il consumo di ogni elettrodomestico presente in casa e con le bollette degli anni 2006 e
2007, è stato possibile avere dei dati veritieri riguardanti il consumo di corrente di una famiglia-
campione, composta da 3 persone.
Bimestre kWh/2006 euro/2006 kWh/2007 euro/2007
I° (½ dic - ½ feb) 502,00 80,76 573,00 107,88
II° (½ feb - ½ apr) 516,00 84,92 555,00 103,83
III° (½ apr - ½giu) 539,00 90,59 699,00 149,44
IV° (½ giu - ½ ago) 671,00 139,89 562,00 110,30
V° (½ ago - ½ ott) 592,00 112,73 608,00 118,54
VI° (½ ott - ½ dic) 519,00 98,04 599,00 116,61
Totali 3339,00 606,93 3596,00 706,60
Fig.4: Consumo energetico 2006/2007 in una famiglia-campione
Con l’aiuto di tabelle presenti in Internet [1.], è stato possibile risalire al consumo medio
annuo delle altre due tipologie di famiglie. Tale procedura è stata messa a punto riportando i
consumi stimati in un file di lavoro Excel per simulare il comportamento di diverse utenze
caratterizzanti alcune famiglie prese in esame. I dati ottenuti sono stati poi lavorati permettendo
16
così di individuare eventuali anomalie o malfunzionamenti allo scopo di ottimizzare l’utilizzo e
la gestione dei consumi.
3.2 Caratteristiche di consumo dei principali elettrodomestici
Ogni elettrodomestico conforme alle norme europee è dotato di un’etichetta indicante il
consumo diviso in classi che vanno dalla lettera A alla lettera G; quelli di classe A consumano
meno. Su ogni targhetta è riportata la tensione (220v per l’Italia) e la corrente assorbita indicata
in Ampere; per ottenere il consumo in watt (unità di misura della potenza), è sufficiente
moltiplicare i volt (unità di misura della tensione) per gli ampere (unità di misura della corrente),
per avere i kWh si divide ulteriormente per mille. Inoltre sono indicati i kWh/anno che
l’elettrodomestico consuma, stimati in base a prove di laboratorio standard.
Con l’invecchiamento di un elettrodomestico il consumo può aumentare e non rientrare più
negli standard; è però possibile utilizzare un misuratore di consumo elettrico che, inserito tra la
presa e la spina dell’oggetto che si desidera monitorare, permette di visualizzare informazioni
come: la potenza in ampere, il consumo di corrente elettrica in watt, i tempi di misurazione in
minuti e ore, i kWh del consumo complessivo di corrente durante il tempo misurato, la tariffa
locale precedentemente impostata per ogni kWh, i costi complessivi del consumo, la tensione
presente. L'energia richiesta da un apparecchio acceso 24 ore al giorno per 365 giorni l'anno ed il
costo necessario per tale energia si possono calcolare facilmente tramite la formula:
Nelle famiglie prese in considerazione, è stato ipotizzato l’uso di alcuni elettrodomestici e
calcolata una media di consumo per ognuno di essi. Si è preferito supporre l’utilizzo di un
microonde invece del forno tradizionale per semplicità di calcolo e per poterne prevedere un
impiego più frequente; il suo consumo è stato stabilito essere di 1000 watt. Come computer si è
ipotizzato un notebook il cui consumo dipende da diversi fattori come il disco fisso, il chip
17
grafico, il processore, e soprattutto dalle dimensioni del display, un pannello LCD
retroilluminato da lampade, che più è grande e più avrà lampade estese, che di conseguenza
consumeranno di più. Per sapere quanto consumano i componenti interni di un portatile è
sufficiente l’etichetta sull’alimentatore: in genere si va da un minimo di 12 volt a un massimo di
19 volt in uscita e da 3,5 a 7 ampere. E’ stata calcolata una media e stabilito un consumo pari a
65 watt, 18,5 volt e 3,5 ampere. I nuovi modelli di lavastoviglie consumano, per il ciclo più
lungo, tra 1,4 e 1,8 kWh rispetto ai 2,5 kWh delle lavastoviglie tradizionali. Infatti le nuove
tecnologie permettono di diminuire l’acqua per un ciclo di lavaggio, riducendo l’energia
necessaria per portarla alla giusta temperatura, dando la possibilità di effettuare cicli ridotti o
“rapidi” [4.]. La lavatrice, da sola, è responsabile di una quota cospicua dei consumi elettrici
delle nostre abitazioni; questo consumo è dovuto soprattutto al riscaldamento dell’acqua per il
lavaggio, mentre solo una piccola percentuale serve ad azionare il motore [4.]. I nuovi modelli di
lavatrici consumano tra i 1,5 e 2,1 kWh rispetto ai 2,8 kWh delle lavatrici tradizionali. Per la luce
sono state prese in considerazioni lampadine da 60 watt, e ipotizzata la presenza di una
lampadina in ogni stanza; quindi i consumi sono stati calcolati in base al numero di stanze
presenti in un appartamento. Lo scaldabagno (o boiler) è stato ipotizzato di circa 5 litri quindi di
piccole dimensioni. I consumi della televisione cambiano in base al modello: se è un LCD il
consumo è 100, se è un plasma consuma 150, se è a tubo catodico (CRT) 50 ed è quest’ultimo
quello preso in considerazione per la simulazione. Esistono diversi modelli di ferri da stiro, a
vapore e non, il cui consumo dipende dalla temperatura di funzionamento che nei modelli più
tecnologici può essere variata grazie ad un termostato e la potenza è generalmente compresa tra
700 e 1500 W. Il consumo dell’asciugacapelli e dell’aspirapolvere sono stati calcolati in base al
modello considerato: il primo è un Severin HH 6320, un phon con cuffia asciugacapelli, con 2
livelli di temperatura e colpo d’aria fredda, il secondo un IMETEC 8601, una scopa elettrica con
sacchetto, senza potenza variabile. Il consumo della radio è stato preso dalle tabelle trovate in
Internet [1.]. Il frigorifero per cui è stato preso in considerazione solo il consumo medio annuo,
essendo un apparecchio acceso tutto il giorno, è di tipo A+.
Elettrodomestico potenza ON
(watt)
Microonde 1000
PC 65
Lavastoviglie 1400
Lavatrice A 1500
Boiler 2000
Luce 60
18
TV CRT 50
Ferro da stiro 700
Asciugacapelli 400
Aspirapolvere 700
Radio 20
Fig.5: Consumo in watt degli elettrodomestici
3.3 Modelli per la simulazione di consumo elettrico Per determinare il consumo di energia elettrica in ambito domestico sono stati considerati due
diversi tipi di modelli. Entrambi si basano sulla stima di accensione degli elettrodomestici sopra
elencati in diversi momenti di una giornata tipo. Per avere un’analisi più dettagliata dei consumi,
è stato deciso di usare un intervallo di campionamento di 30 minuti, per un totale di 48 valori
nell’arco delle 24 ore. In questo modo si ottiene un grafico rappresentante l’andamento medio
giornaliero della richiesta di potenza nel tempo, dalle ore 0:00 alle 23:30, di tutti gli apparecchi
monitorati. Il consumo giornaliero espresso in kWh rappresenta il consumo registrato nell’arco
delle 24 ore prese in considerazione; il consumo giornaliero medio è la media dei consumi
giornalieri misurati nell’arco dell’anno.
I modelli costruiti sono:
⇒ semplice: prevede l’uso delle probabilità di accensione degli elettrodomestici,
indipendenti tra di loro;
⇒ di Markov: prevede l’uso dei processi di Markov ed ogni stato genera un evento con
una certa distribuzione di probabilità che dipende solo dallo stato di sistema
immediatamente precedente.
3.3.1 Tipologie di famiglie
Per poter generare un consumo di energia elettrica il più possibile simili alla realtà, sono state
prese in considerazione diverse tipologie di famiglie-campione tenendo presente i diversi stili di
vita e abitudini di ciascuna di esse. La rivelazione di anomalie è stata effettuata in due prove
distinte, che però hanno un denominatore comune: le tipologie di famiglie studiate. Infatti in
entrambi i casi, le famiglie-campione sono divise innanzitutto in base ai componenti delle stesse
che possono essere 2, 3 o 4 persone. La seconda prova fa però un’ulteriore distinzione all’interno
delle famiglie-campione, cioè per ognuna di esse crea due differenti profili con consumi simili
ma diverse abitudini giornaliere.
19
3.3.1.1 Prima prova
Nella prima prova sono state prese in considerazione le tre famiglie-campione di cui sopra
composte nel seguente modo:
1. due persone: un ragazzo ed una ragazza entrambi lavoratori, che vivono in un
appartamento con un bagno, una cucina, una camera ed una sala da pranzo.
2. tre persone: una madre casalinga, un padre impiegato ed un figlio studente.
L’appartamento ha 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una
sala da pranzo.
3. quattro persone: una madre casalinga, un padre impiegato e 2 figli studenti che vivono in
un appartamento con 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una
sala da pranzo.
3.3.1.2 Seconda prova
Per la seconda prova è stato necessario determinare due diversi profili per ciascun nucleo
familiare in base al loro stile di vita. La famiglia di 2 persone che vive in un appartamento con
un bagno, una cucina, una camera ed una sala da pranzo è stato differenziato in:
⇒ profilo 1: un lavoratore ed una casalinga;
⇒ profilo 2: due studenti in affitto.
La famiglia di 3 persone che vive in un appartamento di 2 bagni, una cucina, una camera, una
cameretta, un ingresso ed una sala da pranzo è stato differenziato in:
⇒ profilo 1: un lavoratore, una casalinga ed uno studente;
⇒ profilo 2: due studenti ed un lavoratore.
La famiglia di 4 persone che vive in un appartamento con 2 bagni, una cucina, una camera,
una cameretta, un ingresso ed una sala da pranzo è stato differenziato in:
⇒ profilo 1: un lavoratore, una casalinga e due studenti;
⇒ profilo 2: due studenti e due lavoratore.
3.3.2 Modello semplice
Il modello semplice è usato solo durante la prima prova per la rivelazione di anomalie e
consiste nel decidere le probabilità di accensione dei vari elettrodomestici presenti nelle tabelle
sopra, durante un qualsiasi giorno feriale di primavera, in cui il sole sorge alle 6 e tramonta
20
intorno alle 20. Sono state usate 48 mezze ore e 365 giorni. Le probabilità cambiano in base alla
famiglia presa in considerazione e allo stile di vita.
Consumi di una famiglia-campione di 2 persone
Le probabilità definite per la famiglia di due persone, composta da due ragazzi entrambi
lavoratori, sono state ipotizzate considerando al massimo 4 lampadine accese
contemporaneamente ma solo tra le 20:00 e le 22:30, momento della giornata in cui entrambi i
componenti si trovano a casa. Infatti si è pensato di far uscire i componenti della famiglia in orari
di ufficio. Tra le 8:00 e le 17:00 è stata data la massima probabilità (cioè 10) al caso in cui tutte
le lampadine siano spente perché a casa non si trova nessuno in quell’orario; la stessa cosa
accade durante la notte che si suppone un consumo quasi nullo. E’ stato considerata la presenza
di un solo notebook usato da entrambi, anche questo acceso prevalentemente nel tardo
pomeriggio e durante la sera; stessa ipotesi fatta anche per gli altri elettrodomestici come la
lavatrice, la lavastoviglie, il ferro, il microonde, il boiler e l’aspirapolvere. L’asciugacapelli si
pensa possa essere usato al mattina prima di uscire, o la sera una volta rientrati. Sono state
ipotizzate due televisioni CRT, una in camera da letto e l’altra nella sala da pranzo, usate
prevalentemente di sera.
Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati
nella seguente tabella:
Elettrodomestico
consumo
annuo (kwh)
2 persone
kwh al
giorno
Microonde 400 1,10
PC 100 0,27
Lavastoviglie 350 0,96
Lavatrice A 200 0,55
Boiler 900 2,47
Luce 270 0,74
TV CRT 150 0,41
Ferro da stiro 80 0,22
Frigorifero A+ 303 0,83
Asciugacapelli 50 0,14
Aspirapolvere 80 0,22
Radio 10 0,03
totale kwh 2893 7,93
Fig.6: Tabella di consumo medio giornaliero e annuo 2 persone
21
La Fig.7: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate (sinistra)
e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 2 persone:
Fig.7: Consumo medio 2 persone con modello semplice
Consumi di una famiglia-campione di 3 persone
La famiglia di tre persone, composta da madre casalinga, padre lavoratore e figlio studente, è
stata pensata in una casa di sei stanze con al massimo 6 lampadine accese contemporaneamente.
Si è ipotizzata l’uscita del padre e del figlio verso le 8:00, mentre quella della madre dalle 9:30
alle 11:30, con il rientro da scuola del ragazzo per l’ora di pranzo. Il notebook è usato
prevalentemente dal figlio durante il pomeriggio e dopo cena. Sono state considerate due
televisioni, accese durante il pranzo e durante la sera. L’uso di quasi tutti gli elettrodomestici è
stato ipotizzato nella mattinata o nel primo pomeriggio, ad esclusione del microonde usato sia a
pranzo che a cena e dello scaldabagno acceso durante la notte.
Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati
nella seguente tabella:
Elettrodomestico
consumo
annuo (kwh)
3 persone
kwh al
giorno
Microonde 500 1,37
PC 120 0,33
Lavastoviglie 460 1,26
Lavatrice A 240 0,66
Boiler 1200 3,29
Luce 300 0,82
TV CRT 250 0,68
22
Ferro da stiro 120 0,33
Frigorifero A+ 303 0,83
Asciugacapelli 60 0,16
Aspirapolvere 100 0,27
Radio 15 0,04
totale kwh 3668 10,05
Fig.8: Tabella di consumo medio giornaliero e annuo 3 persone
La Fig.9: mostra il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i
365 giorni dell’intero anno (destra) per una famiglia-campione di 3 persone:
Fig.9: Consumo medio 3 persone con modello semplice
Consumi di una famiglia-campione di 4 persone
La famiglia di quattro persone vive in un appartamento di sei stanze, ognuna dotata di una
lampadina da 60 watt, ed è composta da madre casalinga, padre impiegato e due figli che vanno
a scuola. Si è ipotizzato che i figli con il padre escano la mattina intorno alle 8:00 e la madre per
le 9:30 rientrando verso le 11:30. Quindi l’uso degli elettrodomestici è concentrato nella tarda
mattinata o nel primo pomeriggio. Il notebook è usato dai figli, quindi sarà acceso in un orario
successivo al loro rientro previsto per l’ora di pranzo. Le due televisioni sono usate in prevalenza
durante i pasti, e la sera così come la lavastoviglie ed il microonde. Lo scaldabagno viene acceso
sia durante la notte sia nel primo pomeriggio perché nel caso di quattro persone si consumerà più
acqua calda. Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono
riportati nella seguente tabella:
23
Elettrodomestico
consumo
annuo (Kwh)
4 persone
kwh al
giorno
Microonde 600 1,64
PC 140 0,38
Lavastoviglie 580 1,59
Lavatrice A 320 0,88
Boiler 1700 4,66
Luce 350 0,96
TV CRT x 2 300 0,82
Ferro da stiro 160 0,44
Frigorifero A+ 303 0,83
Asciugacapelli 80 0,22
Aspirapolvere 130 0,36
Radio 15 0,04
totale kwh 4678 12,82
Fig.10: Tabella di consumo medio giornaliero e annuo 4 persone
La Fig.11: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate
(sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 4 persone:
Fig.11: Consumo medio 4 persone con modello semplice
3.3.3 Modello di Markov per i consumi domestici
Il modello di Markov è usato sia nella prima sia nella seconda prova per la rivelazione di
anomalie ed è un processo stocastico nel quale la probabilità di transizione che determina il
passaggio ad uno stato di sistema dipende unicamente dallo stato di sistema immediatamente
precedente e non dal come si è giunti a tale stato, né da tutto ciò che è successo nel passato;
24
questa è detta proprietà di Markov, o condizione di “assenza di memoria”. I processi stocastici
sono modelli matematici probabilistici utilizzati nella descrizione di fenomeni casuali
rappresentabili come funzioni di un parametro, che di solito ha il significato di tempo. Una
catena di Markov è un processo di Markov a stati discreti, ovvero è un processo stocastico
discreto per cui ad ogni istante t si estrae dal processo una variabile casuale discreta [5.].
Per questo modello i consumi relativi alla luce, al notebook e alla televisione sono stati
calcolati come nel modello semplice, utilizzando cioè una distribuzione di probabilità di
accensione; questa scelta è stata fatta perché se ne è ipotizzato un uso quotidiano. Il motivo per
cui è stato sviluppato un secondo modello con Markov, è che per rendere la simulazione di
consumo più realistica, è stato necessario considerare che in ambito domestico l’accensione di
alcuni elettrodomestici non avviene tutti i giorni ma solo alcune volte a settimana. Quindi per
questa tipologia di elettrodomestici, come il microonde, la lavastoviglie, la lavatrice, lo
scaldabagno, il ferro da stiro, l’aspirapolvere e il phon, sono stati usati i processi di Markov per
determinare i consumi delle famiglie, che modellano sistemi fisici che possono trovarsi ad ogni
istante in uno tra n possibili stati e possono modificare il loro stato solo agli istanti t1, t2,..... Con
questi processi è possibile determinare una distribuzione uniforme per decidere il momento della
giornata (mattino, pomeriggio, sera, notte) e il giorno della settimana in cui parte
l’elettrodomestico, in base alla probabilità di transizione tra uno stato e l’altro. E’ quindi
possibile simulare l’accensione degli apparecchi in maniera random. Infatti si è ragionato in
modo da non prevedere l’uso, per esempio, della lavatrice tutti i giorni e neanche il giorno
seguente a quello in cui è stata fatta. Questo per simulare al meglio la vita quotidiana. Infatti si
parte dal presupposto che se in una famiglia in media si fanno per esempio tre lavatrici a
settimana, se si fa il lunedì, sarà poco probabile che si rifaccia il martedì, mentre sarà un po’ più
probabile che sia fatta il mercoledì; è invece quasi sicuro, quindi molto probabile, che si accenda
la lavatrice il giovedì, e così via.
Lo stato iniziale è scelto a caso e viene poi moltiplicato per la matrice delle probabilità di
transizione. Gli elettrodomestici potrebbero essere utilizzati contemporaneamente e per questo si
è fissata una soglia di 3,0 kw come potenza contrattuale, oltre la quale “scatta” la corrente. Si
sono decisi per ogni nucleo familiare, il numero di stati della catena di Markov necessari, le
probabilità di transizione tra gli stati e le matrici di transizione i cui elementi rappresentano delle
probabilità di transizione tra diversi stati. Più precisamente pij è la probabilità condizionata che il
sistema si trovi “domani” nello stato j essendo “oggi” nello stato i. Tale matrice ha la proprietà
che la somma degli elementi di ogni riga deve essere pari a 1, in quanto se il sistema si trova in
uno stato, al passo successivo deve necessariamente evolvere in uno degli altri n-1 stati.
25
Una volta determinato il vettore 0 rappresentante la distribuzione iniziale di probabilità degli
n stati possibili e la matrice di transizione, siamo in grado di prevedere, in termini probabilistici,
l'evoluzione del sistema. Infatti, il vettore 1 è calcolato applicando la matrice di transizione al
vettore iniziale 0; la distribuzione di probabilità del sistema al passo 2 è calcolata applicando la
matrice al vettore 1 e così via fino all’istante di tempo desiderato. Il numero di stati della catena
di Markov dipende dall’uso settimanale dell’elettrodomestico, considerando che questo può
essere acceso di mattina, di pomeriggio o di sera. Lo stato iniziale, come già detto scelto a caso,
è quello in cui viene usato l’elettrodomestico; rappresenta quindi la mattina, il pomeriggio o la
sera di un giorno qualsiasi della settimana. Più ci si allontana dallo stato iniziale, più sarà alta la
probabilità di tornarvi e quindi di accendere di nuovo l’elettrodomestico.
3.3.3.1 Prima prova
Consumi di una famiglia-campione di 2 persone
Nella famiglia composta da un ragazzo e da una ragazza entrambi lavoratori, l’accensione di
quasi tutti gli elettrodomestici in un giorno feriale è stata ipotizzata dalle ore 17:00 in poi ad
esclusione della radio e dell’asciugacapelli usati al mattino prima delle 8:00 e dello scaldabagno
acceso prevalentemente durante la notte. L’uso settimanale di ciascun elettrodomestico è
riportato nella tabella seguente:
Elettrodomestico Impiego Num. stati
Lavatrice 2 volte a sett. 7
Aspirapolvere 3 volte a sett. 5
Asciugacapelli 2 volte a sett. 7
Ferro da stiro 2 volte a sett. 7
Microonde 4 volte a sett. 4
Lavastoviglie 3 volte a sett. 5
Scaldabagno 4 volte a sett. 4
Fig.12: Markov famiglia-campione 2 persone
I consumi giornalieri sono gli stessi riportati in Fig.6: , e il grafico del consumo giornaliero
tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-
campione di 2 persone risulta essere il seguente:
26
Fig.13: Consumo medio 2 persone con modello di Markov
Consumi di una famiglia-campione di 3 persone
Nella famiglia composta da 3 persone, essendo la mamma una casalinga, l’accensione degli
elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio
e l’asciugacapelli sono usati al mattino prima delle 8:00; lo scaldabagno è acceso sia durante la
notte sia durante il pomeriggio. Il notebook viene usato nel pomeriggio dal figlio dopo l’ora di
pranzo. L’uso settimanale di ciascun elettrodomestico è riportato nella tabella seguente:
Elettrodomestico Impiego Num. stati
Lavatrice 3 volte a sett. 5
Aspirapolvere 4 volte a sett. 4
Asciugacapelli 3 volte a sett. 5
Ferro da stiro 3 volte a sett. 5
Microonde 5 volte a sett. 3
Lavastoviglie 4 volte a sett. 4
Scaldabagno 5 volte a sett. 3
Fig.14: Markov famiglia-campione 3 persone
I consumi giornalieri sono gli stessi riportati in Fig.8: , e il grafico del consumo giornaliero
tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-
campione di 3 persone risulta essere il seguente:
27
Fig.15: Consumo medio 3 persone con modello di Markov
Consumi di una famiglia-campione di 4 persone
Anche nella famiglia di 4 persone, la mamma è una casalinga e quindi l’accensione degli
elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio
e l’asciugacapelli sono usati al mattino prima delle 8:00; la televisione usata soprattutto a pranzo
e a cena. Lo scaldabagno è acceso sia durante la notte sia durante il pomeriggio. Il notebook
viene usato nel pomeriggio e durante la sera dai figli. L’uso settimanale di ciascun
elettrodomestico è riportato nella tabella seguente:
Elettrodomestico Impiego Num. stati
Lavatrice 4 volte a sett. 4
Aspirapolvere 5 volte a sett. 3
Asciugacapelli 4 volte a sett. 4
Ferro da stiro 4 volte a sett. 4
Microonde 6 volte a sett. 2
Lavastoviglie 5 volte a sett. 3
Scaldabagno 6 volte a sett. 2
Fig.16: Markov famiglia-campione 4 persone
I consumi giornalieri sono gli stessi riportati in Fig.10: , e il grafico del consumo giornaliero
tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-
campione di 4 persone risulta essere il seguente:
28
Fig.17: Consumo medio 4 persone con modello di Markov
3.3.3.2 Seconda prova
Tenendo presente tutte le considerazioni fatte in precedenza per l’uso degli elettrodomestici in
ciascuna famiglia, nella seconda prova sono state distinti per ciascuna famiglia-campione due
profili utente ognuno con diversi tipi di componenti familiari e di conseguenza con differenti
abitudini nell’uso dell’energia elettrica. I due profili sono stati creati mantenendo valori di
consumi medi annui e giornalieri simili a quelli delle famiglie-campione a cui fanno riferimento
calcolati nella prima prova.
Consumi dei due profili di una famiglia-campione di 2 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il
profilo 1 di una famiglia-campione di 2 persone, composta da un lavoratore ed una casalinga,
sono riportati nella tabella seguente:
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 1
Impiego kwh al
giorno
Microonde 1000 400 4 volte a sett. 1,10
PC 65 100 5 ore al dì 0,27
Lavastoviglie 1400 300 3 volte a sett. 0,82
Lavatrice A 1500 150 2 volte a sett. 0,41
Boiler 2000 800 4 volte a sett. 2,19
Luce 60 290 5 ore al dì 0,79
TV CRT x 2 50 170 5 ore al dì 0,47
Ferro da stiro 700 80 3 volte a sett. 0,22
Frigorifero A+ 303 continuo 0,83
29
Asciugacapelli 400 40 2 volte a sett. 0,11
Aspirapolvere 700 90 3 volte a sett. 0,25
Radio 20 13 1 volte al dì 0,04
totale kwh 2736 7,50
Fig.18: Profilo 1 famiglia-campione 2 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 1 di una famiglia-campione di 2 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.19: Consumo medio profilo 1 per 2 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il
profilo 2 di una famiglia-campione di 2 persone, composta da due studenti in affitto, sono
riportati nella tabella seguente:
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 2
Impiego kwh al
giorno
Microonde 1000 300 3 volte a sett. 0,82
PC 65 150 8 ore al dì 0,41
Lavastoviglie 1400 280 3 volte a sett. 0,77
Lavatrice A 1500 170 2 volte a sett. 0,47
Boiler 2000 1000 4 volte a sett. 2,74
Luce 60 310 5 ore al dì 0,85
TV CRT x 2 50 180 5 ore al dì 0,49
Ferro da stiro 700 50 2 volte a sett. 0,14
30
Frigorifero A+ 303 continuo 0,83
Asciugacapelli 400 50 2 volte a sett. 0,14
Aspirapolvere 700 50 2 volte a sett. 0,14
Radio 20 13 1 volte al dì 0,04
totale kwh 2856 7,82
Fig.20: Profilo 2 famiglia-campione 2 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 2 di una famiglia-campione di 2 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.21: Consumo medio profilo 2 per 2 persone
Consumi dei due profili di una famiglia-campione di 3 persone
Lo stesso procedimento è stato eseguito per la famiglia-campione di 3 persone. I consumi
medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una
famiglia-campione di 3 persone, composta da un lavoratore, una casalinga ed uno studente, sono
riportati nella tabella seguente:
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 1
Impiego kwh al
giorno
Microonde 1000 500 5 volte a sett. 1,37
PC 65 120 6 ore al dì 0,33
Lavastoviglie 1400 430 4 volte a sett. 1,18
31
Lavatrice A 1500 240 3 volte a sett. 0,66
Boiler 2000 1000 5 volte a sett. 2,74
Luce 60 350 7 ore al dì 0,96
TV CRT 50 220 6 ore al dì 0,60
Ferro da stiro 700 120 4 volte a sett. 0,33
Frigorifero A+ 303 continuo 0,83
Asciugacapelli 400 60 3 volte a sett. 0,16
Aspirapolvere 700 110 4 volte a sett. 0,30
Radio 20 15 2 volte al dì 0,04
totale kwh 3468 9,50
Fig.22: Profilo 1 famiglia-campione 3 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 1 di una famiglia-campione di 3 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.23: Consumo medio profilo 1 per 3 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il
profilo 2 di una famiglia-campione di 3 persone, composta da due studenti ed un lavoratore, è
riportato nella tabella seguente:
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 2
Impiego kwh al
giorno
Microonde 1000 400 4 volte a sett. 1,10
PC 65 130 6 ore e ½ al dì 0,36
32
Lavastoviglie 1400 440 4 volte a sett. 1,21
Lavatrice A 1500 280 3 volte a sett. 0,77
Boiler 2000 1200 5 volte a sett. 3,29
Luce 60 270 5 ore al dì 0,74
TV CRT 50 180 5 ore al dì 0,49
Ferro da stiro 700 100 3 volte a sett. 0,27
Frigorifero A+ 303 continuo 0,83
Asciugacapelli 400 40 2 volte a sett. 0,11
Aspirapolvere 700 70 3 volte a sett. 0,19
Radio 20 12 1 volte al dì 0,03
totale kwh 3425 9,38
Fig.24: Profilo 2 famiglia-campione 3 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 2 di una famiglia-campione di 3 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.25: Consumo medio profilo 2 per 3 persone
Consumi dei due profili di una famiglia-campione di 4 persone
Anche la famiglia-campione di 4 persone è stata suddivisa in due differenti profili. I consumi
medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una
famiglia-campione di 4 persone, composta da un lavoratore, una casalinga e due studenti, sono
riportati nella tabella seguente:
33
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 1
Impiego kwh al
giorno
Microonde 1000 600 6 volte a sett. 1,64
PC 65 140 7 ore al dì 0,38
Lavastoviglie 1400 500 5 volte a sett. 1,37
Lavatrice A 1500 290 4 volte a sett. 0,79
Boiler 2000 1500 6 volte a sett. 4,11
Luce 60 350 7 ore al dì 0,96
TV CRT 50 300 7 ore al dì 0,82
Ferro da stiro 700 160 5 volte a sett. 0,44
Frigorifero A+ 303 continuo 0,83
Asciugacapelli 400 80 4 volte a sett. 0,22
Aspirapolvere 700 130 5 volte a sett. 0,36
Radio 20 15 2 volte al dì 0,04
totale kwh 4368 11,97
Fig.26: Profilo 1 famiglia-campione 4 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 1 di una famiglia-campione di 4 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.27: Consumo medio profilo 1 per 4 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il
profilo 2 di una famiglia-campione di 4 persone, composta da due studenti e due lavoratori, è
riportato nella tabella seguente:
34
Elettrodomestico potenza
ON (watt)
consumo
annuo
(kwh)
profilo 2
Impiego kwh al
giorno
Microonde 1000 500 5 volte a sett. 1,37
PC 65 120 6 ore al dì 0,33
Lavastoviglie 1400 580 6 volte a sett. 1,59
Lavatrice A 1500 320 4 volte a sett. 0,88
Boiler 2000 1700 6 volte a sett. 4,66
Luce 60 300 6 ore al dì 0,82
TV CRT 50 250 6 ore al dì 0,68
Ferro da stiro 700 140 5 volte a sett. 0,38
Frigorifero A+ 303 continuo 0,83
Asciugacapelli 400 80 4 volte a sett. 0,22
Aspirapolvere 700 110 4 volte a sett. 0,30
Radio 20 10 1 volte al dì 0,03
totale kwh 4413 12,09
Fig.28: Profilo 2 famiglia-campione 4 persone
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli
elettrodomestici per il profilo 2 di una famiglia-campione di 4 persone presenta il seguente
grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero
anno (destra):
Fig.29: Consumo medio profilo 2 per 4 persone
35
4 ANALISI STATISTICA DEI CONSUMI
DOMESTICI
Il consumo annuale medio è da intendersi come una stima effettuata moltiplicando per 365
giorni il consumo giornaliero medio calcolato precedentemente. Una volta determinati i consumi
annuali delle tre nuclei familiari, sono state eseguite delle statistiche su singoli giorni per
determinare le medie e le varianze utili ai fini della rivelazione di anomalie.
E’ stato possibile rivelare le anomalie, alterando il consumo relativo ad alcuni giorni
dell’anno, o anche solo alla mattina o alla sera, e controllando che rispettassero i profili di
consumo determinati attraverso l’analisi. I casi da noi modificati sono stati correttamente rivelati.
4.1 Medie e varianze della curva di consumo Una volta ottenute le informazioni relative al consumo di energia elettrica in ambito
domestico, il primo passo per la rivelazione di anomalie è stato quello di cercare di misurarli e
controllarli eseguendo un’analisi dettagliata al fine di individuare chi, come, quanto e quando
consuma, e soprattutto di determinare delle soglie di medie e varianze oltre le quali si è deciso di
classificare un comportamento anomalo. Nello studio delle distribuzioni statistiche occupa un
posto di primo piano la determinazione della media e dello scarto quadratico medio non soltanto
perché questi valori consentono di approfondire il fenomeno in oggetto, ma anche perché sono
parametri utili nel confronto di distribuzioni diverse tra loro.
Si è quindi trovare la media aritmetica Xn dei consumi giornalieri, sommando giorno per
giorno il valore in ogni mezz’ora e dividendo il risultato per 365. Allo stesso modo, si è calcolata
la media dei consumi durante la mattina, il pomeriggio, la sera e la notte.
Xn = ∑i=1(xi / n)
I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico,
tuttavia hanno il limite di non darci alcuna informazione sulla distribuzione dei dati che invece è
possibile valutare mediante gli indici di variabilità come:
36
• il campo di variazione (o range) che si ottiene come differenza tra il valore massimo e
quello minimo riscontrati nel fenomeno che si sta osservando:
Campo variazione = xmax – xmin
• lo scarto semplice medio che rappresenta la media aritmetica degli scostamenti in
valore assoluto dei dati dal valore medio:
S.s.m. = (∑i=1| xi – Xn | ) / n
• la varianza che corrisponde alla somma dei quadrati degli scarti degli n valori aventi
la media aritmetica Xn divisa per il numero dei valori:
σ² = [∑i=1( xi – Xn)² ] / n
• lo scarto quadratico medio (o deviazione standard) che è la radice quadrata della
varianza e che permette di conoscere l’intervallo, centrato sulla media, attorno al quale
cade un determinato numero di osservazioni:
S.q.m = ²√{[∑i=1( xi – Xn)² ] / n}
Sia la varianza sia lo scarto quadratico medio tengono conto di tutti i dati della distribuzione e
più sono piccoli e più i dati sono concentrati intorno alla media; viceversa, più sono grandi più i
dati sono dispersi. Quando la deviazione standard non supera il 10-15% della media, le misure
possono considerarsi abbastanza omogenee; quanto più tale soglia viene superata, tanto
maggiore sarà lo squilibrio tra le osservazioni.
4.2 Statistiche di consumo
4.2.1 Giorni singoli
Attraverso la simulazione dei consumi di energia elettrica si ottiene una matrice composta da
365 righe, che rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una
giornata; questi valori sono riportati nei grafici del consumo tipico dell’intero anno per le
famiglie-campione di 2, 3 e 4 persone riportati in Fig.13: , Fig.15: , Fig.17: .
Una migliore rivelazione di anomalie si ottiene solo se si hanno dei dati coerenti tra loro e il
più dettagliati possibile. E’ stato per questo che, oltre all’analisi di un giorno intero composto da
24 ore, si è deciso di dividere le giornate in quattro parti, mattina (dalle 6:30 alle 12:00),
pomeriggio (dalle 12:30 alle 18:00), sera (dalle 18:30 alle 23:30) e notte (dalle 0:00 alle 6:00)
per poter rivelare situazioni anomale anche in determinati orari, calcolando per ognuna di queste
37
le medie, le varianze, i consumi massimi e minimi e gli indici di variabilità ottenendo i seguenti
risultati:
giorno mattina pomeriggio sera notte
media 7,0926 1,8876 1,2940 3,2176 0,6933
range 14,29 8,03 6,73 9,24 4,35
varianza 7,9253 3,6934 2,1523 4,9404 1,1410
s.q.m 2,8151 1,9218 1,4670 2,2227 1,0681
Fig.30: Statistiche giorni singoli per 2 persone
La tabella relativa al nucleo familiare di 2 persone, mostra un consumo medio maggiore
durante le ore della sera, pari quasi al doppio del consumo riscontrato in altre momenti della
giornata. Di notte il consumo è molto basso.
giorno mattina pomeriggio sera notte
media 8,9908 2,8144 2,1032 3,2434 0,8298
range 13,43 9,55 7,65 10,38 4,36
varianza 7,3791 4,7667 2,1032 5,5160 1,3840
s.q.m 2,7164 2,1832 1,4502 2,3486 1,1764
Fig.31: Statistiche giorni singoli per 3 persone
Anche la tabella relativa alla famiglia di 3 persone, mostra un consumo medio maggiore
durante le ore della sera, però molto più vicino a quelli riscontrati durante la mattina e il
pomeriggio.
giorno mattina pomeriggio sera notte
media 11,8880 4,5693 3,0781 2,9514 1,2892
range 15,43 10,30 8,08 11,28 4,46
varianza 7,1947 5,6466 3,1877 4,1017 2,3206
s.q.m 2,6822 2,3762 1,7854 2,0252 1,5233
Fig.32: Statistiche giorni singoli per 4 persone
La tabella per la famiglia di 4 persone, mostra invece un consumo medio maggiore durante le
ore della mattina, e uno piuttosto simile sia nel pomeriggio sia durante sera. I consumi durante la
notte sono maggiori degli altri due casi.
38
4.2.2 Giorni multipli
In alcuni casi può capitare che i consumi siano nella media, ma con valori alti che
raggiungono quasi sempre il limite imposto dalla varianza. Per evitare queste situazioni, sono
state eseguite delle analisi su giorni doppi, cioè partendo sempre dalla matrice di 365 righe e 48
colonne, si sono sommati i consumi relativi a due giornate contigue, ad esclusione del primo, che
poi sono stati divisi per due. Quindi per esempio, i consumi del giorno 3 saranno la somma dei
consumi del giorno 2 e del giorno 3, diviso due. Con i valori ottenuti si sono eseguiti gli stessi
calcoli descritti sopra. In questo modo si ottengono valori medi molto simili, ma gli indici di
variabilità risultano essere più piccoli e precisi.
4.2.2.1 Giorni doppi
giorno mattina pomeriggio sera notte
media 7,0927 1,8885 1,2959 3,2149 0,6933
range 9,01 5,53 4,88 7,85 4,08
varianza 2,7556 1,4147 0,9829 2,8039 0,5446
s.q.m 1,6600 1,1894 0,9914 1,6744 0,7379
Fig.33: Statistiche giorni doppi per 2 persone
giorno mattina pomeriggio sera notte
media 8,9945 2,8190 2,1029 3,2430 0,8297
range 9,85 7,19 5,49 7,57 3,24
varianza 3,052 2,0032 1,1476 2,6154 0,6696
s.q.m 1,7469 1,4153 1,0712 1,6172 0,8182
Fig.34: Statistiche giorni doppi per 3 persone
giorno mattina pomeriggio sera notte
media 11,8871 4,5682 3,0760 2,9536 1,2893
range 9,30 8,43 6,38 6,87 4,20
varianza 2,5477 2,4525 1,3377 2,1806 1,1028
s.q.m 1,5961 1,5660 1,1565 1,4766 1,0501
Fig.35: Statistiche giorni doppi per 4 persone
Dai risultati ottenuti si può notare come il consumo medio nelle varie parti della giornata sia
molto simile al caso precedente, giorno singolo, mentre ciò che cambia e che diminuisce
notevolmente sono il campo di variazione e la varianza. In questo modo, come detto
39
precedentemente, è possibile determinare molte più situazioni anomale perché diminuisce
l’intervallo entro cui mantenersi per rientrare nei consumi standard.
4.2.2.2 Giorni tripli
Lo stesso procedimento viene eseguito anche sommando i consumi relativi a tre giornate
consecutive, ad esclusione del primo e del secondo, per poi dividere il risultato per tre ottenendo
così misure ancora più piccole. Quindi per esempio, i consumi del giorno 4 saranno la somma
dei consumi del giorno 2, del giorno 3 e del giorno 4, diviso tre.
giorno mattina pomeriggio sera notte
media 7,0845 1,8881 1,2999 3,2066 0,6898
range 7,49 5,02 4,03 7,51 2,75
varianza 1,6888 0,9560 0,6113 2,1059 0,3629
s.q.m 1,2995 0,9777 0,7818 1,4511 0,6024
Fig.36: Statistiche giorni tripli per 2 persone
giorno mattina pomeriggio sera notte
media 8,9974 2,8213 2,1008 3,2457 0,8296
range 7,67 6,25 5,09 6,81 2,74
varianza 1,8118 1,2547 0,7896 1,7117 0,4305
s.q.m 1,3460 1,1201 0,8885 1,3083 0,6561
Fig.37: Statistiche giorni tripli per 3 persone
giorno mattina pomeriggio sera notte
media 11,8802 4,5571 3,0839 2,9500 1,2892
range 8,30 7,52 5,88 6,44 4,08
varianza 1,7611 1,6017 0,8473 1,4846 0,7514
s.q.m 1,3270 1,2655 0,9204 1,2184 0,8668
Fig.38: Statistiche giorni tripli per 4 persone
Anche da questi risultati si può notare che il consumo medio nelle varie parti della giornata è
molto simile ai due casi precedenti, giorno singolo e giorno doppio, mentre ciò che cambia e che
diminuisce ancora di più sono il campo di variazione e la varianza potendo ottenere risultati
molto più precisi.
40
4.3 Rivelazione di anomalie nei consumi basata sui parametri statistici
Dopo la simulazione dei consumi di energia elettrica di un ipotetico anno solare composta da
365 giorni e l’analisi dei dati ottenuti, per poter controllare in un modo piuttosto generale la
presenza di situazioni anomale, sono stati generati altri consumi ottenendo dati relativi per
esempio all’anno successivo. I consumi presenti in alcune giornate scelte a caso sono stati
modificati in modo da superare i limiti imposti dalle medie e varianze calcolate durante le
statistiche. Quindi qualsiasi tipo di comportamento che non rientra nei parametri stabiliti, viene
notificato come warning di situazione anomala o fuori media.
Le rivelazioni di anomalie sono state testate in tutti e tre i casi spiegati precedentemente, ed è
stato soprattutto notato che le situazioni di consumi sopra la media che rientrano però
nell’intervallo definito dalla varianza nel caso dei giorni singoli, e che quindi non dovrebbero
essere notificate, vengono segnalate come warning se confrontate con le soglie imposte dai
giorni doppi o tripli. Questo è stato lo scopo principale delle statistiche fatte su giorni multipli
perché si è pensato che un atteggiamento sopra la media, ma sempre sotto l’intervallo di
tolleranza, per un periodo piuttosto lungo potrebbe essere sintomo di comportamento anomalo e
quindi dovrebbe essere notificato e controllato.
41
5 IDENTIFICAZIONE PROFILI UTENTE
Una volta determinati i consumi propri di ciascun nucleo familiare, tutto ciò che risulta essere
fuori da certi standard è definito irregolare e rivelato come anomalia. Le anomalie infatti sono
definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica ed è
per questo che per identificarle è necessario conoscere il normale comportamento di una o più
famiglia-campione. Un’accurata identificazione e diagnosi delle anomalie dipende
principalmente dalla robustezza delle informazioni di cui si dispone e in secondo luogo dai
metodi utilizzati per isolare i segnali anomali all’interno dei consumi calcolati.
Una buona tecnica per rivelare le anomalie inizia con la costruzione di un profilo per il
“normale” uso di energia elettrica e poi evidenzia le deviazioni da tale profilo come possibili
situazioni anomale. Le prove svolte per l’identificazione di profili di utente sono due. La prima
consiste nel determinare i profili d’utenza propri per ciascuna delle tre tipologie di famiglie
descritte sopra, differenti per numero di componenti e per abitudini. La seconda prova consiste
nello stabilire due profili utente per ciascun nucleo familiare, sviluppando diversi stili di vita ed
usi degli elettrodomestici presenti in casa.
5.1 Strategie per l’identificazione di profili utente Con la simulazione del consumo energetico si possono raccogliere tutte le misurazioni
effettuate su una scala ad intervalli in una matrice di dati, composta da 365 righe, che
rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una giornata, il cui
termine generico Xij
fornisce la misurazione j-esima per l’unità i. Il lavoro di tesi svolto si
propone in un primo momento di ottenere delle sintesi per rappresentare le informazioni più
importanti contenute nella matrice dei dati. Le analisi riguardano soprattutto le relazioni esistenti
tra le unità di riga verificando la similarità, per variabili qualitative, e la distanza, per variabili
quantitative, e le relazioni esistenti tra le unità di colonna determinando la correlazione. Queste
informazioni permettono di confrontare i vari profili così da determinare quelli che non
appartengono all’insieme che vengono etichettati come anomalie.
42
Le tecniche usate per l’implementazione di un sistema che definisca dei profili d’utenza nel
consumo di energia elettrica in ambito domestico sono descritte di seguito.
5.1.1.1 Piecewice Constant Approximation
Una volta ottenuto il consumo totale, si cerca di identificare delle tipologie di consumi
elettrici proprie per ciascun nucleo familiare. Per fare questo per ogni famiglia si analizzano le
curve di consumo giornaliero e si approssimano con un profilo costante a tratti. L’n-esimo tratto
possiede una ampiezza An
ed una durata Tn
con n=1,2,...,N, dove N è il numero di tratti
individuati per quella giornata. Questo procedimento è chiamato Approssimazione Costante a
Tratti (Piecewise Constant Approximation); il termine “piecewise” è spesso usato in matematica,
ed applicato alle funzioni che possono essere “spezzate” in un numero finito di tratti così che
ognuno di questi soddisfi delle particolari proprietà. Questo tipo di approssimazione consiste nel
trovare una sequenza di stati, intesi come differenti “regioni” caratterizzate da un valore costante
che ne definisce una traiettoria media, che più probabilmente corrisponde alla curva data.
Come si può vedere dalla figura, la traiettoria media è diversa da regione in regione, ed ogni
volta che la curva presa in considerazione cambia la sua direzione, assume valori differenti. La
curva che ne risulterà avrà una “qualità” ridotta rispetto a quella originale e questo dipende dal
fatto che l’approssimazione farà si che un andamento simile, sia rappresentato sull’istogramma
con valori di ordinate quasi uguali, cioè quelli risultanti dalla media dei punti.
L’algoritmo sviluppato in questo ambito prende in input la curva di consumo di un utente
specifico trasformandola in un insieme finito di regioni di forma rettangolare, di base Ti e altezza
Ai. Questi due parametri indicano rispettivamente la durata in termini di minuti di un evento e la
rispettiva ampiezza in termini di kWh. La curva presa in considerazione risulta continua nel
tempo e può essere approssimata su un intervallo T dell’asse del tempo da una costante uguale al
43
valore medio sopra tale intervallo. L’andamento originale del consumo di energia giornaliero
risulta essere molto simile a quello ottenuto attraverso l’approssimazione se la grandezza degli
intervalli considerati è molto piccola. L’algoritmo prende in considerazione 48 mezze ore
relative ai 365 giorni presenti nella matrice dei consumi, uno per volta. Partendo dal primo
giorno, setta dei valori di consumo massimo e minimo con i dati della prima mezz’ora, calcola
l’intervallo ∆1 come differenza tra il massimo e il minimo, ed imposta un valore medio y
1 che
corrisponde all’ordinata del punto preso in considerazione, e cioè all’ampiezza A1 da cui partirà
la nuova curva approssimata. Passando alla mezz’ora successiva, calcola un nuovo valore
minimo se il nuovo consumo considerato è inferiore a quello precedentemente calcolato,
altrimenti mantiene quello vecchio; la stessa cosa viene fatta per il valore massimo. Calcola
quindi un nuovo intervallo ∆2; se questo intervallo è inferiore ad un ∆ massimo impostato
all’inizio, calcola la traiettoria media tra y1
e y2
e passa alla mezz’ora successiva. Lo stesso
procedimento è svolto per tutte le altre mezz’ore, ottenendo in questo modo una traiettoria
approssimata del consumo di energia elettrica. Nel caso in cui un intervallo ∆i calcolato per una
mezz’ora i risultasse maggiore di quello massimo, l’algoritmo delimita un rettangolo (o regione)
di ampiezza A pari alla yi-1
(del punto precedente) e di durata T pari alla x i-1
(del punto
precedente). In questo modo, ogni volta che avremo un consumo molto differente da quello
precedente avremo la creazione di un nuovo rettangolo con nuova ampiezza e durata.
Fig.39: Esempio di Approssimazione costante a tratti
Alla fine del processo, risulterà per ogni utente un profilo caratterizzato da diverse regioni
adiacenti ognuna con la sua durata e la sua ampiezza. Sulla base di queste informazioni, si
calcola l'istogramma bidimensionale relativo ad una curva di consumo giornaliero regolarizzato
come costante a tratti che viene poi usato per trovare affinità o differenze tra i vari profili definiti
per ogni nucleo familiare.
44
5.1.1.2 Distanza Euclidea
Data una coppia di unità statistiche, i e j, si desidera confrontare i rispettivi profili,
pervenendo a misure di distanza, dij, e similarità, c
ij. Dette misure dipendono dalla scala di
misurazione degli attributi [7.]
La distanza euclidea è la tipica distanza fra due punti che si potrebbe misurare con un
righello, che può essere ottenuta dall'applicazione ripetuta del teorema di Pitagora [6.]. Una
misura di distanza ),( yxd tra coppie di elementi dello spazio deve godere delle seguenti
proprietà:
),(),(),( 3)
),(),( 2)
0),( )1
yzdzxdyxd
xydyxd
yxd
+≤=≥
La 1) è detta proprietà della non negatività, la 2) della simmetria e la 3) della disuguaglianza
triangolare; è ovvio anche che d(x,x) = 0. Se una misura di distanza soddisfa tutte e quattro le
proprietà, si dice che lo spazio di riferimento è metrico. Il valore della distanza ottenuto durante
un confronto è pari a zero nel caso in cui ci sia uguaglianza totale tra due profili, mentre assume
un valore massimo nel caso di assenza di correlazione. E’ molto importante definire quale sia
spazio di cui si considerano i due punti e solitamente quando si parla di distanza euclidea ci si
riferisce al piano cartesiano nel quale si determina una distanza intesa come funzione che associa
a due punti P1 e P
2 un numero reale non negativo.
Indicando con ∆x la variazione orizzontale da P1 = (x
1, x
2) a P
2 = (y
1, y
2) e con ∆y quella
verticale per due punti in due dimensioni, la distanza è calcolata come:
d(P1, P
2) = ( (∆x)² + (∆y)² ) = ( (x
2 – x
1)² + (y
2 – y
1)² )
45
Nel caso di due punti monodimensionali, P1= (x
1) a P
1= (x
2), si calcola il valore assoluto
poiché di norma la distanza è un numero intero positivo:
d(P1, P
2) = | x
1– x
2 | = ²√ (x
1– x
2)²
L’algoritmo sviluppato per il confronto basato sulla distanza Euclidea porta alla creazione di
una matrice simmetrica NxN, dove N è il numero degli istogrammi da comparare, in cui i valori
sulla diagonale sono nulli, considerando in tal caso un confronto tra le stesse curve di consumo,
ed in cui il valore dij rappresenta la distanza tra la curva di indice riga i con la curva di indice
colonna j. Più è basso questo valore, e più sarà alta la possibilità che le due curve siano simili e
viceversa.
5.1.1.3 Auto- e Cross-Correlazioni
Anche la correlazione è usata per mettere a confronto delle informazioni, solitamente pattern
di segnali, e determinare una somiglianza non più nei valori come si è fatto con le medie, ma
nella forma dei dati. Per sapere se esiste un “legame” tra due caratteri quantitativi, e cioè se uno
di essi esercita un'influenza sull'altro, si utilizzano gli indici di correlazione, i quali danno anche
una misura di questo “legame” e valutano la correlazione totale presente nel set di dati in esame.
Se l’indice è per uguale a 1 si ha il massimo di correlazione diretta, cioè ai valori crescenti di una
variabile corrispondono valori pure crescenti dell'altra variabile; se l’indice è uguale a -1 si ha il
massimo di correlazione inversa, cioè ai valori crescenti di una variabile corrispondono valori
decrescenti dell'altra variabile; se l’indice è uguale a 0 non si ha correlazione. Dati x =
(x1,x
2,…,x
n) e y =(y
1,y
2,…,y
n) la loro correlazione non-normalizzata è data da:
C = ∑i=1∑j=1(xi yj)²
Lo sfasamento ∆ nello spazio fra due curve di consumo di energia elettrica permette di
traslare una di esse di un certo valore t in modo tale da renderle “sovrapposte” e quindi
immediatamente confrontabili. Per stimare ∆ è utile la funzione di cross-correlazione che
fornisce una misura della similitudine tra le due curve.
L’algoritmo sviluppato si occupa di determinare un valore t che rappresenta lo sfasamento da
applicare ad una delle due curve dell’istogramma per ottenere la massima sincronizzazione
possibile fra i due tratti da confrontare. Questo sfasamento che massimizza la funzione di cross-
46
correlazione è un indice sufficiente a determinare la sincronia delle due curve. Se infatti le due
curve sono perfettamente sincronizzate, lo sfasamento ottenuto sarebbe zero, al contrario
assumerebbe un valore prossimo al semiperiodo. [8.] Nel caso di N curve da confrontare, non
esiste una sola funzione di cross-correlazione ma un numero pari alle coppie possibili dei profili
considerati, ovvero N² (considerando anche l’auto-correlazione). Il calcolo dello sfasamento che
massimizza ognuna delle possibili funzioni di cross-correlazione porta alla creazione di una
matrice simmetrica NxN in cui il valore tij rappresenta lo sfasamento che rende massima la
funzione di cross-correlazione definita tra la curva di indice riga i con la curva di indice colonna
j. Ogni riga della matrice contiene gli sfasamenti che, applicati alle curve corrispondenti
(contraddistinti dall’indice colonna), permettono di ottenere la massima sincronia possibile. I
vettori riga si differenziano fra loro per la scelta della curva di consumo usata come riferimento
nel calcolo delle funzioni di cross-correlazione. Quindi dall’analisi dei vettori riga è possibile
capire quale profilo utente sia più “vicino” agli altri, dove per “vicino” s’intende che gli
sfasamenti trovati sono i più bassi. [8.]
5.1.1.4 Auto- e Cross-Correlazioni Normalizzate
Il valore tj della matrice simmetrica NxN calcolata nello step precedente, rappresenta lo
sfasamento di posizione j-esima del vettore riga scelto, mentre I è il numero dei punti che
costituiscono la curva di consumo presa in considerazione; quindi il rapporto tj/I è la versione
normalizzata dello sfasamento. Dati x = (x1,x
2,…,x
n) e y =(y
1,y
2,…,y
n) la loro correlazione
normalizzata è data da:
C = [∑i=1∑j=1(xi yj)²] / [∑i=1∑j=1 (xij )²] [∑i=1∑j=1 (yij )²]
La correlazione normalizzata si è dimostrata la forma di confronto più significativa
applicabile al lavoro di tesi svolto. L’algoritmo sviluppato crea, come già detto una matrice
simmetrica NxN con i valori sulla diagonale pari a 1, considerando in tal caso un confronto tra
due curve dello stesso istogramma. Le misure che appariranno nelle altre posizioni avranno un
valore inferiore ad 1 e più saranno “vicini” all’uno e maggiore sarà la possibilità che la curva di
consumo con indice riga i sia uguale alla curva di consumo con indice colonna j.
Una volta ottenuti tutti i valori per cui si ha o non si ha una correlazione, si determina una
soglia per stabilire eventuali comportamenti anomali. Se infatti per esempio la correlazione
normalizzata di una curva di consumo X per una famiglia-campione di 2 persone con la curva
47
calcolata per il profilo di una famiglia-campione di 2 persone è superiore a tale soglia, allora si
potrà identificare tale curva X come un caso di anomalia di consumo di energia elettrica in un
nucleo familiare di 2 persone.
5.2 Applicazione della metodologia sviluppata
5.2.1 Prima prova: famiglia-campione senza profili
Prendendo in considerazione i consumi calcolati nella fase precedente, risultanti dalla
simulazione dell’uso di elettrodomestici nelle famiglie di 2, 3 e 4 persone, è stata eseguita una
prima prova con l’applicazione degli algoritmi specificati in precedenza, finalizzati alla
rivelazione di anomalie nell’uso di energia elettrica in ambito domestico. I consumi considerati
per ogni nucleo familiare sono quelli ottenuti durante la simulazione riportata nel paragrafo
3.3.3.1. Di seguito sono riportati i grafici ottenuti applicando l’algoritmo di Piecewise Constant
Approximation alla curva dei consumi di ciascun nucleo familiare ricavata durante la fase di
simulazione e quello per la creazione dell’istogramma bidimensionale relativo ad una curva di
consumo giornaliero regolarizzato come costante a tratti.
Il grafico di Fig.40: rappresenta l’approssimazione a tratti del consumo giornaliero tipico per
alcuni giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante
ai fini dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno
regolarizzato come costante a tratti (destra) per una famiglia-campione di 2 persone:
Fig.40: Approssimazione a tratti e istogramma 2 persone
Gli algoritmi spiegati sopra sono stati applicati anche ai dati relativi al consumo di energia
elettrica di una famiglia-campione di 3 persone. I risultati ottenuti sono riportati nel grafico di
48
Fig.41: che rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni
giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini
dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato
come costante a tratti (destra) per tale famiglia-campione.
Fig.41: Approssimazione a tratti e istogramma 3 persone
Lo stesso procedimento è stato eseguito per i dati relativi al consumo di energia elettrica di
una famiglia-campione di 4 persone. I risultati ottenuti sono riportati nel grafico di Fig.42: che
rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni giornate
(sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini
dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato
come costante a tratti (destra) per tale famiglia-campione.
Fig.42: Approssimazione a tratti e istogramma 4 persone
49
I consumi annuali delle tre famiglie sono stati poi confrontati tra loro per determinare
somiglianze e differenze allo scopo di rivelare anomalie nell’impiego della corrente elettrica.
Come già detto, l’algoritmo sviluppato per la determinazione della correlazione normalizzata
crea una matrice simmetrica NxN con i valori sulla diagonale pari a 1 e quelli nelle altre
posizioni minori di 1. Più questi valori saranno “vicini” all’uno e maggiore sarà la possibilità che
il profilo di consumo con indice riga i sia uguale a quello con indice colonna j e viceversa. La
matrice di visibilità ottenuta è la seguente:
2 persone 3 persone 4 persone
2 persone 1 0,9671 0,8384
3 persone 0,9671 1 0,8624
4 persone 0,8384 0,8624 1
Fig.43: Correlazione normalizzata prima prova
Si può notare come le tre tipologie di famiglie-campione abbiano dei consumi di energia
elettrica abbastanza differenti tra loro sia in termini numerici, considerando i kWh consumati in
media durante l’anno di 365 giorni, sia in termini di forma della curva riportata nell’istogramma.
5.2.2 Seconda prova: famiglia-campione con profili
Per la seconda prova sono state apportate delle modifiche alle probabilità di accensione degli
elettrodomestici determinando per ciascun nucleo familiare due diversi profili, stimando
differenti stili di vita ed abitudini da quelli determinati per le famiglie-campione della prima
prova mantenendo però simili i valori medi propri di ciascuna tipologia di famiglia.
Famiglia Profilo 1 Profilo 2
2 persone 1 lavoratore, 1 casalinga 2 studenti in affitto
3 persone 1 lavoratore, 1 casalinga, 1 studente 2 studenti, 1 lavoratore
4 persone 1 lavoratore, 1 casalinga, 2 studenti 2 studenti, 2 lavoratori
Fig.44: Profili diversi per ogni famiglia-campione
I consumi considerati per ogni nucleo familiare sono quelli ottenuti durante la simulazione
riportata nel paragrafo 00. Sono stati eseguiti gli algoritmi di Piecewice Constant Approximation
per ciascun profilo appartenente alle famiglie-campione e sono stati calcolati i sei istogrammi
bidimensionali relativi alle curve di consumo giornaliero regolarizzate come costante a tratti.
50
Un’altra grande differenza di questa seconda prova è che, per eseguire un confronto tra i
diversi profili, oltre a calcolare le auto- e le cross-correlazioni, le distanze euclidee e le auto- e le
cross-correlazioni normalizzate degli istogrammi bidimensionali, si utilizza anche la media
dell’istogramma, cioè la media dei consumi della casa, calcolata in base all'istogramma tramite
una formula in cui i valori dell'istogramma sono pesati con le ampiezze e le durate cui si
riferiscono. Questo perché un semplice confronto eseguito solo sulla forma delle curve di
consumo, per esempio tramite la correlazione normalizzata, non è sufficiente ad ottenere dei
parametri di somiglianza tra i profili. Infatti, soprattutto nei casi in cui i due profili utente
appartengono alla stessa famiglia-campione, per esempio il profilo 1 e il profilo 2 della famiglia-
campione di 4 persone, i valori su cui eseguire la correlazione o calcolare le distanze risultano
differire di poco, avendo creato i due profili con un consumo totale annuo quasi uguale.
E’ per questo motivo che per identificare correttamente i consumi appartenenti a determinati
nuclei familiari e rivelare eventuali situazioni anomale, è stato necessario confrontare gli
istogrammi di profilo utente sia attraverso la correlazione normalizzata, per avere una
somiglianza nella forma della curva di consumo, sia attraverso il calcolo della media
dell’istogramma, per ottenere una somiglianza anche sui valori. L’identificazione avverrà solo
se tutte e due queste metodologie di confronto saranno verificate.
Come nella prima prova, a fronte di qualsiasi profilo utente X, con un certo consumo di
energia elettrica, si ha la possibilità di identificare la tipologia di famiglia a cui appartiene, ed in
più si è in grado di stabilire a quale dei due profili utente, caratterizzanti il nucleo familiare
individuato tramite il test, fa riferimento.
Le medie dell’istogramma dei sei profili utente, cioè le medie dei consumi della casa,
calcolate in base all'istogramma tramite i valori pesati con le ampiezze e le durate cui si
riferiscono sono le seguenti:
2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2
7,7027 8,8103 8,8836 8,5445 10,4390 11,4027
Fig.45: Medie degli istogrammi sul consumo giornaliero
La matrice simmetrica NxN ottenuta calcolando la correlazione normalizzata tra tutti e sei i
profili utente è la seguente:
2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2
2p profilo1 1 0,6480 0,9143 0,4715 0,5946 0,7024
51
2p profilo2 0,6480 1 0,7827 0,7457 0,7357 0,7937
3p profilo1 0,9143 0,7827 1 0,6780 0,8225 0,8732
3p profilo2 0,4715 0,7457 0,6780 1 0,7579 0,8253
4p profilo1 0,5946 0,7357 0,8225 0,7579 1 0,8759
4p profilo2 0,7024 0,7937 0,8732 0,8253 0,8759 1
Fig.46: Correlazioni normalizzate seconda prova
Si può notare come le medie calcolate e le curve relative ai consumi siano abbastanza
differenti tra le tre tipologie di famiglie-campione, nonostante i due profili utente per ciascuna
famiglia-campione siano stati creati con consumi totali annui di energia elettrica abbastanza
simili.
5.3 La soluzione proposta
5.3.1 Matlab
Lo sviluppo del software per la rivelazione di anomalie nel consumo energetico in ambito
domestico è stato effettuato usando Matlab, che offre un ambiente di sviluppo idoneo alla
simulazione di scenari utili al raggiungimento dell’obiettivo di questo lavoro di tesi. MATLAB
(abbreviazione di MATrix LABoratory) è un linguaggio di programmazione scritto in C dalla
The MathWorks, ossia un insieme di strumenti (come ad esempio l’editor o il debugger)
necessari per lo sviluppo di sistemi software in un linguaggio di programmazione ad alto livello.
MATLAB è uno dei programmi scientifici di maggior diffusione, grazie alle sue numerose
applicazioni in campi quali l'elettronica, la controllistica, l'analisi dei segnali, l'elaborazione di
immagini, la chimica, la statistica e numerosi altri. Viene utilizzato in molti corsi universitari e di
ingegneria, e sono ormai numerose le pubblicazioni scientifiche che utilizzano l'ambiente di
Matlab quale sostegno matematico della teoria.
E’ molto usato in ambito ingegneristico mondiale come strumento per la simulazione di
sistemi lineari e non lineari e, più in generale, per l’analisi numerica., lo sviluppo delle
applicazioni e la conversione automatica di programmi MATLAB nei codici C e C++. Consente
l’uso di matrici, visualizzazione di funzioni e dati, implementa algoritmi, consente la creazione
di interfacce utente (le cosiddette GUI=Graphical User Interface), e funziona su diversi sistemi
operativi, tra cui Windows, Mac OS, Linux e Unix. I Toolboxes forniti direttamente dal
produttore MathWorks permettono l’analisi dei dati, l’esplorazione e la visualizzazione,
l’elaborazione numerica e simbolica, la grafica scientifica ed ingegneristica, la modellizzazione,
la simulazione, la programmazione.
52
I Toolbox sono collezioni complete di funzioni (o routine) MATLAB (dette M-files)
orientate alla soluzione di problemi relativi ad uno specifico settore di ricerca matematico oppure
ad uno specifico settore applicativo e ogni utente può mettere a punto un set di programmi, un
toolbox, relativo ad uno specifico campo di applicazione e inglobarlo nel corpo dei comandi
attivi. MATLAB è un sistema interattivo in cui l’unità base dei dati è una matrice o array per cui
non è richiesto dimensionamento; non esistono dichiarazioni di tipi o di dimensioni, alloca
direttamente la memoria necessaria ogni volta che si dichiara o si modifica una variabile. In
questo modo consente di risparmiare tempo nel risolvere problemi tecnici evitando di dichiarare
ad esempio, matrici e vettori come è solito fare in un linguaggio non interattivo, come C o
Fortran.
MATLAB è un ambiente di programmazione interpretato e non compilato; ciò significa che
un programma MATLAB viene eseguito senza premettere la fase della compilazione
semplificando lo sviluppo dei programmi e permettendo di mettere a punto le funzioni man
mano che occorrono e possono essere rapidamente e semplicemente provate e corrette.
I comandi possono essere digitati direttamente sulla linea di comando o letti da file testo; la
“command window” dà accesso diretto all’interprete (scrittura diretta dei comandi):
Fig.47: Interfaccia Matlab
La caratteristica più importante di MATLAB è la sua semplice estensibilità che dà la
possibilità a tutti di contribuire come autori di MATLAB, creando le proprie applicazioni; sono
infatti molti gli scienziati, matematici e ingegneri che hanno sviluppato nuove ed interessanti
53
applicazioni, tutte senza la necessità di scrivere neppure una linea di Fortran o di altri codici a
basso livello. Avendo funzioni scritte nella maggior parte dei casi come file testo, la portabilità
da un sistema all'altro di funzioni specifiche scritte dall'utente è garantita praticamente al 100%.
5.3.2 Identificazione profili utente
Una volta stabiliti i criteri per la misura del grado di similarità/diversità, è possibile sviluppare
molteplici algoritmi per la classificazione dei casi. Per variabili di tipo quantitativo si calcolano
misure di distanza. Per variabili di tipo qualitativo si calcolano misure di similarità. Utilizzando
le tecniche di confronto spiegate in precedenza, è stato possibile ottenere dei valori di soglia per
ciascun profilo in modo da determinare un match positivo o negativo tra i profili che si desidera
analizzare e quelli campione.
Per identificare un profilo utente è necessario, nella prima prova, che il profilo da individuare
abbia una correlazione superiore alla soglia determinata e, nella seconda prova, abbia anche una
media dell’istogramma che rientri nei parametri calcolati. Questo permette di avere una
somiglianza nei valori e nella forma dei consumi di energia elettrica per poter riconoscere senza
equivoci un profilo utente X qualsiasi in uno di quelli campione individuati con la simulazione.
Nel caso in cui non c’è identificazione, e quindi il profilo X non rientri in nessuno dei casi,
allora si rivelerà un’anomalia.
5.4 Risultati
5.4.1.1 Prima prova
Identificazione di profili utente totali
Questa prima prova consiste nel cercare di identificare un qualsiasi profilo utente, diverso da
quelli delle famiglie-campione, attraverso i valori di correlazione ottenuti durante il confronto tra
i profili. Il seguente schema mostra come il profilo X è stato identificato in una famiglia-
campione di 2 persone, avendo una correlazione maggiore rispetto alle altre:
Profilo X 2p 3p 4p
Profilo X 1 0,9826 0,8632 0,8766
2p 0,9826 1 0,9671 0,8384
3p 0,8632 0,9671 1 0,8624
4p 0,8766 0,8384 0,8624 1
Fig.48: Identificazione profilo totale 2 persone
54
Il caso successivo, invece mostra come il profilo Y è stato identificato nella tipologia di
consumo appartenente alla famiglia-campione di 3 persone:
Profilo Y 2p 3p 4p
Profilo Y 1 0,9605 0,9745 0,8951
2p 0,9605 1 0,9671 0,8384
3p 0,9745 0,9671 1 0,8624
4p 0,8951 0,8384 0,8624 1
Fig.49: Identificazione profilo totale 3 persone
Il profilo Z è stato invece identificato nella tipologia di consumo di energia elettrica propria
della famiglia-campione di 4 persone:
Profilo Z 2p 3p 4p
Profilo Z 1 0,9047 0,9400 0,9628
2p 0,9047 1 0,9671 0,8384
3p 0,9400 0,9671 1 0,8624
4p 0,9628 0,8384 0,8624 1
Fig.50: Identificazione profilo totale 4 persone
Sono stati quindi definiti dei valori soglia per ciascuna tipologia di famiglia-campione al di
sotto dei quali non vi è identificazione, e quindi probabile anomalia. In questo modo, un profilo
qualunque apparterrà al nucleo familiare composto da 2 persone se e solo se la correlazione tra
questo profilo e quello della famiglia-campione di 2 persone è maggiore o uguale a 0,9826; potrà
appartenere al nucleo composto da 3 persone se e solo se la correlazione tra questo profilo e
quello della famiglia-campione di 3 persone è maggiore o uguale a 0,9745; invece potrà essere
identificato come un nucleo di 4 persone se e solo se la correlazione tra questo profilo e quello
della famiglia-campione di 4 persone è maggiore o uguale a 0,9628.
Identificazione di profili parziali
Tramite l’algoritmo di simulazione di consumo energetico, sono stati creati degli istogrammi
bidimensionali, relativi alle curve di consumo giornaliero regolarizzate come costante a tratti, di
soli dieci giorni a caso tra i 365 dell’intero anno calcolati in 3.3.3.1; questo procedimento è stato
eseguito per tutte e tre le tipologie di famiglie-campione. Successivamente ogni istogramma
rappresentante i dieci giorni è stato confrontato con quello che riproduce la situazione dell’intero
anno. In questo modo sono stati ottenuti ulteriori soglie per ciascun profilo in modo da
55
determinare un match positivo o negativo anche nel caso di confronti su periodo di tempo
limitati. La seguente tabella mostra come 10 giorni random di un profilo X sono stati identificati
come appartenenti al profilo di consumo di una famiglia-campione di 2 persone, avendo una
correlazione maggiore rispetto alle altre:
10 gg di X 2p 3p 4p
10 gg di X 1 0,8919 0,6879 0,6902
2p 0,8919 1 0,9671 0,8384
3p 0,6879 0,9671 1 0,8624
4p 0,6902 0,8384 0,8624 1
Fig.51: Identificazione profilo parziale 2 persone
La tabella successiva, invece mostra come 10 giorni random di un profilo Y sono stati
identificati nella tipologia di consumo appartenente alla famiglia-campione di 3 persone:
10 gg di Y 2p 3p 4p
10 gg di Y 1 0,6736 0,8531 0,8441
2p 0,6736 1 0,9671 0,8384
3p 0,8531 0,9671 1 0,8624
4p 0,8441 0,8384 0,8624 1
Fig.52: Identificazione profilo parziale 3 persone
Di seguito è mostrato come anche 10 giorni random di un profilo Z sono stati invece
identificati nella tipologia di consumo di energia elettrica propria della famiglia-campione di 4
persone:
10 gg di Z 2p 3p 4p
10 gg di Z 1 0,6615 0,7918 0,9286
2p 0,6615 1 0,9671 0,8384
3p 0,7918 0,9671 1 0,8624
4p 0,9286 0,8384 0,8624 1
Fig.53: Identificazione profilo parziale 4 persone
Sono stati quindi definiti dei valori soglia anche per l’identificazione di un periodo più breve
rispetto ai 365 giorni dell’intero anno al di sotto dei quali non vi è identificazione, e quindi
probabile anomalia. Scegliendo un periodo random di 10 giorni da un qualsiasi profilo, questo
56
sarà identificato appartenente al nucleo familiare composto da 2 persone se e solo se la loro
correlazione è maggiore o uguale a 0,8919; potrà appartenere al nucleo composto da 3 persone se
e solo se la correlazione tra questo profilo e quello della famiglia-campione di 3 persone è
maggiore o uguale a 0,8531; invece sarà identificato come un nucleo di 4 persone se e solo se la
loro correlazione è maggiore o uguale a 0,9286.
5.4.1.2 Seconda prova
Per la secondo prova è prevista una identificazione di un qualsiasi profilo utente, diverso da
quelli delle famiglie-campione determinati durante la fase di simulazione, attraverso un match
sia sui valori di correlazione ottenuti durante il confronto tra i profili, sia sulle medie degli
istogrammi, calcolate in base all'istogramma tramite una formula in cui i valori dell'istogramma
sono pesati con le ampiezze e le durate cui si riferiscono, riportate in Fig.45: . E’ stato simulato
un nuovo profilo X, che è stato correttamente identificato come appartenente al profilo 1 della
famiglia-campione di 2 persone poiché ha una media pari a 7,2370 kWh al giorno, quindi dentro
l’intervallo consentito che, come mostrato in Fig.45: , deve essere compreso tra 7,7027 e 8,8103:
Profilo X 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2
Profilo X 1 0,9482 0,5070 0,7996 0,2445 0,4148 0,5153
2p prof.1 0,9482 1 0,6480 0,9143 0,4715 0,5946 0,7024
2p prof.2 0,5070 0,6480 1 0,7827 0,7457 0,7357 0,7937
3p prof.1 0,7996 0,9143 0,7827 1 0,6780 0,8225 0,8732
3p prof.2 0,2445 0,4715 0,7457 0,6780 1 0,7579 0,8253
4p prof.1 0,4148 0,5946 0,7357 0,8225 0,7579 1 0,8759
4p prof.2 0,5153 0,7024 0,7937 0,8732 0,8253 0,8759 1
Fig.54: Identificazione profilo 2 persone seconda prova
Successivamente è stato simulato un altro profilo Y, che è stato correttamente identificato
come appartenente al profilo 1 della famiglia-campione di 3 persone poiché ha una media pari a
8,5384 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: , deve
essere compreso tra 8,8836 e 8,5445:
Profilo Y 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2
Profilo Y 1 0,8899 0,7515 0,9642 0,6348 0,8688 0,8669
2p prof.1 0,8899 1 0,6480 0,9143 0,4715 0,5946 0,7024
2p prof.2 0,7515 0,6480 1 0,7827 0,7457 0,7357 0,7937
3p prof.1 0,9642 0,9143 0,7827 1 0,6780 0,8225 0,8732
57
3p prof.2 0,6348 0,4715 0,7457 0,6780 1 0,7579 0,8253
4p prof.1 0,8688 0,5946 0,7357 0,8225 0,7579 1 0,8759
4p prof.2 0,8669 0,7024 0,7937 0,8732 0,8253 0,8759 1
Fig.55: Identificazione profilo 3 persone seconda prova
Infine è stato simulato un altro profilo Z, che è stato correttamente identificato come
appartenente al profilo 2 della famiglia-campione di 4 persone poiché ha una media pari a
10,6068 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: ,
deve essere compreso tra 10,4390 e 11,4027:
Profilo Z 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2
Profilo Z 1 0,8720 0,7417 0,9290 0,6544 0,7603 0,9102
2p prof.1 0,8720 1 0,6480 0,9143 0,4715 0,5946 0,7024
2p prof.2 0,7417 0,6480 1 0,7827 0,7457 0,7357 0,7937
3p prof.1 0,9290 0,9143 0,7827 1 0,6780 0,8225 0,8732
3p prof.2 0,6544 0,4715 0,7457 0,6780 1 0,7579 0,8253
4p prof.1 0,7603 0,5946 0,7357 0,8225 0,7579 1 0,8759
4p prof.2 0,9102 0,7024 0,7937 0,8732 0,8253 0,8759 1
Fig.56: Identificazione profilo 4 persone seconda prova
Con questo ultimo test si può notare come sia importante considerare anche un confronto sui
valori delle medie degli istogrammi al fine di determinare una corretta identificazione dei profili
di consumo di energia elettrica. Infatti se non fosse stata considerata anche un’uguaglianza dal
punto di vista dei valori, ma solo quella sulla forma della curva, quest’ultimo profilo sarebbe
dovuto essere identificato come appartenente al profilo 1 della famiglia-campione composta da 3
persone, commettendo un errore.
58
6 RIVELAZIONE DI ANOMALIE NEL
CONSUMO DOMESTICO
Una volta determinati i consumi propri di ciascun nucleo familiare ed aver definito dei profili
d’utenza, tutto ciò che risulta essere fuori da certi standard è definito irregolare e rivelato come
anomalia. Le anomalie infatti sono definite come inusuali e significanti cambiamenti nei livelli
di consumo di energia elettrica ed è per questo che per identificarle è necessario conoscere il
normale comportamento di una o più famiglia-campione. Il diagnosticare anomalie è un
problema sia per l’azienda fornitrice di energia elettrica sia per l’utente finale perché significa
interpretare un comportamento anomalo in una grande quantità di profili di consumo e perché
possono essere di varie forme e provenire da infinite cause. Risulta però fondamentale rivelarle
perché possono creare inutili sprechi di energia elettrica ed avere un drammatico impatto
sull’utente finale. Le anomalie sono solitamente caratterizzate da cambiamenti transitori ed
improvvisi nei dati misurati che avvengono prima o durante un evento anomalo. La durata di
questi cambiamenti varia con la natura della causa che ha dato il via all’evento. Il più delle volte
le anomalie in questo ambito rimangono sconosciute perché una loro corretta identificazione
richiederebbe delle strutture di monitoraggio sofisticate o perché non si hanno gli strumenti per
processarle in tempo reale o, e soprattutto perché, il consumo di energia elettrica è talmente alto
che rende difficile l’estrazione di informazioni significative.
6.1 Strategia per la rivelazione di anomalie Definiti i profili per il normale uso di energia elettrica in ciascun nucleo familiare si passa ad
evidenziare le deviazioni da tale profilo come possibili situazioni anomale. Una volta ottenuti
tutti i valori per cui si ha o non si ha una correlazione, si determina una soglia per stabilire
eventuali comportamenti anomali. Se infatti per esempio la correlazione normalizzata di una
curva di consumo X per una famiglia-campione di 2 persone con la curva calcolata per il profilo
di una famiglia-campione di 2 persone è superiore a tale soglia, allora si potrà identificare tale
curva X come un caso di anomalia di consumo di energia elettrica in un nucleo familiare di 2
persone.
59
Per rivelare eventuali situazioni anomale, è stato necessario confrontare gli istogrammi di
profilo d'utente generati nella fase precedente. I confronti sono stati eseguiti con le tecniche
descritte nel capitolo 5.1 di auto- e le cross-correlazioni, le distanze euclidee, le auto- e le cross-
correlazioni normalizzate, le medie per valutare contemporaneamente tutti i valori di distanza, o
di similarità, tra gli istogrammi; queste tecniche permettono di determinare una somiglianza nei
valori e nella forma dei dati. La prima prova consiste nel rivelare le anomalie delle tre tipologie
di famiglie descritte sopra, differenti per numero di componenti e per abitudini. Nella seconda
prova una volta determinate le tipologie di consumi proprie dei due profili per famiglia, si cerca
di individuare le situazioni anomale, cioè quei consumi che risultino diversi nei valori e nella
forma dai profili definiti.
6.2 I risultati Come detto in precedenza, nel caso in cui non si riesca ad ottenere l’identificazione di un
qualsiasi profilo X in nessuna tipologia di famiglia-campione, si può parlare di un’anomalia di
consumo di energia elettrica in ambito domestico.
6.2.1.1 Prima prova
Anomalie per profili utente totali
Dai risultati dei test riportati nelle tabelle Fig.48: , Fig.49: , Fig.50: si deduce che è stato
possibile rivelare come anomalie tutti i casi di test in cui la correlazione tra un profilo utente da
identificare con una tipologia di famiglia-campione è risultata inferiore a tutte le soglie calcolate,
cioè non è stato identificato con nessuno dei tre profili. I seguenti valori di correlazione mostrano
le soglie da rispettare per poter identificare correttamente un profilo qualsiasi di consumo di
energia elettrica in una delle tre tipologie prese in esame:
2p 3p 4p
Profilo X 0,9826 0,8632 0,8766
Profilo Y 0,9605 0,9745 0,8951
Profilo Z 0,9047 0,9400 0,9628
Fig.57: Soglie di identificazione profili totali prima prova
Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia
composta da 2 persone se la loro correlazione sarà minore di 0,9826; non apparterrà mai ad un
nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,9745; non apparterrà mai
ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9628. Nell’ipotesi in cui non
60
sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di
anomalia.
Anomalie per profili utente parziali
Dai risultati dei test riportati nelle tabelle Fig.51: , Fig.52: , Fig.53: si deduce che è stato
possibile rivelare come anomalie tutti i casi di test in cui la correlazione di 10 giorni di consumo
di un profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore a
tutte le soglie calcolate, cioè non è stato identificato con nessuno dei tre profili. I seguenti valori
di correlazione mostrano le soglie da rispettare per poter identificare correttamente un profilo
qualsiasi di consumo di energia elettrica in una delle tre tipologie prese in esame:
2p 3p 4p
10 gg di X 0,8919 0,6879 0,6902
10 gg di Y 0,6736 0,8531 0,8441
10 gg di Z 0,6615 0,7918 0,9286
Fig.58: Soglie di identificazione profili parziali prima pr ova
Si può quindi concludere che un profilo qualsiasi non sarà mai riconosciuto appartenente ad
una famiglia composta da 2 persone se la loro correlazione sarà minore di 0,8919; non apparterrà
mai ad un nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,8531; non
apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9286.
Nell’ipotesi in cui non sia riconosciuto in nessuno delle tre tipologie di famiglie-campione,
risulta essere un caso di anomalia.
6.2.1.2 Seconda prova
I risultati dei test riportati nelle Fig.45: , Fig.54: , Fig.55: ,Fig.56: definiscono delle soglie che
se non rispettate rivelano situazioni di anomalie. Tutti i casi di test in cui la correlazione tra un
profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore alle
soglie calcolate e la media dell’istogramma non è rientrata nell’intervallo stabilito, hanno portato
a definire il profilo come caso anomalo. I seguenti valori di correlazione mostrano le soglie da
rispettare per poter identificare correttamente un profilo qualsiasi di consumo di energia elettrica
in una delle tre tipologie prese in esame:
2p 3p 4p
Profilo X 0,9482 0,7996 0,5153
61
Profilo Y 0,8899 0,9642 0,8669
Profilo Z 0,8720 0,9290 0,9102
Fig.59: Soglie di identificazione profili totali seconda prova
Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia
composta da 2 persone se la loro correlazione sarà minore di 0,9482 e la media dell’istogramma
non compresa tra 7,7027 e 8,8103; non apparterrà mai ad un nucleo familiare di 3 persone se la
loro correlazione sarà minore di 0,9642 e la media dell’istogramma non compresa tra 8,8836 e
8,5445; non apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di
0,9102 e la media dell’istogramma non compresa tra 10,4390 e 11,4027. Nell’ipotesi in cui non
sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di
anomalia.
62
7 CONCLUSIONI
Il lavoro presentato in questa tesi è molto lontano dall’essere considerato un prodotto finito;
può essere visto come il punto di partenza per lo sviluppo di dispositivi che individuino i furti e
le frodi nel settore energetico. E’ stato calcolato che negli Stati Uniti i furti di energia elettrica
costano più di un milione di dollari l’anno alle compagnie erogatrici. Prendendo spunto dalle
tecniche e strategie utilizzate per la rivelazione di anomalie nel traffico su Internet, in questo
elaborato si è voluto dare l’idea per lo sviluppo di un modello che permettesse la rivelazione di
anomalie nel consumo di energia elettrica in ambito domestico.
Ultimamente la società attuale è sempre più sensibile al tema del risparmio energetico che
rappresenta un ruolo fondamentale nella protezione dell’ambiente e dei cambiamenti climatici.
Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti, soprattutto
in ambito domestico. Tutti gli immobili dovrebbero rispettare la normativa sul risparmio
energetico e quella sulla sicurezza; nell’effettuare la diagnosi di un edificio si cerca di
individuare, attraverso i rilievi delle strutture e dei componenti, calcoli, misure, eventuali
anomalie che possono interessare la stabilità, il consumo energetico, la sicurezza o l’igiene
ambientale.
L’obiettivo del lavoro di tesi è stato quello di progettare e testare uno strumento per
riconoscere situazioni di anomalie nei sistemi elettrici che possono essere causate da
malfunzionamenti o manomissioni dei contatori per tentare di ridurre al minimo gli eventuali
sprechi e furti che ne derivano; a tal fine è stato sviluppato ed utilizzato un algoritmo in grado di
distinguere le anomalie, definite come inusuali e significanti cambiamenti nei livelli di consumo
di energia elettrica standard propri di ciascun nucleo familiare. Una volta definito un profilo per
il “normale” uso di energia elettrica, sono state evidenziate le deviazioni da tale profilo come
possibili situazioni anomale.
La fase realizzativa è stata caratterizzata dalla scrittura del codice in Matlab e si articola nelle
seguenti fasi: (1) raccolta dei dati di consumo di energia elettrica relativi ad alcune famiglie-
campione, (2) elaborazione dei dati per calcolare il fabbisogno energetico di ciascuna famiglia-
campione e definire dei valori “normali”, cioè quelli che esprimono le caratteristiche energetiche
di un sistema “in buona salute”, (3) identificazione di profili utente campione per mezzo dei dati
63
“normali” ottenuti, (4) individuazione di anomalie basata sul confronto tra alcune curve di
consumo random e quelle relative al consumo “normale”.
Proprio come nel traffico su Internet, l’anomaly detection e la correlazione di eventi di
anomalia è un problema estremamente difficile da risolvere. Durante questo lavoro è stato
possibile esaminare il funzionamento e le prestazioni di strumenti che implementano algoritmi
per la rivelazione di anomalie: nonostante si tratti di prototipi di ricerca con possibilità di
miglioramento effettivo i modelli sviluppati in questo ambito hanno mostrato buoni risultati
anche presentando volutamente un’architettura molto semplice. Da questo emerge la conclusione
che, in base all’analisi effettuata, la realizzazione di un sistema del genere riesce ad individuare
in modo corretto la presenza di anomalie nel consumo energetico.
64
APPENDICE A: Rivelazione di anomalie nel
traffico su Internet
Il lavori di tesi descritto in questo elaborato prende spunto dalle tecniche e strategie utilizzate
per la rivelazione di anomalie nel traffico su Internet. A tale scopo è di fondamentale importanza
una corretta analisi che determini come il traffico di pacchetti si muove attraverso la rete, Traffic
Engineering, e quali sono i links sui quali si riscontra un traffico inusuale, Anomaly Detection,
che devono essere modificati [18.]; si potrebbero implementare delle politiche reattive tali da
bloccare subito il traffico sospetto non appena si rilevino delle discrepanze fra il profilo
concordato con il cliente e il suo effettivo utilizzo della rete [19.]. Le anomalie che si riscontrano
nel traffico sono caratterizzate da rilevanti cambiamenti nel normale comportamento della rete,
che possono essere maliziosi, come quelli causati da attacchi, dall’ uso abusivo della rete, dalla
propagazione di worms o virus, oppure involontari, causati per esempio da fallimenti, da flash
crowds, da una configurazione errata dei routers [20.]. Un’accurata classificazione del traffico è
di fondamentale importanza per numerose attività della rete, dal monitoraggio alla sicurezza,
dalla Quality of Service all’Intrusion Detection, e può essere basata sull’analisi del numero di
porta al quale il client accede per richiedere il servizio oppure sfruttando le caratteristiche che
distinguono le applicazioni quando comunicano sulla rete. Un buon classificatore dovrebbe avere
uno schema che definisca le categorie in cui si vuole classificare il traffico e che aiuti a
raggruppare le applicazioni che svolgono lo stesso compito in classi e dovrebbe “individuare
quali sono le caratteristiche che permettono di discriminare le classi l’una dall’altra” [19.].
Anomaly detection è una grande e complessa area di ricerca, alla quale ancora non si riesce a
dare un unico approccio con il quale affrontare e risolvere il problema. [21.] Le anomalie sono
definite come inusuali e significanti cambiamenti nei livelli di traffico della rete ed è per questo
che per identificarle è necessario conoscere il normale comportamento di una rete. Il
diagnosticare anomalie è un problema sia per gli operatori della rete sia per l’utente finale perché
significa interpretare un comportamento anomalo in una grande quantità di dati high-dimensional
e rumorosi e perché possono essere di varie forme e provenire da una infinite cause. Risulta però
fondamentale analizzare le anomalie perché possono creare congestioni nella rete e avere un
drammatico impatto sull’utente finale.
Gli approcci usati per scoprire le anomalie dipendono dalla natura dei dati disponibili per
l’analisi ottenuti a vari livelli di granulosità e che possono essere [21.]:
65
1. end-user-based information : si riferiscono ai protocolli TCP e UDP relativi ai dati che
contengono informazioni specifiche per l’applicazione finale;
2. network-based data : sono pertinenti alla funzionalità dei dispositivi della rete e
includono informazioni raccolte dalle interfacce fisiche dei routers.
NETWORK ANOMALIES
Alle anomalie presenti nella rete ci si riferisce solitamente nelle circostanze in cui le
operazioni della rete si discostano dal comportamento normale. Le cause per cui si presentano
queste anomalie sono molteplici come il malfunzionamento dei dispositivi di rete, sovraccarico,
attacchi DoS, intrusioni che interrompono la normale distribuzione di un servizio. Le anomalie
della rete sono caratterizzate da transitori ed improvvisi cambiamenti nei dati misurati della rete
che avvengono prima o durante un evento anomalo. La durata di questi cambiamenti varia con la
natura della causa che ha dato il via all’evento.
Un tipo di anomalia è relativa ai fallimenti della rete e ai problemi di prestazioni, come per
esempio fallimenti dei file server (computer responsabili dell’immagazzinamento e della
gestione dei files di dati così che altri computer nella stessa rete possano accedervi) nel caso di
un elevato numero di richieste FTP, operazioni di paging (usate in caso di memoria virtuale,
consiste nel trasferimento di pagine dentro e fuori la memoria in modo che l’informazione che si
desidera sia reperibile il più velocemente possibile) attraverso la rete, congestioni transitorie..
Un altro tipo di anomalia è relativa al problema della sicurezza come nel caso di attacchi DoS
che avvengono quando i servizi offerti da una rete sono “rubati” da entità maliziose o nel caso di
intrusioni nella rete durante le quali le entità maliziose “rubano” larghezza di banda inondando la
rete con traffico inutile [21.].
NETWORK DATA
I tipi di anomalia che possono essere scoperti dipendono dalla natura dei dati che circolano
sulla rete che, a tal proposito, sono analizzati in vari modi:
− Network probes: strumento come ping o traceroute che può essere usato per
ottenere parametri specifici (end-to-end delay o packet loss) e fornisce misure
istantanee sul comportamento di una rete.
− Packet filtering: i flussi di pacchetti sono campionati catturando l’intestazione IP di
un certo numero di pacchetti in differenti punti della rete. Un flusso è identificato
dall’indirizzo sorgente-destinazione e dal numero di porta sorgente-destinazione.
66
− Routing protocol: informazioni riguardanti gli eventi sulla rete possono essere
ottenute analizzando le tabelle di indirizzamento inviate attraverso i router e i dati in
esse possono essere usati per costruire la topologia della rete e fornire lo stato dei
link tra i nodi.
− Network management protocol: fornisce statistiche riguardanti il traffico della rete
monitorando le informazioni che circolano attraverso i router. Queste informazioni
non forniscono direttamente una metrica di prestazioni del traffico ma possono
essere usate per caratterizzare il comportamento della rete
INTRUSION DETECTION SYSTEM (IDS)
Le persone possono comunicare tra loro attraverso la rete senza nessun problema reale dovuto
alla distanza. E’ però risaputo che l’intrusione di un utente malizioso e non autorizzato può
recare gravi danni ad un intero sistema. La sicurezza delle reti di computer è un vero e proprio
problema ed è importante sviluppare meccanismi per difendersi contro le intrusioni.
Secondo Heady [22.] un’intrusione può essere definita come “un qualsiasi insieme di azioni
che tentano di compromettere l’integrità, la confidenzialità o la disponibilità di risorse di
informazioni”. L’identificazione di questo insieme di azioni maliziose è chiamata intrusion
detection e i sistemi usati in questo ambito aiutano a mantenere sicure le reti che oltre ad essere
minacciate da attacchi esterni, devono difendersi spesso anche da quelli interni. Queste reti
spesso includono computer vulnerabili e offrono una grande larghezza di banda; questi sono i
motivi per cui risultano essere interessanti agli occhi di chi intende attaccarle. L’obiettivo
dell’attaccante non è la singola macchina, che il più delle volte contiene informazioni non
importanti, ma sa che attraverso quella è possibile fare una scansione dell’intera rete ed iniziare,
ad esempio, un attacco Denial of Service. Un sistema di Intrusion Detection conosciuto è il
GrIDS [23.] che cerca di identificare worms costruendo i così detti activity graphs che
rappresentano le connessioni di rete tra hosts e che sono usati per ricercare modelli predefiniti
[24.].
Per intrusion detection si intende un insieme di tecniche che sono usate per identificare
attacchi contro computer e reti [25.]. La valutazione dei sistemi usati in questo campo è un
compito arduo per diverse ragioni:
− è problematico usare dati di alta qualità per valutare le prestazioni a causa di
problemi inerenti la privacy e la competitività, perché molte organizzazioni non
sono disponibili a condividere le loro informazioni con altre istituzioni;
67
− anche se sono disponibili dati della vita reale, la classificazione delle connessioni di
rete in normale e non, richiede una grande quantità di tempo;
− il cambiamento costante nel traffico di rete non può introdurre solo nuovi tipi di
intrusioni, ma può anche cambiare gli aspetti di un comportamento “normale”;
− nella misurazione delle prestazioni di un IDS, vanno tenute in considerazione il
detection rate (calcolato come la frazione tra il numero di attacchi scoperti
correttamente e il numero totale di attacchi), il false alarm rate (calcolato come la
frazione tra il numero di connessioni normali che sono classificate erroneamente
come attacchi e il numero totale di connessioni normali), e il costo della
classificazione;
− alcuni attacchi, come Dos, possono usare centinaia di pacchetti di rete e
connessioni.
Generalmente sono previsti due tipi di attacchi: quello che riguarda una connessione singola
per cui viene applicata un’analisi di attacco single-connection e quello che riguarda una
connessione multipla (bursts of connections) per cui viene applicata un’analisi di attacco
multiple-connection.
Fig.60: Passi eseguiti per valutare un intrusione [25.]
Entrambe le metodologie di analisi per prima cosa calcolano un valore di score necessario per
associare una particolare connessione ad una intrusione. Per un dato traffico di rete in alcuni
intervalli di tempo, è assegnato un valore di score, come mostrato in figura:
68
Fig.61: Assegnamento del valore di score [25.]
La linea rossa tratteggiata rappresenta la real attack curve che vale zero nel caso di
connessioni di rete normali e vale uno per una connessione non normale. La linea verde continua
corrisponde ad un predicted attack curve e per ogni connessione vale il valore dello score che le
è stato assegnato. Queste due curve ci permettono di calcolare l’errore per ogni connessione
come la differenza tra il valore reale della connessione (1 per connessioni con attacchi e 0 per
connessioni normali) e lo score assegnato alla connessione. Questo approccio permette la
valutazione di metriche aggiuntive come per esempio la superficie tra la curva del real attack e
quella del predicted attack; più piccola sarà la superficie tra queste due curve e migliore sarà
l’algoritmo di intrusion detection. [25.]
Un dispositivo atto a rilevare attività anomale sulle reti o sui sistemi informatici può agire o
sulla base di conoscenze acquisite durante attacchi precedenti (signatures) o in base
all’osservazione dei comportamenti di sistemi o di utenti che risultano essere differenti da quelli
abituali. I metodi esistenti di intrusion detection si possono quindi suddividere in due categorie
principali [26.]:
1. signature recognition techniques o misuse detection systems : le signature di eventi
conosciuti sono immagazzinati e gli eventi sono monitorati al fine di trovare una
correlazione con le signature conservate. Queste tecniche segnalano un attacco quando
si trova una corrispondenza. Naturalmente in questi casi è richiesta una signature per
ogni attacco e non è possibile trovare nuovi attacchi al di fuori di quelli già conosciuti.
La loro efficacia dipende dall’attendibilità del database.
2. anomaly detection systems (ADS) : costruisce modelli di dati “normali” e identifica
nei dati osservati qualsiasi tipo di scostamento dal modello normale. Gli algoritmi
usati in questo campo hanno il vantaggio di poter scoprire nuovi tipi di intrusioni
grazie agli scostamenti dal normale comportamento che si manifestano [10]. Dato
69
quindi un insieme di dati “normali” e un dato usato per il test, l’obiettivo è quello di
determinare se il dato di test appartiene o no ad un comportamento normale. Gli
schemi usati però soffrono di un alto false alarms rate.
Un IDS può rilevare un attacco sia quando è ancora in corso (real time), generando
immediatamente degli alert, sia quando è già avvenuta un’intrusione (off-line), analizzando
periodicamente dei log in cui sono registrati gli eventi passati, ma in questo caso il risultato non
è istantaneo. Gli elementi architetturali che accomunano i diversi tipi di IDS consistono nelle
loro tre componenti fondamentali:
− i sensori (event generator): raccolgono i dati provenienti dai vari sistemi e li
inoltrano all’analizzatore;
− l’analizzatore (analysis engine): decide se i dati ricevuti corrispondono
effettivamente ad un attacco, e può indicare gli eventuali provvedimenti da
prendere;
− l’interfaccia utente (response unit): permette il controllo dello stato del sistema da
parte dell’amministratore.
Fig.62: Componenti fondamentali di un IDS [57]
Gli IDS, anche se tutti caratterizzati dalle tre componenti fondamentali viste, possono variare
molto fra loro a seconda dei dati da essi esaminati e generati. E’ possibile infatti suddividerli
nelle seguenti categorie [57]:
− application-based IDS: analizzano il comportamento di un programma applicativo;
70
− host-based IDS (HIDS): analizzano dati provenienti da application-based IDS
relativi ad un host, dal quale dipendono strettamente, soprattutto in relazione al
sistema operativo. Lavorano fuori linea in modalità anomaly detection;
− network-based IDS (NIDS): analizzano il traffico di rete alla ricerca di tracce di
attacchi nei pacchetti IP, accedendo anche ai dati generati dagli host-based IDS e
dagli application-based IDS appartenenti alla rete da essi monitorata. Lavorano in
tempo reale in modalità misuse detection, comportano perciò l’incapacità di reagire
ad attacchi non ancora conosciuti, ed è inoltre facilmente aggirabile dal traffico
criptato, del quale non può in alcun modo rilevare l’eventuale nocività;
− multi-network-based IDS: si tratta, in realtà, di Incident Response Team (IRT), che
ricevono dati da diversi siti di loro competenza e sono in grado di coordinarne la
gestione.
ANOMALY DETECTION SYSTEMS (ADS)
La scoperta delle anomalie è un elemento chiave di intrusion detection nella quale le
perturbazioni che avvengono durante il normale comportamento suggeriscono la presenza di
intenzionali o non attacchi, fallimenti, difetti.. [25.]
Ci sono molte tecniche che appartengono alla categoria dell’anomaly detection, alcune delle
quali sono tecniche machine learning e altre statistical-based. Queste ultime usano proprietà
statistiche di normali attività per costruire un profilo standard ed applicano test statistici per
determinare se le attività osservate sono molto diverse dalla norma [26.].
Emran eYe [27.] hanno sviluppato un metodo di anomaly detection chiamata Canberra; il
loro esperimento mostra che la loro tecnica ha buone prestazioni solo nel caso di attacchi che
hanno luogo tutti insieme. Un’altra tecnica basata sul test di Hotelling [28.] è una metodoligia di
controllo di qualità multivariate che costruisce un long-term profile di attività normali nei sistemi
informativi e lo usa per scoprire anomalie.
Ci sono anche tecniche basate sul concetto di outliers; Aggarwal e Yu discutono di una
tecnica che trova questi outliers studiando il comportamento dei dataset [29.]. Molti dataset
contengono una o più osservazioni inusuali che non sembrano appartenere allo schema di
variabilità prodotto da altre osservazioni. Quando un’osservazione è differente dalla maggior
parte dei dati o non è simile al modello di dati assunto, è considerato un outlier [26.].
Assumendo una distribuzione normale, ogni osservazione che risulta avere un valore
standardizzato più grande di un valore assoluto è spesso identificato come outlier di un dataset.
71
Sviluppo di un ADS
Nell’articolo [30.] si cerca di sviluppare uno strumento per l’anomaly detection in grado di
identificare gli attacchi senza mantenere informazioni riguardanti lo stato del flusso o della
connessione su un determinato nodo o link, come invece viene fatto nella maggior parte delle
tecniche in circolazione. Questo strumento non tenta di identificare differenti tipi di attacchi o le
loro derivazioni, ma verrà usato per indicare quando deve iniziare una più sofisticata tecnica di
intrusion detection. L’ASD sviluppato usando l’ambiente MATLAB deriva dallo schema [26.]
basato su dati SNMP ed è stato usato per l’identificazioni delle anomalie nella rete TNUN
(Tunisian National University Network) in un periodo di 45 giorni.
Tutte le tecniche di anomaly detection iniziano con la costruzione di un profilo per il
“normale” comportamento della rete e poi evidenzia le deviazioni da tale profilo come possibili
attacchi. Per valutare lo strumento sviluppato è necessario mantenere una traccia di dove le
anomalie del traffico sono state identificate. E’ stata quindi realizzata una rete sperimentale
consistente di due reti locali connesse da un router:
Fig.63: Rete sperimentale per la valutazione dello strumento ADS [30.]
Per la simulazione di un traffico normale, si è usato un genitore di traffico LANTRAFFIC
[31.] che mantiene 16 connessioni bidirezionali TCP e UDP tra il computer “victim” e quello che
genera il traffico. Sono stati inseriti altre due macchine per lanciare gli attacchi DoS usando
tecniche di flooding e una ADS station per processare i dati SNMP provenienti dal router
centrale. La valutazione dello strumento sviluppato segue le metriche generali e di per-attack
presentate in [32.] da Lazarevic:
72
Real false alarm rate Numero di false alarms diviso il numero totale delle osservazioni
Detection rate Numero di truthful alarms diviso il numero totale di osservazioni anomale reali. Precision Numero di truthful alarms diviso il numero totale di alarms
Fig.64: Metriche generali [32.]
Burst Detection Rate (bdr)
Rapporto tra il numero totale delle osservazioni intrusive che hanno un valore di score più alto di una soglia e il numero totale di osservazioni intrusive reali
Response Time (Trep)
Tempo trascorso tra l’inizio dell’attacco fino al momento in cui il valore di score raggiunge la soglia
Fig.65: Metriche per-attack [32.]
73
APPENDICE B: Software Matlab per la
modellistica e l’analisi dei consumi domestici
Il programma carica un file txt contenente le potenze degli elettrodomestici e una matrice con
le probabilità di accensione. L’algoritmo legge e verifica le assegnazioni delle probabilità di tutti
gli apparecchi e generando un grafico che rappresenta i livelli di consumo di energia elettrica di
ogni elettrodomestico.
Di seguito il codice esempio per determinare il consumo di alcuni elettrodomestici in una
famiglia di 2 persone con il modello semplice:
% Program UserProfile_2p
clear
n_ore=48;
pot = textread('p1UserProfile_2p.txt','%d',11,'head erlines',1);
pot = pot/1000;
pot_luce= pot(1);
pot_pc= pot(3);
pot_tv= pot(7);
……
% Luci-assegnazione probabilità
for i=1:48,
pr_luci(i,1:5)= textread('p1UserProfile_2p.txt','%d',5,'headerlines ',i+3);
end
pr_luci=pr_luci/10;
% verifica delle probabilità assegnate
for i1=1:n_ore,
a=0;
for i2=1:5, a=a+pr_luci(floor((i1+1)/2),i2); en d
for i2=1:5,
pr_luci(floor((i1+1)/2),i2)=pr_luci(floor((i1+ 1)/2),i2)/a;
end
end
% Tv-assegnazione probabilità
for i=1:48,
pr_tv(i,1:3)= textread('p1UserProfile_2p.txt','%d',3,'headerlines ',i+53);
end
pr_tv=pr_tv/10;
74
% verifica delle probabilità assegnate
for i1=1:n_ore,
a=0;
for i2=1:3, a=a+pr_tv(floor((i1+1)/2),i2); end
for i2=1:3,
pr_tv(floor((i1+1)/2),i2)=pr_tv(floor((i1+1)/2) ,i2)/a;
end
end
% Pc-assegnazione probabilità
for i=1:48,
pr_pc(i,1:2)= textread('p1UserProfile_2p.txt','%d',2,'headerlines ',i+103);
end
pr_pc=pr_pc/10;
% verifica delle probabilità assegnate
for i1=1:n_ore,
a=0;
for i2=1:2, a=a+pr_pc(floor((i1+1)/2),i2); end
for i2=1:2,
pr_pc(floor((i1+1)/2),i2)=pr_pc(floor((i1+1)/2) ,i2)/a;
end
end
………
Un ciclo di 365 giorni crea un vettore di consumi energetici per ogni elettrodomestico e il
relativo grafico:
% UserConsumption_2p
clear
hold off
load d1UserProfile_2p
n_giorni = 365;
luce_av =zeros(1,n_ore);
pc_av =zeros(1,n_ore);
tv_av =zeros(1,n_ore);
………
tot =zeros(n_giorni,n_ore);
% calcolo dei consumi
for ii=1:n_giorni;
luce=zeros(1,n_ore);
pc=zeros(1,n_ore);
tv=zeros(1,n_ore);
75
………
totale=zeros(1,n_ore);
for i1=1:n_ore,
% Luci
a=rand;
pr=0;
for i2=1:5,
pr=pr_luci(floor((i1+1)/2),i2)+pr;
if a<pr, luce(i1)=(i2-1)*pot_luce; brea k, end
if a<pr, break, end
end
totale(i1)=luce(i1);
% Tv
a=rand;
pr=0;
for i2=1:3,
pr=pr_tv(floor((i1+1)/2),i2)+pr;
if a<pr, tv(i1)=(i2-1)*pot_tv; break, e nd
if a<pr, break, end
end
totale(i1)=totale(i1)+tv(i1);
% Pc
a=rand;
pr=0;
for i2=1:2,
pr=pr_pc(floor((i1+1)/2),i2)+pr;
if a<pr, pc(i1)=(i2-1)*pot_pc; break, e nd
if a<pr, break, end
end
totale(i1)=totale(i1)+pc(i1);
end % fine loop i1 su n_ore
tot(ii,1:n_ore)=totale;
luce_av=luce_av+luce;
tv_av=tv_av+tv;
pc_av=pc_av+pc;
………
end % fine loop ii su n_giorni
mesh(tot)
hold off
76
% Luci
luce=luce_av/n_giorni; % kwatt
luce_kWh_giorno=sum(luce);
luce_kWh_anno=luce_kWh_giorno*365;
luce_kWh_anno'
'attesa kWh/anno, luce: 270'
% Televisione
tv=tv_av/n_giorni; % kwatt
tv_kWh_giorno=sum(tv);
tv_kWh_anno=tv_kWh_giorno*365;
tv_kWh_anno'
'attesa kWh/anno, due tv: 150'
% Personal Computer
pc=pc_av/n_giorni; % kwatt
pc_kWh_giorno=sum(pc);
pc_kWh_anno=pc_kWh_giorno*365;
pc_kWh_anno'
'attesa kWh/anno, un pc: 100'
………
Di seguito il codice esempio per determinare il consumo del ferro da stiro in una famiglia di 2
persone con il modello di Markov:
% Programma Markov per consumo ferro
n_stati = 7;
n_giorni = 365;
n_ore = 24;
totale =zeros(n_giorni,n_ore);
ferro_av =zeros(1,n_ore);
pr_ferro= 0;
pot_ferro = 700/1000;
P= [
0.1 0.9 0 0 0 0 0
0.2 0 0.8 0 0 0 0
0.3 0 0 0.7 0 0 0
0.4 0 0 0 0.6 0 0
0.5 0 0 0 0 0.5 0
0.6 0 0 0 0 0 0.4
0.8 0 0 0 0 0 0.2
];
77
% si parte da uno stato qualsiasi
w0=[0 0 0 1 0 0 0];
% determini la percentuale di passaggio negli stati
for i=1:15,
w=w*P;
end
wr=w;
% determino stato iniziale
r=rand;
a=0;
for i=1:n_stati
a=a+wr(i);
if r<=a, break; end
end
s=i
% calcolo stato al passo generico matt/pom
for k=1:n_giorni,
ferro=zeros(1,n_ore);
r=rand;
a=0;
for i=1:n_stati
a=a+P(s,i);
if r<=a, break; end
end
pr_ferro = P(s,i);
s=i;
if s==1,
'faccio ferro'
r2=rand;
ora_inizio_mattina=floor(rand*3*2)+20; %dalle 10 .00 alle 13.00
ora_inizio_pomeriggio=floor(rand*3*2)+34; %dalle 17.00 alle 20.00
i2=0;
pr=0;
for i2=1:n_ore,
pr=pr+pr_ferro;
if r2<=pr, break, end
end
ferro(i2)=pot_ferro;
% durata della ferro
if r2>0.3,
ferro(i2+1)=pot_ferro;
78
end
totale(k,1:n_ore)=ferro;
else
'riposo'
end
ferro_av=ferro_av+ferro;
end
% consumi ferro
ferro=ferro_av/n_giorni; % kwatt
ferro_kWh_giorno=sum(ferro)
ferro_kWh_anno=ferro_kWh_giorno*365;
79
APPENDICE C: Software Matlab per la
identificazione e la rivelazione di anomalie nei
consumi domestici
Il programma carica un file txt contenente i consumi annuali degli elettrodomestici.
L’algoritmo analizza la curva di consumo giorno per giorno e l’approssima con un profilo
costante a tratti. Di seguito il codice esempio per determinare l’approssimazione in una famiglia
di 2 persone:
% Program p1PieceConstApprox2p - (Piecewise Constan t Approximation)
clear
load d0ConsumoTotale2p %carica i consumi annuali rilevati
eps=0.4;
n_giorno1=1;
n_giorno2=364;
for i_giorno=n_giorno1:n_giorno2,
% prende curva consumo di un giorno specifico
prof=tot_anno(i_giorno,1:n_ore);
i_region=1;
av_reg=prof(1);
min_reg=prof(1);
max_reg=prof(1);
d_reg=max_reg-min_reg;
l_reg=1;
n_reg=1;
for i=2:n_ore,
min_reg1=min(min_reg,prof(i));
max_reg1=max(max_reg,prof(i));
d_reg1=max_reg1-min_reg1;
if d_reg1<eps & i<n_ore,
min_reg=min_reg1;
max_reg=max_reg1;
d_reg=d_reg1;
av_reg=av_reg*l_reg+prof(i);
l_reg=l_reg+1;
av_reg=av_reg/l_reg;
else
av_regv(n_reg)=av_reg;
80
l_regv(n_reg)=l_reg;
for i1=i-1:-1:i-l_reg,
prof_av(i1)=av_reg;
end
av_reg=prof(i);
min_reg=prof(i);
max_reg=prof(i);
d_reg=max_reg-min_reg;
l_reg=1;
n_reg=n_reg+1;
end
if i==n_ore,
av_regv(n_reg)=av_reg;
l_regv(n_reg)=l_reg;
prof_av(i)=av_reg;
end
end
i1=1;
for k=1:n_reg,
for i=i1:i1+l_regv(k),
prof_rec(i)=av_regv(k);
end
i1=i;
end
plot(prof,'k')
hold on
axis([0 n_ore-1 0 5])
plot(prof_av,'r:')
plot(prof_rec+0.05,'b')
hold off
for k=1:n_reg,
la_regv(k)=l_regv(k).*av_regv(k);
end
[la_sort,i_la_sort]=sort(la_regv,'descend');
n_reg_max=10;
nn=min(n_reg,n_reg_max);
la(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_ reg_max);
l(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_r eg_max);
av(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_ reg_max);
for i=1:nn,
la(i_giorno-n_giorno1+1,i)=la_regv(i_la_sor t(i));
81
l(i_giorno-n_giorno1+1,i)=l_regv(i_la_sort( i));
av(i_giorno-n_giorno1+1,i)=av_regv(i_la_sor t(i));
end
end % fine loop sui giorni
save d1PCA2p
Il file txt salvato è caricato dal programma successivo che calcola l’istogramma
bidimensionale relativo ad un profilo di consumo giornaliero regolarizzato come costante a tratti.
Di seguito il codice esempio per determinare l’istogramma annuale in una famiglia di 2 persone:
% Program p2PCAistog2p
load d1PCA2p
istog_l_av=zeros(50,40);
av_step = 4;
for i1=1:n_user2-n_user1+1,
for i2=1:nn,
l_q=round(l(i1,i2))+1;
av_q=round(av_step*av(i1,i2)+1);
if l_q>48, l_q=48, end
if av_q>40, av_q=40, end
istog_l_av(l_q,av_q)=istog_l_av(l_q,av_q)+1 ;
end
end
sum(sum(istog_l_av));
plot(sum(istog_l_av)+10,'k')
hold on
%figura totale
figure
mesh(istog_l_av)
view(150,80)
% figura zoomata della zona interessante
figure
mesh(istog_l_av(1:8,1:8))
view(150,80)
save d2PCAistog2p
Gli istogramma creati per ciascuna famiglia o profilo sono caricati dal programma successivo
e confrontati calcolando le auto- e le cross-correlazioni, le distanze euclidee, le auto- e le cross-
correlazioni normalizzate e le medie per rivelare le anomalie. Di seguito il codice esempio per
determinare l’istogramma annuale in una famiglia di 2 persone:
82
% Program p3PCAistoMatch
clear
isto_l_av=zeros(2,50,40);
corr_l_av=zeros(2,2);
load d2PCAistog2p_01
for i1=1:50,
for i2=1:40,isto_l_av(1,i1,i2)=istog_l_av(i1,i2); e nd
end
load d2PCAistog2p_02
for i1=1:50,
for i2=1:40, isto_l_av(2,i1,i2)=istog_l_av(i1,i2); end
end
n1=50; n2=40;
for ii=1:2,
a=0;
for i1=1:n1,
for i2=1:n2,
a=a+(i1-1)*(i2-1)/4*isto_l_av(ii,i1,i2);
end
end
c_medio_istog(ii)=a/365;
end
c_medio_istog
for i1=1:3,
for i2=1:3,
corr_l_av(i1,i2)=
sum(sum(isto_l_av(i1,1:50,1:40).*isto_l_av(i 2,1:50,1:40)))/50/40;
ed_l_av(i1,i2)=
sum(sum((isto_l_av(i1,1:50,1:40)-isto_l_av(i2,1:50 ,1:40)).^2))/50/40;
end
end
for i1=1:3,
for i2=1:3,
ncorr_l_av(i1,i2)=
corr_l_av(i1,i2)/sqrt(corr_l_av(i1,i1))/sqrt(c orr_l_av(i2,i2));
end
end
corr_l_av
ed_l_av
ncorr_l_av
83
BIBLIOGRAFIA
[1.] www.pubbliservizi.it/content.asp?Subc=446&L=1&idMen=201, consumielettrici.altervista.org/tabelle.php
[2.] http://www.enel.it/attivita/ambiente/energiaelettrica/
[3.] Progetto MICENE, Politecnico di Milano “Misure dei consumi di energia elettrica nel settore domestico”
[4.] Enea Risparmio Lavatrice e Lavastoviglie.
[5.] Wikipedia, Il Processo Markoviano, http://it.wikipedia.org/wiki/Processo_markoviano
[6.] Wikipedia, Distanza Euclidea, http://it.wikipedia.org/wiki/Distanza_euclidea
[7.] L. Grassetti, Dipartimento di Scienze Statistiche, Università di Udine, “L’analisi statistica multivariata
applicata alle ricerche di mercato”
[8.] S.Calzoni, Calcolo dell’indice di sincronicità, “Indice di sincronizzazione di segnali numerici”
[9.] http://ilcorrieredelweb.blogspot.com/search/label/ambiente, “Le proposte del WWF per abbattere le
'barriere' all'efficienza energetica”
[10.] Rapporto annuale sul meccanismo dei titoli di efficienza energetica dell’ Autorità per l’energia elettrica e il
gas.
[11.] Maurizio Parenzan, Metodologie di analisi energetica ed exergetica per la predisposizione dei Piani
Energetici Comunali.
[12.] Wikipedia, Energia, http://it.wikipedia.org/wiki/Energia
[13.] Gianvito Dongiovanni, Bilancio energetico della regione Puglia: luci ed ombre
[14.] Wikipedia, Matlab, http://it.wikipedia.org/wiki/MATLAB
[15.] http://www.repubblica.it/2008/10/sezioni/ambiente/clima-vertice-ue-2/italia-classifica/italia-classifica.html
[16.] Wikipedia, Il Protocollo di Kyoto, http://it.wikipedia.org/wiki/Protocollo_di_Ky%C5%8Dto
[17.] La domanda di energia in Italia nel primo trimestre 2008
[18.] A. Lakhina, K. Papagiannaki, M. Crovella, C. Diot, E. D. Kolaczyk, and N. Taft. Structural Analysis of
Network Traffic Flows. In ACM SIGMETRICS, New York, June 2004.
[19.] V. Veglianti, Classificazione statistica del traffico IP a livello applicativo tramite Cluster Analysis, tesi di
laurea, Università di Roma La Sapienza, Italia, 2006.
[20.] K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National
University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of
Manouba, Tunisia, 2004.
[21.] M. Thottan, C. Ji, Anomaly Detection in IP Networks, IEEE Transaction on Signal Processing, Vol.51, n°8,
August 2003
[22.] R. Heady, G. Luger, A. Maccabe, and M. Servilla, The architecture of a network level intrusion detection
system, Technical report, Computer Science Department, University of New Mexico, August 1990.
84
[23.] Karl Levitt, Matt Bishop GrIDS design http://seclab.cs.ucdavis.edu/arpa/grids/design.html
[24.] T. Toth and C. Kruegel. Connection-history based anomaly detection. In IEEE Workshop on Information
Assurance and Security, 2002.
[25.] A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava; A Comparative Study of Anomaly Detection
Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data
Mining; San Francisco; 2003.
[26.] Mei-Ling Shyu, Shu-Ching Chen, K. Sarinnapakorn, and L. Chang: A Novel Anomaly Detection Scheme
Based on Principal Component Classifier. In Proceedings of the IEEE Foundations and New Directions of
Data Mining Workshop, in conjunction with the Third IEEE International Conference on Data Mining
(ICDM’03), pp. 172-179, Melbourne, Florida, USA, 2003.
[27.] S.M. Emran and N. Ye, Robustness of Canberra Metric in Computer Intrusion Detection, Proceedings of
the 2001 IEEE Workshop on Information Assurance and Security, United States Military Academy, West
Point, New York, June 5-6, 2001.
[28.] N. Ye, S. M. Emran, Q. Chen, and S. Vilbert, Multivariate Statistical Analysis of Audit Trails for Host-
Based Intrusion Detection, IEEE Transactions on Computers, Vol. 51, No. 7, July 2002.
[29.] C.C. Aggarwal and P.S. Yu, Outlier Detection for High Dimensional Data, Proceedings of the ACM
SIGMOD Conference, Santa Barbara, California, May 21-24, 2001.
[30.] K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National
University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of
Manouba, Tunisia, 2004.
[31.] LANTRAFFIC : http://www.zti-telecom.com/
[32.] A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava. A Comparative Study of Anomaly Detection
Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data
Mining; San Francisco; 2003.
[33.] http://magazine.excite.it/news/14263/Poznan-conferenza-ed-esposizione-per-salvare-il-clima
[34.] La Repubblica di Lunedì 15 settembre 2008
85
INDICE DELLE FIGURE Fig.1: Emissioni di CO2 (milioni di tonnellate) [17.]...............................................................9
Fig.2: Consumi di energia in fonti primarie (gennaio-marzo) [17.] .....................................10 Fig.3: Termovalorizzatore di Brescia (vista dalla A4) ...........................................................12 Fig.4: Consumo energetico 2006/2007 in una famiglia-campione.........................................15 Fig.5: Consumo in watt degli elettrodomestici .......................................................................18 Fig.6: Tabella di consumo medio giornaliero e annuo 2 persone ..........................................20 Fig.7: Consumo medio 2 persone con modello semplice ........................................................21 Fig.8: Tabella di consumo medio giornaliero e annuo 3 persone ..........................................22 Fig.9: Consumo medio 3 persone con modello semplice ........................................................22 Fig.10: Tabella di consumo medio giornaliero e annuo 4 persone ..........................................23 Fig.11: Consumo medio 4 persone con modello semplice ........................................................23 Fig.12: Markov famiglia-campione 2 persone..........................................................................25 Fig.13: Consumo medio 2 persone con modello di Markov .....................................................26 Fig.14: Markov famiglia-campione 3 persone..........................................................................26 Fig.15: Consumo medio 3 persone con modello di Markov .....................................................27 Fig.16: Markov famiglia-campione 4 persone..........................................................................27 Fig.17: Consumo medio 4 persone con modello di Markov .....................................................28 Fig.18: Profilo 1 famiglia-campione 2 persone ........................................................................29 Fig.19: Consumo medio profilo 1 per 2 persone ......................................................................29 Fig.20: Profilo 2 famiglia-campione 2 persone ........................................................................30 Fig.21: Consumo medio profilo 2 per 2 persone ......................................................................30 Fig.22: Profilo 1 famiglia-campione 3 persone ........................................................................31 Fig.23: Consumo medio profilo 1 per 3 persone ......................................................................31 Fig.24: Profilo 2 famiglia-campione 3 persone ........................................................................32 Fig.25: Consumo medio profilo 2 per 3 persone ......................................................................32 Fig.26: Profilo 1 famiglia-campione 4 persone ........................................................................33 Fig.27: Consumo medio profilo 1 per 4 persone ......................................................................33 Fig.28: Profilo 2 famiglia-campione 4 persone ........................................................................34 Fig.29: Consumo medio profilo 2 per 4 persone ......................................................................34 Fig.30: Statistiche giorni singoli per 2 persone........................................................................37 Fig.31: Statistiche giorni singoli per 3 persone........................................................................37 Fig.32: Statistiche giorni singoli per 4 persone........................................................................37 Fig.33: Statistiche giorni doppi per 2 persone..........................................................................38 Fig.34: Statistiche giorni doppi per 3 persone..........................................................................38 Fig.35: Statistiche giorni doppi per 4 persone..........................................................................38 Fig.36: Statistiche giorni tripli per 2 persone...........................................................................39 Fig.37: Statistiche giorni tripli per 3 persone...........................................................................39 Fig.38: Statistiche giorni tripli per 4 persone...........................................................................39 Fig.39: Esempio di Approssimazione costante a tratti .............................................................43 Fig.40: Approssimazione a tratti e istogramma 2 persone .......................................................47 Fig.41: Approssimazione a tratti e istogramma 3 persone .......................................................48 Fig.42: Approssimazione a tratti e istogramma 4 persone .......................................................48 Fig.43: Correlazione normalizzata prima prova ......................................................................49 Fig.44: Profili diversi per ogni famiglia-campione ..................................................................49 Fig.45: Medie degli istogrammi sul consumo giornaliero........................................................50 Fig.46: Correlazioni normalizzate seconda prova....................................................................51 Fig.47: Interfaccia Matlab ........................................................................................................52 Fig.48: Identificazione profilo totale 2 persone........................................................................53
86
Fig.49: Identificazione profilo totale 3 persone........................................................................54 Fig.50: Identificazione profilo totale 4 persone........................................................................54 Fig.51: Identificazione profilo parziale 2 persone....................................................................55 Fig.52: Identificazione profilo parziale 3 persone....................................................................55 Fig.53: Identificazione profilo parziale 4 persone....................................................................55 Fig.54: Identificazione profilo 2 persone seconda prova .........................................................56 Fig.55: Identificazione profilo 3 persone seconda prova .........................................................57 Fig.56: Identificazione profilo 4 persone seconda prova .........................................................57 Fig.57: Soglie di identificazione profili totali prima prova ......................................................59 Fig.58: Soglie di identificazione profili parziali prima prova ..................................................60 Fig.59: Soglie di identificazione profili totali seconda prova...................................................61 Fig.60: Passi eseguiti per valutare un intrusione [25.] ............................................................67 Fig.61: Assegnamento del valore di score [25.] .......................................................................68 Fig.62: Componenti fondamentali di un IDS [57] ....................................................................69 Fig.63: Rete sperimentale per la valutazione dello strumento ADS [30.] ................................71 Fig.64: Metriche generali [32.] ................................................................................................72 Fig.65: Metriche per-attack [32.] .............................................................................................72
87
RINGRAZIAMENTI
Ringrazio il Prof. Roberto Cusani per la fiducia, per la disponibilità e i consigli che mi ha dato
riguardo l’organizzazione e la stesura della tesi, per la pazienza e la cura con cui mi ha guidata
nelle varie fasi di sviluppo del progetto, trasmettendomi le sue conoscenze e fornendomi un
ottimo esempio di serietà e di professionalità.
I miei più sentiti ringraziamenti vanno alle persone che ho avuto modo di conoscere in questo
importante periodo della mia vita e che mi hanno aiutato a crescere sia dal punto di vista
intellettuale sia dal punto di vista umano. Ringrazio tutti i miei colleghi ed amici per l’appoggio
e la comprensione dimostrati in tutti questi anni.
Ringrazio Cristina, Davide e Valerio, i miei compagni di studio, per avermi costantemente
incoraggiato e perché è grazie a voi e al tempo passato insieme a studiare durante questi anni che
ho sempre trovato la forza di non arrendermi; vi ringrazio per la vostra amicizia.
Ringrazio mia madre e la mia famiglia per avermi insegnato cosa significhi il sacrificio, per
aver creduto sempre in me e per essermi stata vicina, soprattutto nei brutti periodi; per ultimo ma
non per ordine di importanza, vorrei ringraziare Umberto che ha contribuito alla realizzazione di
questo mio grande sogno standomi sempre accanto e credendo in me anche nei momenti di
difficoltà.
Ringrazio i membri di questa commissione d’esame per l’attenzione prestata all’elaborato.