Presentazione Pre Laurea Finale

27
Progetto e realizzazione Progetto e realizzazione di stimatori predittivi di stimatori predittivi con tecniche di Genetic con tecniche di Genetic Programming Programming Relatore: Prof. Alberto BARTOLI Correlatore: Ing. Giorgio DAVANZO Laureando: Gabriele Del Prete

description

 

Transcript of Presentazione Pre Laurea Finale

Page 1: Presentazione Pre Laurea Finale

Progetto e realizzazione di Progetto e realizzazione di stimatori predittivi con tecniche di stimatori predittivi con tecniche di

Genetic ProgrammingGenetic Programming

Relatore:

Prof. Alberto BARTOLI

Correlatore:

Ing. Giorgio DAVANZO

Laureando:

Gabriele Del Prete

Page 2: Presentazione Pre Laurea Finale

IntroduzioneIntroduzione

Page 3: Presentazione Pre Laurea Finale

ProblemaProblema

Mercato elettricità liberalizzatoMercato elettricità liberalizzato Acquisto/vendita elettricità tramite asteAcquisto/vendita elettricità tramite aste

aste Day-Aheadaste Day-Ahead

Importante saper predirre andamentoImportante saper predirre andamento dei consumidei consumi dei prezzidei prezzi fini economici/finanziarifini economici/finanziari altri finialtri fini

Come creo lo stimatore?Come creo lo stimatore?

Page 4: Presentazione Pre Laurea Finale

Metodi statisticiMetodi statistici

Soluzione classica: stimatori per serie temporali Soluzione classica: stimatori per serie temporali con metodi statisticicon metodi statistici

Necessarie ipotesi a priori sul sistemaNecessarie ipotesi a priori sul sistema Ipotesi a priori non possono essere verificate a posterioriIpotesi a priori non possono essere verificate a posteriori

Spesso necessario preprocessingSpesso necessario preprocessing Sostituzione valori con log(valori)Sostituzione valori con log(valori) Eliminazione di valori outlierEliminazione di valori outlier Eliminazione giornate problematicheEliminazione giornate problematiche

Spesso necessarie variabili esogeneSpesso necessarie variabili esogene Spesso realizzo molteplici modelliSpesso realizzo molteplici modelli

1 modello per ogni ora del giorno1 modello per ogni ora del giorno

Page 5: Presentazione Pre Laurea Finale

Regressione simbolica con GPRegressione simbolica con GP

Soluzione proposta: regressione Soluzione proposta: regressione simbolicasimbolica:: ho numerose osservazioni;ho numerose osservazioni; desidero una forma desidero una forma analiticaanalitica che le riassume che le riassume

GP è un modo per risolvere il problemaGP è un modo per risolvere il problema TipicamenteTipicamente

Sequenza osservazioni variabile indipendenteSequenza osservazioni variabile indipendente(o variabili indipendenti)(o variabili indipendenti)

Sequenza osservazioni variabile dipendenteSequenza osservazioni variabile dipendente Scopro f che lega var. indipendenti e var. dipendenteScopro f che lega var. indipendenti e var. dipendente

Page 6: Presentazione Pre Laurea Finale

Genetic ProgrammingGenetic Programming

Paradigma di calcolo per la generazione automatica di Paradigma di calcolo per la generazione automatica di algoritmi (algoritmi (individuiindividui) fortemente ispirato alla selezione ) fortemente ispirato alla selezione naturale.naturale.

GP per regressione simbolica:GP per regressione simbolica:individuoindividuo == == Abstract Syntax Tree (AST)Abstract Syntax Tree (AST)

Nodi interni: funzioni 1 o 2 argomentiNodi interni: funzioni 1 o 2 argomenti

Nodi foglia: costanti, var. indipendenti, backshift var. dipendenteNodi foglia: costanti, var. indipendenti, backshift var. dipendente

xyx

xyx

3.1

)1()3.01()(

Page 7: Presentazione Pre Laurea Finale

Genetic ProgrammingGenetic Programming

PopolazionePopolazione iniziale di iniziale di individuiindividui casuali ( casuali (500).500). Ripetizione:Ripetizione:

Valuta individui, sceglie migliori (prestazioni su training Valuta individui, sceglie migliori (prestazioni su training set)set)

““Mescola” individui migliori e crea nuova popolazioneMescola” individui migliori e crea nuova popolazione

Criterio di terminazione:Criterio di terminazione: Prestazioni “ottime”;Prestazioni “ottime”; Numero massimo predefinito di iterazioni Numero massimo predefinito di iterazioni

((generazionigenerazioni);); Timeout.Timeout.

Page 8: Presentazione Pre Laurea Finale

Genetic ProgrammingGenetic Programming

Page 9: Presentazione Pre Laurea Finale

MetodologiaMetodologia

Page 10: Presentazione Pre Laurea Finale

MetodologiaMetodologia

Istanze problema: Istanze problema: consumiconsumi California, New California, New York City; York City; prezziprezzi California California

1.1. GP stocastico GP stocastico → N evoluzioni→ N evoluzioni (su training set) (su training set)

2.2. Scelta migliore stimatore tra gli N (prestazioni su Scelta migliore stimatore tra gli N (prestazioni su validation set)validation set)

3.3. Valutazione capacità predittive (prestazioni su testing Valutazione capacità predittive (prestazioni su testing set)set)

GP → Evolutionary DesignGP → Evolutionary Design Resto → script bash, R, gnuplotResto → script bash, R, gnuplot

ttTrainingTraining ValidationValidation TestingTesting

Page 11: Presentazione Pre Laurea Finale

Scelta miglioreScelta migliore

Processo di evoluzione stocasticoProcesso di evoluzione stocastico

Necessario fare molte prove/evoluzioni (Necessario fare molte prove/evoluzioni ( jobjob) )

N job N job → N individui → N soluzioni→ N individui → N soluzioni

Necessario criterio per scegliere migliore tra gli Necessario criterio per scegliere migliore tra gli NN

Page 12: Presentazione Pre Laurea Finale

Scelta miglioreScelta migliore Criterio di scelta: minima WMAE mediaCriterio di scelta: minima WMAE media

su validation set (criterio della letteratura)su validation set (criterio della letteratura) WMAE: Weekly-weighted Mean Absolute WMAE: Weekly-weighted Mean Absolute

ErrorError

YYii serie osservata, serie osservata, ŶŶii serie prodotta da serie prodotta da

individuoindividuo

168

1

168

1

1681

ˆ168

1

ii

iii

Y

YYWMAE

Page 13: Presentazione Pre Laurea Finale

Capacità predittivaCapacità predittiva

Applicazione migliore su “serie di dati mai vista Applicazione migliore su “serie di dati mai vista prima” (testing set)prima” (testing set)

Estrazione statistiche, graficiEstrazione statistiche, grafici

Confronto con risultati in letteraturaConfronto con risultati in letteratura Scelta intervalli di training, validation, testing Scelta intervalli di training, validation, testing

coincidenti con riferimenticoincidenti con riferimenti

ttTestingTestingValidationValidationTrainingTraining

Page 14: Presentazione Pre Laurea Finale

RisultatiRisultati

Page 15: Presentazione Pre Laurea Finale

California, consumi: configurazioneCalifornia, consumi: configurazione

5/7/99 – 20/10/005/7/99 – 20/10/00 8 sett. / 2 sett. / 31 giorni8 sett. / 2 sett. / 31 giorni Configurazione per GPConfigurazione per GP

500 individui, 900 generazioni500 individui, 900 generazioni +, -, *, /+, -, *, / Costanti: 0.1, 1, 10Costanti: 0.1, 1, 10 HOUR(0), ISHOLISATSUN(0, -24, -25, -168)HOUR(0), ISHOLISATSUN(0, -24, -25, -168) Osservazioni passate: (-24, -25, -168)Osservazioni passate: (-24, -25, -168)

Page 16: Presentazione Pre Laurea Finale

California, consumi: risultatiCalifornia, consumi: risultati

TargetTarget WMAE media su testing: 2,95%WMAE media su testing: 2,95%

(IEEE Transactions on Power Systems, Vol. 17, No. 2, May 02)(IEEE Transactions on Power Systems, Vol. 17, No. 2, May 02)

RisultatiRisultati WMAE media su testing: 3,62%WMAE media su testing: 3,62%

Page 17: Presentazione Pre Laurea Finale

California, consumi: testing setCalifornia, consumi: testing set

Page 18: Presentazione Pre Laurea Finale

California, prezzi: configurazioneCalifornia, prezzi: configurazione

5/7/99 – 11/6/005/7/99 – 11/6/00 29 sett. / 9 sett. / 70 giorni29 sett. / 9 sett. / 70 giorni Configurazione per GPConfigurazione per GP

500 individui, 900 generazioni500 individui, 900 generazioni +, -, *, /+, -, *, / Costanti: 0.1, 1, 10Costanti: 0.1, 1, 10 HOUR(0), ISHOLISATSUN(0, -24, -25, -168), HOUR(0), ISHOLISATSUN(0, -24, -25, -168),

ISNIGHT(0, -24, -25, -168)ISNIGHT(0, -24, -25, -168) Osservazioni passate: (-24, -25, -168)Osservazioni passate: (-24, -25, -168)

Page 19: Presentazione Pre Laurea Finale

California, prezzi:California, prezzi:premessa sul targetpremessa sul target

Target Target (International Journal of Forecasting 2008)(International Journal of Forecasting 2008) 12 modelli diversi12 modelli diversi Ognuno calibrato 24 volte, per ogni ora del giornoOgnuno calibrato 24 volte, per ogni ora del giorno Ognuno ri-calibrato ogni giornoOgnuno ri-calibrato ogni giorno Il WMAE settimanale è il migliore fra i 12 modelliIl WMAE settimanale è il migliore fra i 12 modelli

Nostro approccioNostro approccio 1 modello1 modello valido su tutte le 24 orevalido su tutte le 24 ore 1 calibrazione1 calibrazione

Page 20: Presentazione Pre Laurea Finale

California, prezzi: risultatiCalifornia, prezzi: risultati

TargetTarget WMAE media su testing: 12,65%WMAE media su testing: 12,65% WMAE massima su testing: 43,43%WMAE massima su testing: 43,43%

(disponibile WMAE singole settimane)(disponibile WMAE singole settimane)

RisultatiRisultati WMAE media su testing: 15,14%WMAE media su testing: 15,14% WMAE massima su testing: 44,01%WMAE massima su testing: 44,01%

Page 21: Presentazione Pre Laurea Finale

California, prezzi: testing setCalifornia, prezzi: testing set

Page 22: Presentazione Pre Laurea Finale

New York, consumi: configurazioneNew York, consumi: configurazione

15/9/03 – 28/2/04 15/9/03 – 28/2/04 8 sett. / 2 sett. / 31 giorni 8 sett. / 2 sett. / 31 giorni no Ott 03no Ott 03

Configurazione per GPConfigurazione per GP 500 individui, 900 generazioni500 individui, 900 generazioni +, -, *, /+, -, *, / Osservazioni passate: (-24, -25, -168)Osservazioni passate: (-24, -25, -168) Costanti: 0.1, 1, 10Costanti: 0.1, 1, 10 HOUR(0), ISHOLISATSUN(0, -24, -25, -168)HOUR(0), ISHOLISATSUN(0, -24, -25, -168)

Page 23: Presentazione Pre Laurea Finale

New York, consumi:New York, consumi:premessa sul targetpremessa sul target

TargetTarget (IEEE Transactions on Power Systems, Vol. 21, No. 1, Feb 06)(IEEE Transactions on Power Systems, Vol. 21, No. 1, Feb 06) 2 stadi (self-organizing map, support vector machine)2 stadi (self-organizing map, support vector machine) Ognuno calibrato 24 volte, per ogni ora del giornoOgnuno calibrato 24 volte, per ogni ora del giorno Secondo stadio duplicato, per giorni Secondo stadio duplicato, per giorni

“normali”/“anormali”“normali”/“anormali” Numerose variabili esogene (temperatura, umidità,…) Numerose variabili esogene (temperatura, umidità,…)

e calibrazione molto complessae calibrazione molto complessa Variabili esogene distinte per primo e secondo stadioVariabili esogene distinte per primo e secondo stadio

Page 24: Presentazione Pre Laurea Finale

New York, consumi: risultatiNew York, consumi: risultati

TargetTarget WMAE media su testing: 1,82%WMAE media su testing: 1,82%

RisultatiRisultati WMAE media su testing: 3,14%WMAE media su testing: 3,14%

Page 25: Presentazione Pre Laurea Finale

New York, consumi: testing setNew York, consumi: testing set

Page 26: Presentazione Pre Laurea Finale

ConclusioniConclusioni

Page 27: Presentazione Pre Laurea Finale

ConclusioniConclusioni

Risultati non “definitivi” ma estremamente promettentiRisultati non “definitivi” ma estremamente promettenti Prestazioni quasi uguali – poco peggiori – dei riferimentiPrestazioni quasi uguali – poco peggiori – dei riferimenti Ma nessun uso di:Ma nessun uso di:

Variabili esogeneVariabili esogene PreprocessingPreprocessing

Modelli differenziati (ora, giorno, etc)Modelli differenziati (ora, giorno, etc)

In corso approfondimentiIn corso approfondimenti Altre variabili indipendenti non esogene?Altre variabili indipendenti non esogene?

(max sul giorno precedente; errore sul giorno precedente)(max sul giorno precedente; errore sul giorno precedente)