Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando...

19
Sistemi Informativi per le decisioni Sistemi Informativi per le decisioni Professore Professore Ing. Ing. Marco Patella Marco Patella Anno accademico 2006 Anno accademico 2006 - - 2007 2007 Presentazione a cura di Presentazione a cura di Di Leo Valentina Di Leo Valentina - - Palmieri Palmieri Francesco Francesco

Transcript of Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando...

Page 1: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Sistemi Informativi per le decisioniSistemi Informativi per le decisioniProfessore Professore Ing.Ing. Marco PatellaMarco Patella

Anno accademico 2006 Anno accademico 2006 -- 20072007

Presentazione a cura diPresentazione a cura di

Di Leo Valentina Di Leo Valentina -- PalmieriPalmieri FrancescoFrancesco

Page 2: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Knowledge DiscoveryKnowledge DiscoveryLa La maggiormaggior parte parte delledelle aziendeaziende disponedispone

di di enormienormi database database contenenticontenenti datidati di di tipotipo operativooperativo

QuesteQueste basibasi di di datidati costituisconocostituisconounauna potenzialepotenziale minieraminiera di di utiliutili

informazioniinformazioni

Page 3: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Dai dati alla conoscenzaDai dati alla conoscenzadati selezionati

dati processatidati trasformati

pattern

conoscenza

DATA MINING

Page 4: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Miner3D Miner3D èè un software di analisi, un software di analisi, visualizzazione ed esplorazione di dati visualizzazione ed esplorazione di dati multidimensionalimultidimensionali, con un'interfaccia , con un'interfaccia

potente ed intuitiva, che consente potente ed intuitiva, che consente anche ad utenti meno esperti di anche ad utenti meno esperti di

ottenere le informazioni utili per le ottenere le informazioni utili per le decisioni aziendali.decisioni aziendali.

MinerMiner 3D3D

Page 5: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

CaratteristicheCaratteristicheMinerMiner 3D3D

EnterpriseEnterpriseMinerMiner 3D3D

ProfessionalProfessionalMinerMiner 3D3D

BasicBasicPower Power UserUser InterfaceInterface SISI SISI SISI

SelectorSelector SISI SISI

StatisticsStatistics SISI SISI

PrincipalPrincipal ComponentsComponents AnalysisAnalysis(PCA)(PCA) SISI SISI

KK--meansmeans ClusteringClustering SISI

Database Database ConnectivityConnectivity SISI

Microsoft Excel Microsoft Excel InstantInstantConnectivityConnectivity

SISI SISI SISI

Data Data PickingPicking SISI SISI SISI

Movie RecorderMovie Recorder SISI SISI SISI

Model Model TemplatesTemplates SISI SISI SISI

SynthesizedSynthesized SpeechSpeech and and SoundsSoundsSISI SISI SISI

Versioni e funzionalitVersioni e funzionalitàà

Page 6: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Come funziona?Come funziona?• Miner 3D preleva i dati direttamente dal database

aziendale o foglio di lavoro Excel per creare un modello

• Un alto livello di flessibilità permette all’utente di generare virtualmente una serie illimitata di combinazioni di tipi di grafici 2D e 3D

• L’interfaccia user-friendly consente di interagire col programma per incrementare il grado di personalizzazione

•• LL’’intuizione umana rimane insostituibile per intuizione umana rimane insostituibile per ll’’interpretazione dei risultatiinterpretazione dei risultati

Page 7: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Caricamento DatiCaricamento Dati

•• ExcelExcel•• Database (Database (SQL Server, SQL Server,

Oracle, IBM DB2, Oracle, IBM DB2, MySQLMySQL, Access), Access)

•• Data Data filesfiles (CSV, TXT, DBF)(CSV, TXT, DBF)•• UnicodeUnicode•• ClipboardClipboard

Il programma consente lIl programma consente l’’aggiornamento dei dati aggiornamento dei dati sia manuale, sia con il comando sia manuale, sia con il comando autoauto--refreshrefresh

MinerMiner 3D consente di importare 3D consente di importare diversi formati di dati:diversi formati di dati:

Page 8: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Data Data OrganizationOrganizationI dati devono essere organizzati in colonne dove la prima I dati devono essere organizzati in colonne dove la prima riga riga èè ll’’identificativo e le altre contengono tipi di dati similiidentificativo e le altre contengono tipi di dati simili

Page 9: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

ModelliModelliLa parte piLa parte piùù critica per lcritica per l’’analisi analisi èè la scelta del modello la scelta del modello

maggiormente adeguato al maggiormente adeguato al datasetdataset. Il software non . Il software non èè in grado di scegliere il modello ottimalein grado di scegliere il modello ottimale

Modelli di base:Modelli di base:•• ScatterScatter 2D / 3D2D / 3D•• BarsBars 2D / 3D2D / 3D•• LinesLines•• TilesTiles•• HeatHeat mapmap•• SurfaceSurface

Page 10: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

ProprietProprietàà dei modelli (1)dei modelli (1)

•• TransformationTransformation•• LinearLinear

•• ExponentialExponential

•• LogarithmicLogarithmic

•• ScaleScale

•• GainGain

•• BiasBias

•• NoiseNoise

Opzioni di Opzioni di rappresentazione dei dati:rappresentazione dei dati:

Page 11: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

ProprietProprietàà dei modelli (2)dei modelli (2)

ProprietProprietàà grafichegrafiche•• ColorColor•• SizeSize ((dimensiondimension X, Y, Z)X, Y, Z)•• HeightHeight ((dimensiondimension Z)Z)•• Base Base sizesize ((dimensiondimension X, Y)X, Y)•• DimensionDimension X, YX, Y•• AxesAxes X, Y, ZX, Y, Z•• Rotation X, Y, ZRotation X, Y, Z•• ShapeShape•• LabelLabel•• TextureTexture

ProprietProprietàà audioaudio•• Sound Sound effecteffect, , frequencyfrequency, volume, , volume, panningpanning, , speechspeech

Page 12: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

SelettoreSelettoreIl selettore Il selettore èè uno strumento interattivo e uno strumento interattivo e

visivo per la creazione di visivo per la creazione di queryquery (OLAP)(OLAP)

Comandi di selezione:Comandi di selezione:•• RangeRange•• ItemsItems•• SampleSample•• SubstringSubstring

Page 13: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

StatisticheStatistiche•• Le statistiche base sono calcolate automaticamente Le statistiche base sono calcolate automaticamente

al lancio del modello e possono essere al lancio del modello e possono essere personalizzate.personalizzate.

•• La finestra statistiche si aggiorna La finestra statistiche si aggiorna automaticamente al variare delleautomaticamente al variare delleselezioni operate dallselezioni operate dall’’utente. utente.

•• Le funzioni disponibili sono: Le funzioni disponibili sono: Media, Max, Media, Max, MinMin, Somma., Somma.

Mediana, Moda, Conteggio, Mediana, Moda, Conteggio, Deviazione standard. Deviazione standard.

Page 14: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

VisteVisteLa sezione viste modifica lo spazio di visualizzazione del modelLa sezione viste modifica lo spazio di visualizzazione del modello. lo.

•• CaptionCaption•• AxesAxes•• LatticesLattices•• FrameFrame•• WaterlevelWaterlevel•• FontsFonts•• ColorsColors•• CollarsCollars•• CameraCamera

Page 15: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Data Data reductionreductionViene effettuata quando vengono analizzati data set troppo numerViene effettuata quando vengono analizzati data set troppo numerosiosi

RowRow reductionreduction•• KeepKeep allall rowsrows: forza il programma a caricare l: forza il programma a caricare l’’intero data setintero data set•• KK--meansmeans ClusteringClustering: : clusterizzaclusterizza le le tupletuple•• RandomRandom selectionselection: seleziona una percentuale o un numero di : seleziona una percentuale o un numero di tupletuple

da caricareda caricare•• UniformUniform selectionselection: carica una : carica una tuplatupla ogni N oppure un ogni N oppure un rangerange di di

tupletuple

PrincipalPrincipal ComponentsComponents AnalysisAnalysis (PCA)(PCA)•• Estrapola un sottoinsieme di dimensioni rilevanti per lEstrapola un sottoinsieme di dimensioni rilevanti per l’’analisi, pianalisi, piùù

semplici da visualizzare e da gestire per le proprie esigenze disemplici da visualizzare e da gestire per le proprie esigenze direportsreports e di calcolo.e di calcolo.

Page 16: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

FunzionalitFunzionalitàà avanzate: avanzate: KK--meansmeans•• KK--MeansMeans ClusteringClustering e e KK--MeansMeans Data Data ReductionReduction

offrono diverse opzioni per processare insieme di offrono diverse opzioni per processare insieme di dati di grosse dimensioni. Questi metodi possono dati di grosse dimensioni. Questi metodi possono essere usati sia su essere usati sia su clustercluster data data setssets visualizzati in visualizzati in 3D o per la riduzione e compressione dei 3D o per la riduzione e compressione dei databasesdatabases..

•• Il metodo Il metodo KK--MeansMeans implementato implementato in Miner3D utilizza un algoritmo in Miner3D utilizza un algoritmo proprietario ad alte prestazioni, proprietario ad alte prestazioni, basato su algoritmi di filtro e di basato su algoritmi di filtro e di ricerca ricerca multidimensionalmultidimensional binarybinarysearch search treestrees..

Page 17: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Salvataggio dei risultatiSalvataggio dei risultati•• ModelloModello

((xmlxml))

•• ReportReport((htmlhtml))

•• ImmaginiImmagini((bmpbmp, , jpgjpg, , tiftif, , tgatga, , pngpng))

•• VideoVideo(avi)(avi)

Page 18: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

Vantaggi di Vantaggi di MinerMiner 3D3D

•• Visualizzazione dei datiVisualizzazione dei dati

•• SemplicitSemplicitàà dd’’usouso

•• FlessibilitFlessibilitàà

•• Potenza di calcoloPotenza di calcolo

•• InterattivitInterattivitàà

•• Personalizzazione Personalizzazione

Page 19: Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • Keep all rows: forza il

…… E ora un E ora un esempioesempio……