Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando...
Transcript of Sistemi Informativi per le decisioniSistemi … Data reductionreduction Viene effettuata quando...
Sistemi Informativi per le decisioniSistemi Informativi per le decisioniProfessore Professore Ing.Ing. Marco PatellaMarco Patella
Anno accademico 2006 Anno accademico 2006 -- 20072007
Presentazione a cura diPresentazione a cura di
Di Leo Valentina Di Leo Valentina -- PalmieriPalmieri FrancescoFrancesco
Knowledge DiscoveryKnowledge DiscoveryLa La maggiormaggior parte parte delledelle aziendeaziende disponedispone
di di enormienormi database database contenenticontenenti datidati di di tipotipo operativooperativo
QuesteQueste basibasi di di datidati costituisconocostituisconounauna potenzialepotenziale minieraminiera di di utiliutili
informazioniinformazioni
Dai dati alla conoscenzaDai dati alla conoscenzadati selezionati
dati processatidati trasformati
pattern
conoscenza
DATA MINING
Miner3D Miner3D èè un software di analisi, un software di analisi, visualizzazione ed esplorazione di dati visualizzazione ed esplorazione di dati multidimensionalimultidimensionali, con un'interfaccia , con un'interfaccia
potente ed intuitiva, che consente potente ed intuitiva, che consente anche ad utenti meno esperti di anche ad utenti meno esperti di
ottenere le informazioni utili per le ottenere le informazioni utili per le decisioni aziendali.decisioni aziendali.
MinerMiner 3D3D
CaratteristicheCaratteristicheMinerMiner 3D3D
EnterpriseEnterpriseMinerMiner 3D3D
ProfessionalProfessionalMinerMiner 3D3D
BasicBasicPower Power UserUser InterfaceInterface SISI SISI SISI
SelectorSelector SISI SISI
StatisticsStatistics SISI SISI
PrincipalPrincipal ComponentsComponents AnalysisAnalysis(PCA)(PCA) SISI SISI
KK--meansmeans ClusteringClustering SISI
Database Database ConnectivityConnectivity SISI
Microsoft Excel Microsoft Excel InstantInstantConnectivityConnectivity
SISI SISI SISI
Data Data PickingPicking SISI SISI SISI
Movie RecorderMovie Recorder SISI SISI SISI
Model Model TemplatesTemplates SISI SISI SISI
SynthesizedSynthesized SpeechSpeech and and SoundsSoundsSISI SISI SISI
Versioni e funzionalitVersioni e funzionalitàà
Come funziona?Come funziona?• Miner 3D preleva i dati direttamente dal database
aziendale o foglio di lavoro Excel per creare un modello
• Un alto livello di flessibilità permette all’utente di generare virtualmente una serie illimitata di combinazioni di tipi di grafici 2D e 3D
• L’interfaccia user-friendly consente di interagire col programma per incrementare il grado di personalizzazione
•• LL’’intuizione umana rimane insostituibile per intuizione umana rimane insostituibile per ll’’interpretazione dei risultatiinterpretazione dei risultati
Caricamento DatiCaricamento Dati
•• ExcelExcel•• Database (Database (SQL Server, SQL Server,
Oracle, IBM DB2, Oracle, IBM DB2, MySQLMySQL, Access), Access)
•• Data Data filesfiles (CSV, TXT, DBF)(CSV, TXT, DBF)•• UnicodeUnicode•• ClipboardClipboard
Il programma consente lIl programma consente l’’aggiornamento dei dati aggiornamento dei dati sia manuale, sia con il comando sia manuale, sia con il comando autoauto--refreshrefresh
MinerMiner 3D consente di importare 3D consente di importare diversi formati di dati:diversi formati di dati:
Data Data OrganizationOrganizationI dati devono essere organizzati in colonne dove la prima I dati devono essere organizzati in colonne dove la prima riga riga èè ll’’identificativo e le altre contengono tipi di dati similiidentificativo e le altre contengono tipi di dati simili
ModelliModelliLa parte piLa parte piùù critica per lcritica per l’’analisi analisi èè la scelta del modello la scelta del modello
maggiormente adeguato al maggiormente adeguato al datasetdataset. Il software non . Il software non èè in grado di scegliere il modello ottimalein grado di scegliere il modello ottimale
Modelli di base:Modelli di base:•• ScatterScatter 2D / 3D2D / 3D•• BarsBars 2D / 3D2D / 3D•• LinesLines•• TilesTiles•• HeatHeat mapmap•• SurfaceSurface
ProprietProprietàà dei modelli (1)dei modelli (1)
•• TransformationTransformation•• LinearLinear
•• ExponentialExponential
•• LogarithmicLogarithmic
•• ScaleScale
•• GainGain
•• BiasBias
•• NoiseNoise
Opzioni di Opzioni di rappresentazione dei dati:rappresentazione dei dati:
ProprietProprietàà dei modelli (2)dei modelli (2)
ProprietProprietàà grafichegrafiche•• ColorColor•• SizeSize ((dimensiondimension X, Y, Z)X, Y, Z)•• HeightHeight ((dimensiondimension Z)Z)•• Base Base sizesize ((dimensiondimension X, Y)X, Y)•• DimensionDimension X, YX, Y•• AxesAxes X, Y, ZX, Y, Z•• Rotation X, Y, ZRotation X, Y, Z•• ShapeShape•• LabelLabel•• TextureTexture
ProprietProprietàà audioaudio•• Sound Sound effecteffect, , frequencyfrequency, volume, , volume, panningpanning, , speechspeech
SelettoreSelettoreIl selettore Il selettore èè uno strumento interattivo e uno strumento interattivo e
visivo per la creazione di visivo per la creazione di queryquery (OLAP)(OLAP)
Comandi di selezione:Comandi di selezione:•• RangeRange•• ItemsItems•• SampleSample•• SubstringSubstring
StatisticheStatistiche•• Le statistiche base sono calcolate automaticamente Le statistiche base sono calcolate automaticamente
al lancio del modello e possono essere al lancio del modello e possono essere personalizzate.personalizzate.
•• La finestra statistiche si aggiorna La finestra statistiche si aggiorna automaticamente al variare delleautomaticamente al variare delleselezioni operate dallselezioni operate dall’’utente. utente.
•• Le funzioni disponibili sono: Le funzioni disponibili sono: Media, Max, Media, Max, MinMin, Somma., Somma.
Mediana, Moda, Conteggio, Mediana, Moda, Conteggio, Deviazione standard. Deviazione standard.
VisteVisteLa sezione viste modifica lo spazio di visualizzazione del modelLa sezione viste modifica lo spazio di visualizzazione del modello. lo.
•• CaptionCaption•• AxesAxes•• LatticesLattices•• FrameFrame•• WaterlevelWaterlevel•• FontsFonts•• ColorsColors•• CollarsCollars•• CameraCamera
Data Data reductionreductionViene effettuata quando vengono analizzati data set troppo numerViene effettuata quando vengono analizzati data set troppo numerosiosi
RowRow reductionreduction•• KeepKeep allall rowsrows: forza il programma a caricare l: forza il programma a caricare l’’intero data setintero data set•• KK--meansmeans ClusteringClustering: : clusterizzaclusterizza le le tupletuple•• RandomRandom selectionselection: seleziona una percentuale o un numero di : seleziona una percentuale o un numero di tupletuple
da caricareda caricare•• UniformUniform selectionselection: carica una : carica una tuplatupla ogni N oppure un ogni N oppure un rangerange di di
tupletuple
PrincipalPrincipal ComponentsComponents AnalysisAnalysis (PCA)(PCA)•• Estrapola un sottoinsieme di dimensioni rilevanti per lEstrapola un sottoinsieme di dimensioni rilevanti per l’’analisi, pianalisi, piùù
semplici da visualizzare e da gestire per le proprie esigenze disemplici da visualizzare e da gestire per le proprie esigenze direportsreports e di calcolo.e di calcolo.
FunzionalitFunzionalitàà avanzate: avanzate: KK--meansmeans•• KK--MeansMeans ClusteringClustering e e KK--MeansMeans Data Data ReductionReduction
offrono diverse opzioni per processare insieme di offrono diverse opzioni per processare insieme di dati di grosse dimensioni. Questi metodi possono dati di grosse dimensioni. Questi metodi possono essere usati sia su essere usati sia su clustercluster data data setssets visualizzati in visualizzati in 3D o per la riduzione e compressione dei 3D o per la riduzione e compressione dei databasesdatabases..
•• Il metodo Il metodo KK--MeansMeans implementato implementato in Miner3D utilizza un algoritmo in Miner3D utilizza un algoritmo proprietario ad alte prestazioni, proprietario ad alte prestazioni, basato su algoritmi di filtro e di basato su algoritmi di filtro e di ricerca ricerca multidimensionalmultidimensional binarybinarysearch search treestrees..
Salvataggio dei risultatiSalvataggio dei risultati•• ModelloModello
((xmlxml))
•• ReportReport((htmlhtml))
•• ImmaginiImmagini((bmpbmp, , jpgjpg, , tiftif, , tgatga, , pngpng))
•• VideoVideo(avi)(avi)
Vantaggi di Vantaggi di MinerMiner 3D3D
•• Visualizzazione dei datiVisualizzazione dei dati
•• SemplicitSemplicitàà dd’’usouso
•• FlessibilitFlessibilitàà
•• Potenza di calcoloPotenza di calcolo
•• InterattivitInterattivitàà
•• Personalizzazione Personalizzazione
…… E ora un E ora un esempioesempio……