Post on 03-Jun-2015
Introduzione alla Business Intelligencenei Sistemi Diagnostici ad alta Automazione
Walter Antonucci – Maurizio Lombardi
•PROCESSABILITA’;•ARCHIVIAZIONE;•MONITORAGGIO;•CONFRONTABILITA’
DATI DIGITALIZZAZIONE
PROCESSABILTITA’MODALITA’
diPRESENTAZIONE
RISORSE PERSONE INFORMAZIONI
INFORMAZIONI
SISTEMAINFORMATIVO
COM
PLES
SITA
’
INFO
RMAZ
ION
E
FABB
ISO
GN
O
INFO
RMAT
IVO
LIVE
LLO
DI
SERV
IZIO
ATT
ESO
Descrizione soggettiva
di un
evento
Dato:
ACQUISIZIONE ELABORAZIONE
TRASFERIMENTOARCHIVIAZIONE
Dato=
CONTENUTO + METADATI
DATI
REPOSITORY
DATA BASEMANAGEMENT
SYSTEMREPOSITORY
I Sistemi Tradizionali:
Inserimento delle informazioni in modo veloce ed efficace
Non consentono analisi significative in grado di produrre
vera e propria conoscenza
Non sono adatti all’inserimento di grandi quantità di dati
la semplice memorizzazione
di informazioni non può essere considerata
un obiettivo strategico da parte dell’organizzazione
PRODURRE CONOSCENZA
SUPPORTARE I PROCESSI
DECISIONALI
SISTEMI INTEGRATI NEI PROCESSI AZIENDALI E FORTEMENTE ORIENTATI ALLA MISSION DELL’ORGANIZZAZIONECON LO SCOPO DI FACILITARE QUATTRO FASI STRATEGICHEDELLA PIANIFICAZIONE AZIENDALE:
1.Previsione;2.Predizione;3.Simulazione;4.Costruzione di scenari alternativi
APPLICAZIONI DI
BUSINESS INTELLIGENCE
DIMENSIONE PROSPETTICAdell’ATTIVITA’
di MISURAZIONE ed ELABORAZIONE
SPESSO QUANDO CI SI RIFERISCE AD UN SISTEMA GESITIONALE ORIENTATO ALLA BUSINESS
INTELLIGENCE SI FA RIFERIMENTO AD APPLICAZIONI E
SISTEMI ALTRESI’ INDICATI CON IL TERMINE
DSS (DECISION SUPPORT SYSTEM)
CONOSCENZA
DATA MINING
Processo che consente di analizzare grandi quantità di dati
attraverso l’impiego di strumenti automatici o semiautomatici
al fine di scoprire ad esempio, associazioni fra dati ed indicatori,
regole, tendenze e schemi significativi, ecc
Le applicazioni di DATA MININGsi avvalgono
di una particolare forma di immagazzinamento dei
dati…
particolare modalità di immagazzinamento dei dati
nella quale la memorizzazione degli stessiavviene a diversi livelli di aggregazione
il che consente all’utilizzatore di poter analizzare i dati
praticamente in tempo reale e secondo prospettive differenti
1. Integrata;2.Orientata al soggetto;3.Variabile nel tempo;4.Non volatile
WEKA: the software
• Machine learning/data mining software written in Java (distributed under the GNU Public License)
• Used for research, education, and applications• Complements “Data Mining” by Witten & Frank• Main features:
– Comprehensive set of data pre-processing tools, learning algorithms and evaluation methods
– Graphical user interfaces (incl. data visualization)– Environment for comparing learning algorithms
@relation heart-disease-simplified
@attribute age numeric@attribute sex { female, male}@attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina}@attribute cholesterol numeric@attribute exercise_induced_angina { no, yes}@attribute class { present, not_present}
@data63,male,typ_angina,233,no,not_present67,male,asympt,286,yes,present67,male,asympt,229,yes,present38,female,non_anginal,?,no,not_present...
• Data can be imported from a file in various formats: ARFF, CSV, C4.5, binary
• Data can also be read from a URL or from an SQL database (using JDBC)
• Pre-processing tools in WEKA are called “filters”• WEKA contains filters for:
– Discretization, normalization, resampling, attribute selection, transforming and combining attributes, …
04/12/23 University of Waikato 33
• New graphical user interface for WEKA• Java-Beans-based interface for setting up and running
machine learning experiments• Data sources, classifiers, etc. are beans and can be
connected graphically• Data “flows” through components: e.g.,
“data source” -> “filter” -> “classifier” -> “evaluator”• Layouts can be saved and loaded again later