Verso una gestione IT delle organizzazioni fondata sulla realtà

105
Verso un supporto IT alle organizzazioni fondato sulla realtà Marco Montali Facoltà di Scienze e Tecnologie Informatiche Libera Università di Bolzano 1

Transcript of Verso una gestione IT delle organizzazioni fondata sulla realtà

Page 1: Verso una gestione IT delle organizzazioni fondata sulla realtà

Verso un supporto IT alle organizzazioni

fondato sulla realtà

Marco MontaliFacoltà di Scienze e Tecnologie Informatiche

Libera Università di Bolzano1

Page 2: Verso una gestione IT delle organizzazioni fondata sulla realtà

Disclaimer

• La realtà verrà necessariamente “semplificata”, talvolta portata all’estremo • Le critiche/provocazioni andranno viste in “positivo”.

Non per criticare lo stato attuale, ma per indicare strade da seguire nel prossimo futuro!2

Page 3: Verso una gestione IT delle organizzazioni fondata sulla realtà

Le due realtàGestione dell’organizzazione

Realtà aziendale studiata, analizzata, pianificata attraverso l’uso di modelli e di dati ottenuti sull’andamento dell’organizzazione

Lavoro quotidiano nell’organizzazione

Realtà aziendale esperita direttamente

3

Page 4: Verso una gestione IT delle organizzazioni fondata sulla realtà

Problema classicoGestione dell’organizzazione

Lavoro quotidiano nell’organizzazione

4

Page 5: Verso una gestione IT delle organizzazioni fondata sulla realtà

Il nostro obiettivoGestione dell’organizzazione

Lavoro quotidiano nell’organizzazione

5

IT

Page 6: Verso una gestione IT delle organizzazioni fondata sulla realtà

Alcune domande chiave• Come gestire la complessità nelle organizzazioni di oggi? • Chi prende le decisioni strategiche? Su quali basi? • Come coordinare le diverse competenze umane? • Di chi è la responsabilità? • Come far interagire gli esperti di dominio con gli esperti IT? • Cosa lasciare alla competenza dell’uomo? Cosa delegare alle

macchine? • Come comprendere la realtà aziendale? Come collezionare

informazioni importanti in tal senso? • Come collegare i modelli con la realtà? Come estrarre

informazioni utili per prendere decisioni strategiche fondate su questo collegamento?

6

Page 7: Verso una gestione IT delle organizzazioni fondata sulla realtà

Il grande dilemma

7

manager/ analista

responsabile IT

esperto di dominio

realtà

?? ? ??

Page 8: Verso una gestione IT delle organizzazioni fondata sulla realtà

Il grande dilemma

1. Come far interagire i diversi attori in modo da comprendere la realtà, costruire una visione comune, e condividere gli obiettivi strategici?

2. Come ripensare queste interazioni alla luce di nuovi dati ottenuti dalla realtà?

8

Page 9: Verso una gestione IT delle organizzazioni fondata sulla realtà

Cosa vedremo…• Introduzione progressiva di modelli di gestione

orientati ai processi nella gestione delle organizzazioni

• Il punto di discontinuità: data science

• Il tentativo azzardato di eliminare i modelli

• La riconciliazione tra dati e modelli: process mining

9

Page 10: Verso una gestione IT delle organizzazioni fondata sulla realtà

Modello

Rappresentazione di un oggetto o di un fenomeno, che corrisponde alla cosa modellata per il fatto di riprodurne alcune caratteristiche o comportamenti fondamentali

10

Page 11: Verso una gestione IT delle organizzazioni fondata sulla realtà

Modello

Rappresentazione di un oggetto o di un fenomeno, che corrisponde alla cosa modellata per il fatto di riprodurne alcune caratteristiche o comportamenti fondamentali

• Quali caratteristiche/comportamenti sono importanti? • Come verificare che questi siano riprodotti?

11

Page 12: Verso una gestione IT delle organizzazioni fondata sulla realtà

Modelli concettuali organizzativiIl “collante” fondamentale per colLavorare!

• La modellazione concettuale è “l’attività di descrivere formalmente alcuni aspetti del mondo fisico e sociale che ci circonda, al fine di comprendere e comunicare” (John Mylopoulos, 1992)

12

Page 13: Verso una gestione IT delle organizzazioni fondata sulla realtà

Modelli concettuali organizzativiIl “collante” fondamentale per colLavorare!

• “Una volta rappresentato come artefatto concreto, un modello supporta la comunicazione, l’apprendimento e l’analisi degli aspetti rilevanti del dominio di interesse. […] la rappresentazione diagrammata di un modello creata da uno sconosciuto diventa un medium per preservare e comunicare una certa visione del mondo, e può fungere da perno per il ragionamento e il problem solving, nonché l’acquisizione di nuova conoscenza (magari producendo nuove, folgoranti idee!) su quella visione del mondo” (Giancarlo Guizzardi, 2005)

13

Page 14: Verso una gestione IT delle organizzazioni fondata sulla realtà

14

Page 15: Verso una gestione IT delle organizzazioni fondata sulla realtà

15

Conceptual Modeling Languages: CriteriaClarity: how easy the language can be understood and used (by di�erentstakeholders).

• Graphical vs textual notations.• The language must be unambiguous: formal

foundation.• The more expressive the language, the more

di�cult is to retain clarity.• Less expressive languages require complex

combinations of their few constructs.• Abstraction: remove unnecessary details. Use requirements to drive

abstraction.• Simplicity: Prefer simple schemas. Follow Occam’s razor with a

critical approach.• Orthogonality: minimization of the overlapping of language

constructs. Their (in)dependence must reflect the one of thecorresponding domain aspects.

Marco Montali (unibz) DPM - 2.IS Development A.Y. 2014/2015 13 / 21

Page 16: Verso una gestione IT delle organizzazioni fondata sulla realtà

16

Un po’ di storia

Page 17: Verso una gestione IT delle organizzazioni fondata sulla realtà

La fabbrica degli spilli (1751-1766)

17

Page 18: Verso una gestione IT delle organizzazioni fondata sulla realtà

La fabbrica degli spilli (1751-1766)

18

Page 19: Verso una gestione IT delle organizzazioni fondata sulla realtà

F.W. Taylor (~1911)• Punto di partenza: le organizzazioni non sono organizzate secondo

principi solidi

• Impossibile misurarne l’efficienza e la qualità degli output

• Idea: applicare il metodo scientifico alla gestione delle organizzazioni • Decomposizione del lavoro in unità elementari • Analisi scientifica di ogni unità fissando confini e regole d’azione ben

definite • Acquisizione, training e controllo del personale secondo tali regole • Divisione di competenze: il management controlla, il personale agisce

• Risultato: divisione del lavoro (catena di montaggio), analisi dettagliata delle singole attività ma non del loro coordinamento

19

Page 20: Verso una gestione IT delle organizzazioni fondata sulla realtà

Attività nella catena del valore

20

Business Functions and Refinement into Activities

Hierarchy of businessfunctions follows theaggregation abstraction.Leaf business functionsare the activities.

Marco Montali (unibz) DPM - 7.BPM A.Y. 2014/2015 22 / 41

Page 21: Verso una gestione IT delle organizzazioni fondata sulla realtà

Hammer&Champy (1990s)• Punto di partenza: limiti della divisione del lavoro in attività isolate

• Visione end-to-end assente nel business, troppo burocratico e frammentato

• Idea: fondare il business sui processi e la loro re-ingegnerizzazione

• “Non è più necessario né desiderabile per le aziende organizzare il proprio lavoro attorno ai principi di divisione del lavoro di Adam Smith. Il lavoro orientato alle attività è obsoleto nel mondo odierno, competitivo e dinamico. Al contrario, le aziende devono organizzare il lavoro attorno al concetto di processo” (Hammer&Champy)

21

Page 22: Verso una gestione IT delle organizzazioni fondata sulla realtà

Coordinamento di attività

22

Functional Decomposition and Business Processes

To understand how the

enterprise works, and tomodel how it is expected

to work, dynamicconstraints over theexecution of activities aremade explicit in terms ofBPs: control-flow.

Marco Montali (unibz) DPM - 7.BPM A.Y. 2014/2015 26 / 41

Page 23: Verso una gestione IT delle organizzazioni fondata sulla realtà

Processo di business• Un insieme di attività eseguite al fine di raggiungere un

obiettivo aziendale per un cliente o mercato specifico (Davenport, 1992)

• Una collezione di attività che prendono uno o più input per trasformarli in un risultato che è di valore per il cliente (Hammer&Champy, 1993)

• Un insieme di attività eseguite in modo coordinato all’interno di un dominio organizzativo e tecnico. Tali attività realizzano, congiuntamente, un obiettivo strategico. Ogni processo è eseguito all’interno di un’organizzazione, ma può interagire con processi di altre organizzazioni (Weske, 2011)

23

Page 24: Verso una gestione IT delle organizzazioni fondata sulla realtà

24

Page 25: Verso una gestione IT delle organizzazioni fondata sulla realtà

Business Process Management

Un insieme di concetti, metodologie e tecniche per supportare la modellazione, amministrazione, configurazione, esecuzione, e analisi dei processi di business

25

Page 26: Verso una gestione IT delle organizzazioni fondata sulla realtà

Ciclo di vita dei processi

26

Page 27: Verso una gestione IT delle organizzazioni fondata sulla realtà

Business Process Lifecycle

27

8 1 Introduction

Fig. 1.3 The BPM life-cycle showing the different uses of process models

As Fig. 1.3 shows, process models play a dominant role in the (re)design andconfiguration/implementation phases, whereas data plays a dominant role in theenactment/monitoring and diagnosis/requirements phases. The figure also lists thedifferent ways in which process models are used (as identified in Sect. 1.2). Untilrecently, there were few connections between the data produced while executingthe process and the actual process design. In fact, in most organizations the diag-nosis/requirements phase is not supported in a systematic and continuous manner.Only severe problems or major external changes will trigger another iteration of thelife-cycle, and factual information about the current process is not actively used inredesign decisions. Process mining offers the possibility to truly “close” the BPMlife-cycle. Data recorded by information systems can be used to provide a betterview on the actual processes, i.e., deviations can be analyzed and the quality ofmodels can be improved.

Process mining is a relative young research discipline that sits between machinelearning and data mining on the one hand and process modeling and analysis onthe other hand. The idea of process mining is to discover, monitor and improve realprocesses (i.e., not assumed processes) by extracting knowledge from event logsreadily available in today’s systems.

Figure 1.4 shows that process mining establishes links between the actual pro-cesses and their data on the one hand and process models on the other hand.As explained in Sect. 1.1, the digital universe and the physical universe becomemore and more aligned. Today’s information systems log enormous amounts ofevents. Classical WFM systems (e.g., Staffware and COSA), BPM systems (e.g.,BPM|one by Pallas Athena, SmartBPM by Pegasystems, FileNet, Global 360, andTeamwork by Lombardi Software), ERP systems (e.g., SAP Business Suite, Ora-cle E-Business Suite, and Microsoft Dynamics NAV), PDM systems (e.g., Wind-chill), CRM systems (e.g., Microsoft Dynamics CRM and SalesForce), middleware(e.g., IBM’s WebSphere and Cordys Business Operations Platform), and hospitalinformation systems (e.g., Chipsoft and Siemens Soarian) provide detailed infor-mation about the activities that have been executed. Figure 1.4 refers to such dataas event logs. All of the PAISs just mentioned directly provide such event logs.

©W.M.P. van der Aalst. Process Mining. Springer, 2011.

Page 28: Verso una gestione IT delle organizzazioni fondata sulla realtà

L’approccio classico

28

8 1 Introduction

Fig. 1.3 The BPM life-cycle showing the different uses of process models

As Fig. 1.3 shows, process models play a dominant role in the (re)design andconfiguration/implementation phases, whereas data plays a dominant role in theenactment/monitoring and diagnosis/requirements phases. The figure also lists thedifferent ways in which process models are used (as identified in Sect. 1.2). Untilrecently, there were few connections between the data produced while executingthe process and the actual process design. In fact, in most organizations the diag-nosis/requirements phase is not supported in a systematic and continuous manner.Only severe problems or major external changes will trigger another iteration of thelife-cycle, and factual information about the current process is not actively used inredesign decisions. Process mining offers the possibility to truly “close” the BPMlife-cycle. Data recorded by information systems can be used to provide a betterview on the actual processes, i.e., deviations can be analyzed and the quality ofmodels can be improved.

Process mining is a relative young research discipline that sits between machinelearning and data mining on the one hand and process modeling and analysis onthe other hand. The idea of process mining is to discover, monitor and improve realprocesses (i.e., not assumed processes) by extracting knowledge from event logsreadily available in today’s systems.

Figure 1.4 shows that process mining establishes links between the actual pro-cesses and their data on the one hand and process models on the other hand.As explained in Sect. 1.1, the digital universe and the physical universe becomemore and more aligned. Today’s information systems log enormous amounts ofevents. Classical WFM systems (e.g., Staffware and COSA), BPM systems (e.g.,BPM|one by Pallas Athena, SmartBPM by Pegasystems, FileNet, Global 360, andTeamwork by Lombardi Software), ERP systems (e.g., SAP Business Suite, Ora-cle E-Business Suite, and Microsoft Dynamics NAV), PDM systems (e.g., Wind-chill), CRM systems (e.g., Microsoft Dynamics CRM and SalesForce), middleware(e.g., IBM’s WebSphere and Cordys Business Operations Platform), and hospitalinformation systems (e.g., Chipsoft and Siemens Soarian) provide detailed infor-mation about the activities that have been executed. Figure 1.4 refers to such dataas event logs. All of the PAISs just mentioned directly provide such event logs.

Page 29: Verso una gestione IT delle organizzazioni fondata sulla realtà

Quali modelli?

Modelli strutturali• Rappresentano la struttura del dominio di interesse • Indicano le entità e le relazioni rilevanti per l’attività dell’organizzazione • Esempi “generici”: i modelli sottostanti i sistemi CRM/ERP

29

Page 30: Verso una gestione IT delle organizzazioni fondata sulla realtà

Quali modelli?

Modelli dinamici (di processo)• Visione end-to-end del business • Attività e meccanismi di coordinamento nel tempo• Es.: order-to-cash, procure-to-pay, issue-to-resolution, …

30

Receiveorder

Check availability

Article available?

Ship articleFinancial

settlementyes

Procurement

no Paymentreceived

Inform customer

Late deliveryUndeliverable

Customerinformed

Inform customer

Articleremoved

Remove article from catalogue

Input Output

Page 31: Verso una gestione IT delle organizzazioni fondata sulla realtà

Creazione di modelliTipica metodologia

• Modellazione • Interazione continua con esperti di dominio e clienti • Modularizzazione + raffinamento iterativo • Processo ripetuto per il sistema “as-is” e il sistema “to-be” • Importante di per sé

• Creazione di un “contratto basato sui modelli” • Uso dei modelli in fase di audit

• Progetto • modelli consegnati all’IT

31

Page 32: Verso una gestione IT delle organizzazioni fondata sulla realtà

Tipica metodologia

• Modellazione • Interazione continua con esperti di dominio e clienti • Modularizzazione + raffinamento iterativo • Processo ripetuto per il sistema “as-is” e il sistema “to-be” • Importante di per sé

• Creazione di un “contratto basato sui modelli” • Uso dei modelli in fase di audit

• Progetto • modelli consegnati all’IT

Creazione di modelli

32

I modelli sono corretti? Verifica Riflettono la realtà? Validazione

Gli artefatti computazionale corrispondono ai modelli? Allineamento concettuale

Page 33: Verso una gestione IT delle organizzazioni fondata sulla realtà

Correttezza di modelli strutturali

• I modelli sviluppati sono consistenti?

• I vincoli modellati sono in conflitto tra loro?

• Quale conoscenza implicita è nascosta nei modelli?

• Come rispondere a queste domande quando i modelli sono sviluppati a più mani, contengono migliaia di concetti e relazioni, vanno integrati con altri modelli?

33

Page 34: Verso una gestione IT delle organizzazioni fondata sulla realtà

Esempio con UML

34

credits to Enrico Franconi

Page 35: Verso una gestione IT delle organizzazioni fondata sulla realtà

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

Capturing UML class diagrams/ER schemas in DL-Lite

Researchername: Stringsalary: Integer

Manager

PrincInv Coordinator

ProjectprojectName: String

1..?

supvsdByH

1..1

1..?

worksForH

1..?

1..1

managesN

1..1{disjoint}

Manager v ResearcherPrincInv v Manager

Coordinator v ManagerPrincInv v ¬Coordinator

Researcher v 9salary9salary� v xsd:int

(funct salary)

9worksFor v Researcher9worksFor� v ProjectResearcher v 9worksFor

Project v 9worksFor�

9manages v Coordinator9manages� v ProjectCoordinator v 9manages

Project v 9manages�

manages v worksFor(funct manages)(funct manages�)

· · ·DL-Lite cannot capture covering constraints.To do so, would require disjunction.

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (25/52)

KR alla riscossa• Knowlege representation

and automated reasoning: area dell’AI focalizzata sulla rappresentazione della conoscenza e l’automazione del ragionamento

• Ragionamento su modelli strutturali tradotto in un problema di deduzione logica• Intensa ricerca su algoritmi

efficienti

35

Page 36: Verso una gestione IT delle organizzazioni fondata sulla realtà

E i dati?

36

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

Example from the oil domain

Ontology: WellborewbName: StringaltName: String

Licencenumber: String

hasLicence I

Data sources:D1, D2, D3 contain information about wellbores.

D4 contains information about licences.D1 D2 D3 D4

id1 name

a1 ’A’

a2 ’B’

a3 ’H’

id2 name Well

b1 null 1

b2 ’C’ 2

b6 ’B’ 3

id3 aName

c3 ’U1’

c4 ’U2’

c5 ’U6’

id4 lNum

9 ’Z1’

8 ’Z2’

7 ’Z3’

Mappings:Wellbore and wbName are defined using D1 and D2.

altName is defined using D3.

hasLicense is defined using D4.

Moreover, URIs for wellbores from source Dk are generated as wbk(id).Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (41/52)

Page 37: Verso una gestione IT delle organizzazioni fondata sulla realtà

Albori dei sistemi informativi

37

OS

Application

1970

OS

GUI

DBMS

Application

OS

DBMS

Application

Database Database

t1980 1990

fromM.Weske:BusinessProcessManagement,©Springer-VerlagBerlinHeidelberg2007

Page 38: Verso una gestione IT delle organizzazioni fondata sulla realtà

Sistemi verticali e integrazione

38

OS

DBMS

Human Resources Application

HR DB

OS

DBMS

Purchase Order Management

POM DB

OS

Warehouse Management

Warehouse file system data store

Redundancy of data

Page 39: Verso una gestione IT delle organizzazioni fondata sulla realtà

Sistemi ERP

39

OS

DBMS

Client nClient 2Client 1

ERP Server Application

ERP Database

. . .

Page 40: Verso una gestione IT delle organizzazioni fondata sulla realtà

Evoluzione a silos• Necessità di estendere ERP coprendo altre funzionalità

fondamentali (CRM, supply chain)

40

OS

DBMS

Application Logic of CRM System

GUI

OS

DBMS

OS

DBMS

Application Logic of SCM System

Application Logic of ERP System

GUI GUI

SCM Database

ERP Database

CRM Database

Page 41: Verso una gestione IT delle organizzazioni fondata sulla realtà

Integrazione punto a punto

• Problema di flessibilità • Frammentazione concettuale

41

ERP System

CRM SystemSCM System

Inventory Management

Data WarehouseHuman Resources

Application

Page 42: Verso una gestione IT delle organizzazioni fondata sulla realtà

Da qui…

Collegamento con i dati

42

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

Capturing UML class diagrams/ER schemas in DL-Lite

Researchername: Stringsalary: Integer

Manager

PrincInv Coordinator

ProjectprojectName: String

1..?

supvsdByH

1..1

1..?

worksForH

1..?

1..1

managesN

1..1{disjoint}

Manager v ResearcherPrincInv v Manager

Coordinator v ManagerPrincInv v ¬Coordinator

Researcher v 9salary9salary� v xsd:int

(funct salary)

9worksFor v Researcher9worksFor� v ProjectResearcher v 9worksFor

Project v 9worksFor�

9manages v Coordinator9manages� v ProjectCoordinator v 9manages

Project v 9manages�

manages v worksFor(funct manages)(funct manages�)

· · ·DL-Lite cannot capture covering constraints.To do so, would require disjunction.

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (25/52)

Page 43: Verso una gestione IT delle organizzazioni fondata sulla realtà

…a qui!

Collegamento con i dati

43

Page 44: Verso una gestione IT delle organizzazioni fondata sulla realtà

Risultato

Crompton (2008): gli esperti di dominio spendono (troppo) tempo nel cercare i dati utili per prendere decisioni ed eseguire le proprie attività

• Ingegneri del settore petrolifero/gas: 30-70% del proprio lavoro in ricerca e analisi qualità dei dati

44

Page 45: Verso una gestione IT delle organizzazioni fondata sulla realtà

Optique• Progetto EU Optique: Scalable, End-User Access to

Big Data) • http://optique-project.eu • Obiettivo: sviluppo di tecniche per l’accesso

“concettuale” a grossi moli di dati • Casi di studio: Statoil (trivellazioni), Siemens (turbine)

• In Statoil, esperti geologi e geofisici sviluppano modelli stratigrafici di aree inesplorate, sulla base dei dati acquisiti su operazioni di trivellazione fatte in aree vicine

45

Page 46: Verso una gestione IT delle organizzazioni fondata sulla realtà

Fatti su Statoil• 1000 TB di dati memorizzati in DB relazionali (standard

SQL)

• Schemi non allineati

• Più di 2000 tabelle, sparpagliate in vari DBMS

• 900 esperti nella divisione “Statoil Exploration”

• 30-70% del tempo speso in ricerca dei dati

• Fino a 4 gg necessari per formulare le interrogazioni richieste e farle tradurre in SQL dagli esperti IT

46

Page 47: Verso una gestione IT delle organizzazioni fondata sulla realtà

Esempio di interrogazione

47

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

How much time/money is spent searching for data?

A user query at Statoil

Show all norwegian wellbores with some aditional attributes(wellbore id, completion date, oldest penetrated age,result). Limitto all wellbores with a core and show attributes like (wellbore id,core number, top core depth, base core depth, intersectingstratigraphy). Limit to all wellbores with core in Brentgruppen andshow key atributes in a table. After connecting to EPDS (slegge)we could for instance limit futher to cores in Brent with measuredpermeability and where it is larger than a given value, for instance 1mD. We could also find out whether there are cores in Brent whichare not stored in EPDS (based on NPD info) and where there couldbe permeability values. Some of the missing data we possibly own,other not.

At Statoil, it takes up to 4 days to formulate a query in SQL.

Statoil loses up to 50.000.000e per year because of this!!

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (5/52)

Page 48: Verso una gestione IT delle organizzazioni fondata sulla realtà

48

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

How much time/money is spent searching for data?

A user query at Statoil

Show all norwegian wellbores with some aditional attributes(wellbore id, completion date, oldest penetrated age,result). Limitto all wellbores with a core and show attributes like (wellbore id,core number, top core depth, base core depth, intersectingstratigraphy). Limit to all wellbores with core in Brentgruppen andshow key atributes in a table. After connecting to EPDS (slegge)we could for instance limit futher to cores in Brent with measuredpermeability and where it is larger than a given value, for instance 1mD. We could also find out whether there are cores in Brent whichare not stored in EPDS (based on NPD info) and where there couldbe permeability values. Some of the missing data we possibly own,other not.

SELECT [...]FROMdb_name.table1 table1,db_name.table2 table2a,db_name.table2 table2b,db_name.table3 table3a,db_name.table3 table3b,db_name.table3 table3c,db_name.table3 table3d,db_name.table4 table4a,db_name.table4 table4b,db_name.table4 table4c,db_name.table4 table4d,db_name.table4 table4e,db_name.table4 table4f,db_name.table5 table5a,db_name.table5 table5b,db_name.table6 table6a,db_name.table6 table6b,db_name.table7 table7a,db_name.table7 table7b,db_name.table8 table8,db_name.table9 table9,db_name.table10 table10a,db_name.table10 table10b,db_name.table10 table10c,db_name.table11 table11,db_name.table12 table12,db_name.table13 table13,db_name.table14 table14,db_name.table15 table15,db_name.table16 table16WHERE [...]

table2a.attr1=‘keyword’ ANDtable3a.attr2=table10c.attr1 ANDtable3a.attr6=table6a.attr3 ANDtable3a.attr9=‘keyword’ ANDtable4a.attr10 IN (‘keyword’) ANDtable4a.attr1 IN (‘keyword’) ANDtable5a.kinds=table4a.attr13 ANDtable5b.kinds=table4c.attr74 ANDtable5b.name=‘keyword’ AND(table6a.attr19=table10c.attr17 OR(table6a.attr2 IS NULL ANDtable10c.attr4 IS NULL)) ANDtable6a.attr14=table5b.attr14 ANDtable6a.attr2=‘keyword’ AND(table6b.attr14=table10c.attr8 OR(table6b.attr4 IS NULL ANDtable10c.attr7 IS NULL)) ANDtable6b.attr19=table5a.attr55 ANDtable6b.attr2=‘keyword’ ANDtable7a.attr19=table2b.attr19 ANDtable7a.attr17=table15.attr19 ANDtable4b.attr11=‘keyword’ ANDtable8.attr19=table7a.attr80 ANDtable8.attr19=table13.attr20 ANDtable8.attr4=‘keyword’ ANDtable9.attr10=table16.attr11 ANDtable3b.attr19=table10c.attr18 ANDtable3b.attr22=table12.attr63 ANDtable3b.attr66=‘keyword’ ANDtable10a.attr54=table7a.attr8 ANDtable10a.attr70=table10c.attr10 ANDtable10a.attr16=table4d.attr11 ANDtable4c.attr99=‘keyword’ ANDtable4c.attr1=‘keyword’ AND

table11.attr10=table5a.attr10 ANDtable11.attr40=‘keyword’ ANDtable11.attr50=‘keyword’ ANDtable2b.attr1=table1.attr8 ANDtable2b.attr9 IN (‘keyword’) ANDtable2b.attr2 LIKE ‘keyword’% ANDtable12.attr9 IN (‘keyword’) ANDtable7b.attr1=table2a.attr10 ANDtable3c.attr13=table10c.attr1 ANDtable3c.attr10=table6b.attr20 ANDtable3c.attr13=‘keyword’ ANDtable10b.attr16=table10a.attr7 ANDtable10b.attr11=table7b.attr8 ANDtable10b.attr13=table4b.attr89 ANDtable13.attr1=table2b.attr10 ANDtable13.attr20=’‘keyword’’ ANDtable13.attr15=‘keyword’ ANDtable3d.attr49=table12.attr18 ANDtable3d.attr18=table10c.attr11 ANDtable3d.attr14=‘keyword’ ANDtable4d.attr17 IN (‘keyword’) ANDtable4d.attr19 IN (‘keyword’) ANDtable16.attr28=table11.attr56 ANDtable16.attr16=table10b.attr78 ANDtable16.attr5=table14.attr56 ANDtable4e.attr34 IN (‘keyword’) ANDtable4e.attr48 IN (‘keyword’) ANDtable4f.attr89=table5b.attr7 ANDtable4f.attr45 IN (‘keyword’) ANDtable4f.attr1=‘keyword’ ANDtable10c.attr2=table4e.attr19 AND(table10c.attr78=table12.attr56 OR(table10c.attr55 IS NULL ANDtable12.attr17 IS NULL))

At Statoil, it takes up to 4 days to formulate a query in SQL.

Statoil loses up to 50.000.000e per year because of this!!

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (5/52)

Page 49: Verso una gestione IT delle organizzazioni fondata sulla realtà

49

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

How much time/money is spent searching for data?

A user query at Statoil

Show all norwegian wellbores with some aditional attributes(wellbore id, completion date, oldest penetrated age,result). Limitto all wellbores with a core and show attributes like (wellbore id,core number, top core depth, base core depth, intersectingstratigraphy). Limit to all wellbores with core in Brentgruppen andshow key atributes in a table. After connecting to EPDS (slegge)we could for instance limit futher to cores in Brent with measuredpermeability and where it is larger than a given value, for instance 1mD. We could also find out whether there are cores in Brent whichare not stored in EPDS (based on NPD info) and where there couldbe permeability values. Some of the missing data we possibly own,other not.

SELECT [...]FROMdb_name.table1 table1,db_name.table2 table2a,db_name.table2 table2b,db_name.table3 table3a,db_name.table3 table3b,db_name.table3 table3c,db_name.table3 table3d,db_name.table4 table4a,db_name.table4 table4b,db_name.table4 table4c,db_name.table4 table4d,db_name.table4 table4e,db_name.table4 table4f,db_name.table5 table5a,db_name.table5 table5b,db_name.table6 table6a,db_name.table6 table6b,db_name.table7 table7a,db_name.table7 table7b,db_name.table8 table8,db_name.table9 table9,db_name.table10 table10a,db_name.table10 table10b,db_name.table10 table10c,db_name.table11 table11,db_name.table12 table12,db_name.table13 table13,db_name.table14 table14,db_name.table15 table15,db_name.table16 table16WHERE [...]

table2a.attr1=‘keyword’ ANDtable3a.attr2=table10c.attr1 ANDtable3a.attr6=table6a.attr3 ANDtable3a.attr9=‘keyword’ ANDtable4a.attr10 IN (‘keyword’) ANDtable4a.attr1 IN (‘keyword’) ANDtable5a.kinds=table4a.attr13 ANDtable5b.kinds=table4c.attr74 ANDtable5b.name=‘keyword’ AND(table6a.attr19=table10c.attr17 OR(table6a.attr2 IS NULL ANDtable10c.attr4 IS NULL)) ANDtable6a.attr14=table5b.attr14 ANDtable6a.attr2=‘keyword’ AND(table6b.attr14=table10c.attr8 OR(table6b.attr4 IS NULL ANDtable10c.attr7 IS NULL)) ANDtable6b.attr19=table5a.attr55 ANDtable6b.attr2=‘keyword’ ANDtable7a.attr19=table2b.attr19 ANDtable7a.attr17=table15.attr19 ANDtable4b.attr11=‘keyword’ ANDtable8.attr19=table7a.attr80 ANDtable8.attr19=table13.attr20 ANDtable8.attr4=‘keyword’ ANDtable9.attr10=table16.attr11 ANDtable3b.attr19=table10c.attr18 ANDtable3b.attr22=table12.attr63 ANDtable3b.attr66=‘keyword’ ANDtable10a.attr54=table7a.attr8 ANDtable10a.attr70=table10c.attr10 ANDtable10a.attr16=table4d.attr11 ANDtable4c.attr99=‘keyword’ ANDtable4c.attr1=‘keyword’ AND

table11.attr10=table5a.attr10 ANDtable11.attr40=‘keyword’ ANDtable11.attr50=‘keyword’ ANDtable2b.attr1=table1.attr8 ANDtable2b.attr9 IN (‘keyword’) ANDtable2b.attr2 LIKE ‘keyword’% ANDtable12.attr9 IN (‘keyword’) ANDtable7b.attr1=table2a.attr10 ANDtable3c.attr13=table10c.attr1 ANDtable3c.attr10=table6b.attr20 ANDtable3c.attr13=‘keyword’ ANDtable10b.attr16=table10a.attr7 ANDtable10b.attr11=table7b.attr8 ANDtable10b.attr13=table4b.attr89 ANDtable13.attr1=table2b.attr10 ANDtable13.attr20=’‘keyword’’ ANDtable13.attr15=‘keyword’ ANDtable3d.attr49=table12.attr18 ANDtable3d.attr18=table10c.attr11 ANDtable3d.attr14=‘keyword’ ANDtable4d.attr17 IN (‘keyword’) ANDtable4d.attr19 IN (‘keyword’) ANDtable16.attr28=table11.attr56 ANDtable16.attr16=table10b.attr78 ANDtable16.attr5=table14.attr56 ANDtable4e.attr34 IN (‘keyword’) ANDtable4e.attr48 IN (‘keyword’) ANDtable4f.attr89=table5b.attr7 ANDtable4f.attr45 IN (‘keyword’) ANDtable4f.attr1=‘keyword’ ANDtable10c.attr2=table4e.attr19 AND(table10c.attr78=table12.attr56 OR(table10c.attr55 IS NULL ANDtable12.attr17 IS NULL))

At Statoil, it takes up to 4 days to formulate a query in SQL.

Statoil loses up to 50.000.000e per year because of this!!

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (5/52)

50.000.000 €persi ogni anno

Page 50: Verso una gestione IT delle organizzazioni fondata sulla realtà

Quali soluzioni?• Migrazione verso sistemi monolitici/integrati

• Sostenibile in termini di costi?

• Ogni quanto?

• Come integrare sistemi legacy?

• Come gestire la ridondanza dei dati?

• Non risolve il problema di “comprendere” i dati, comunque necessario per una buona migrazione

• Attenzione: questi problemi esistono anche per le PMI!!!

50

Page 51: Verso una gestione IT delle organizzazioni fondata sulla realtà

OBDA Accesso ai dati mediato da ontologie

51

OBDI framework Query answering Ontology languages Mappings Identity Conclusions

Ontology-based data integration framework

. . .

. . .

. . .

. . .

Query

Result

Ontologyprovides

global vocabulary

and

conceptual view

Mappingssemantically link

sources and

ontology

Data Sourcesexternal and

heterogeneous

We achieve logical transparency in accessing data:

does not know where and how the data is stored.

can only see a conceptual view of the data.

Diego Calvanese (FUB) Ontologies for Data Integration FOfAI 2015, Buenos Aires – 27/7/2015 (7/52)

sorgenti di dati

modello strutturale

mapping

Page 52: Verso una gestione IT delle organizzazioni fondata sulla realtà

OBDA• I dati vengono lasciati nelle loro sorgenti

• I mapping permettono di interpretare i dati secondo i modelli concettuali sviluppati

• Gli utenti finali esprimono le proprie interrogazioni sul modello concettuale

• Il sistema OBDA è “intelligente”:

• Traduce automaticamente le interrogazioni astratte in query eseguite sulle sorgenti di dato

• Aggrega e ritraduce le risposte così ottenute

52

Page 53: Verso una gestione IT delle organizzazioni fondata sulla realtà

Ontop• Sistema di OBDA open-source sviluppato alla

Libera Università di Bolzano (Prof. Calvanese)

• Supporta standard per il web semantico (OWL, SPARQL)

• Si integra con una pletora di DBMS relazionali

• Apache open license

• http://ontop.inf.unibz.it

53

Page 54: Verso una gestione IT delle organizzazioni fondata sulla realtà

Correttezza dei modelli di processo

Analisi di tutte le possibili “dinamiche”

• Conformità con le leggi (compliance/governance)

• Proprietà generali desiderate (terminazione, assenza di vicoli ciechi, …)

• Proprietà di dominio • è possibile chiudere un ordine senza pagarlo? • è sempre vero che un utente non può accedere a due offerte

contemporaneamente? • è garantito che chi apre un “ticket” viene prima o poi servito? • …

54

Page 55: Verso una gestione IT delle organizzazioni fondata sulla realtà

Verifica FormaleModello di processo

55Proprietà (non) desiderata

Page 56: Verso una gestione IT delle organizzazioni fondata sulla realtà

Proprietà (non) desiderata

Sistemaa transizioni

Formula temporale|= �

Verifica Formale

56

Modello di processo

Page 57: Verso una gestione IT delle organizzazioni fondata sulla realtà

|= �

Verifica via model checking2007 Turing award:

Clarke, Emerson, Sifakis

Verifica Formale

57

Modello di processo

Proprietà (non) desiderata

Sistemaa transizioni

Formula temporale

Page 58: Verso una gestione IT delle organizzazioni fondata sulla realtà

I modelli di processo sono adeguati?

58

Page 59: Verso una gestione IT delle organizzazioni fondata sulla realtà

BPM!59

Page 60: Verso una gestione IT delle organizzazioni fondata sulla realtà

BPM?60

Page 61: Verso una gestione IT delle organizzazioni fondata sulla realtà

Il tema della flessibilità

61

Page 62: Verso una gestione IT delle organizzazioni fondata sulla realtà

Il nuovo trend62

8 1 Introduction

Fig. 1.3 The BPM life-cycle showing the different uses of process models

As Fig. 1.3 shows, process models play a dominant role in the (re)design andconfiguration/implementation phases, whereas data plays a dominant role in theenactment/monitoring and diagnosis/requirements phases. The figure also lists thedifferent ways in which process models are used (as identified in Sect. 1.2). Untilrecently, there were few connections between the data produced while executingthe process and the actual process design. In fact, in most organizations the diag-nosis/requirements phase is not supported in a systematic and continuous manner.Only severe problems or major external changes will trigger another iteration of thelife-cycle, and factual information about the current process is not actively used inredesign decisions. Process mining offers the possibility to truly “close” the BPMlife-cycle. Data recorded by information systems can be used to provide a betterview on the actual processes, i.e., deviations can be analyzed and the quality ofmodels can be improved.

Process mining is a relative young research discipline that sits between machinelearning and data mining on the one hand and process modeling and analysis onthe other hand. The idea of process mining is to discover, monitor and improve realprocesses (i.e., not assumed processes) by extracting knowledge from event logsreadily available in today’s systems.

Figure 1.4 shows that process mining establishes links between the actual pro-cesses and their data on the one hand and process models on the other hand.As explained in Sect. 1.1, the digital universe and the physical universe becomemore and more aligned. Today’s information systems log enormous amounts ofevents. Classical WFM systems (e.g., Staffware and COSA), BPM systems (e.g.,BPM|one by Pallas Athena, SmartBPM by Pegasystems, FileNet, Global 360, andTeamwork by Lombardi Software), ERP systems (e.g., SAP Business Suite, Ora-cle E-Business Suite, and Microsoft Dynamics NAV), PDM systems (e.g., Wind-chill), CRM systems (e.g., Microsoft Dynamics CRM and SalesForce), middleware(e.g., IBM’s WebSphere and Cordys Business Operations Platform), and hospitalinformation systems (e.g., Chipsoft and Siemens Soarian) provide detailed infor-mation about the activities that have been executed. Figure 1.4 refers to such dataas event logs. All of the PAISs just mentioned directly provide such event logs.

Page 63: Verso una gestione IT delle organizzazioni fondata sulla realtà

Ma ad oggi?• Processi solo parzialmente automatizzati

• I sistemi lasciano quasi sempre la possibilità di trovare una scappatoia

• Se non lo fanno, il rischio è che le persone agiscano fuori dal sistema per poi utilizzarlo a posteriori

• Incremento processi knowledge-intensive, inter-organizzativi, distribuiti —> solo parzialmente controllabili!

63

Page 64: Verso una gestione IT delle organizzazioni fondata sulla realtà

Processo clinico modellato

64

Page 65: Verso una gestione IT delle organizzazioni fondata sulla realtà

Processo clinico reale

65

Under

stan

din

gSpag

het

tiM

odel

sw

ith

Seq

uen

ceC

lust

erin

gfo

rP

roM

9

thos

eex

cept

ions

.Fig

ure

4de

pict

sth

ere

sult

ofa

first

atte

mpt

toan

alyz

eth

eap

plic

atio

nse

rver

logs

usin

gth

ehe

uris

tics

min

er[4

].

Exc

eptio

n(c

om

ple

te)

187

Est

abele

cim

ento

NotF

oundE

xceptio

n(c

om

ple

te)

187

0,9

91 1

52

GR

EJB

Pers

iste

ncy

Exc

eptio

n(c

om

ple

te)

179

0,9

09 1

59

PG

WS

Exc

eptio

n(c

om

ple

te)

168

0,8

89 1

2

ITP

TE

xtern

alS

erv

iceE

xceptio

n(c

om

ple

te)

183 0

,944

162

SIP

SC

NoR

eco

rdsF

oundE

xceptio

n(c

om

ple

te)

160

0,8 5

Pess

oaS

ingula

rNotF

oundE

xceptio

n(c

om

ple

te)

138

0,6

67 3

Busi

ness

Logic

Exc

eptio

n(c

om

ple

te)

183

0,7

5 4

SIC

CLE

xceptio

n(c

om

ple

te)

175

0,8

57 1

9

NaoE

xist

em

Regis

tosE

xceptio

n(c

om

ple

te)

143

0,8

33 6

RP

CB

usi

ness

Exc

eptio

n(c

om

ple

te)

38 0

,75

3

SA

FB

usi

ness

Exc

eptio

n(c

om

ple

te)

115

0,8

68

GR

EJB

Busi

ness

Exc

eptio

n(c

om

ple

te)

45

0,7

5 2

3

DE

SW

SE

xce

ptio

n(c

om

ple

te)

14

0,6

67 1

4

NullP

oin

terE

xceptio

n(c

om

ple

te)

104

0,8

91

Valid

atio

nE

xceptio

n(c

om

ple

te)

31

0,8

12

GIL

Busi

ness

Exc

eptio

n(c

om

ple

te)

14

0,5 6

GR

Serv

icesE

xceptio

n(c

om

ple

te)

7 0,6

67 3

CS

IBusi

ness

Exc

eptio

n(c

om

ple

te)

14

0,5 6

Conco

rrenci

aE

xceptio

n(c

om

ple

te)

5

0,5 2

CS

IPers

iste

ncy

Exc

eptio

n(c

om

ple

te)

3

0,5 2

0,8

57 3

4

ITP

TS

erv

erE

xceptio

n(c

om

ple

te)

21

0,6

67 1

5

CO

OP

Exc

eptio

n(c

om

ple

te)

4 0,5 2

RS

IValid

atio

nE

xceptio

n(c

om

ple

te)

25

0,6

67 1

8

Basi

cSys

tem

Exc

eptio

n(c

om

ple

te)

16

0,6

67 1

1

Pesq

uis

aA

mbig

uaE

xceptio

n(c

om

ple

te)

6

0,5 6

CP

FB

usi

ness

Exc

eptio

n(c

om

ple

te)

3

0,5 2

0,8

95

AD

OP

Exc

eptio

n(c

om

ple

te)

6

0,5 5

AF

Busi

ness

Exc

eptio

n(c

om

ple

te)

64

SIP

SC

Rem

ote

Busi

ness

Exc

eptio

n(c

om

ple

te)

51

0,8

33 1

3

Concu

rrentM

odifi

catio

nE

xceptio

n(c

om

ple

te)

5

0,5 1

CD

FB

usi

ness

Exc

eptio

n(c

om

ple

te)

6

0,6

67 2

Ass

inatu

raN

aoIn

cluid

aE

xceptio

n(c

om

ple

te)

1

0,5 1

SIC

CS

Exc

eptio

n(c

om

ple

te)

32

0,8

11

Ca

rta

oC

ida

da

oE

xce

ptio

n(c

om

ple

te)

64

0,8

33 3

8

SO

AP

Exc

eptio

n(c

om

ple

te)

22

0,6

67 1

4

TooM

anyR

ow

sExc

eptio

n(c

om

ple

te)

112

0,6

67 1

8

SIP

SC

Fata

lExc

eptio

n(c

om

ple

te)

20

0,6

67 9

Lim

iteT

em

pora

lExc

eptio

n(c

om

ple

te)

4

0,5 2

0,8

28

SV

IBusi

ness

Use

rExc

eptio

n(c

om

ple

te)

18

0,7

5 1

2

GR

Concu

rrency

Exc

eptio

n(c

om

ple

te)

8 0,5 2

Contr

ibuin

teR

egio

nalN

otF

oundE

xceptio

n(c

om

ple

te)

63

0,7

5 3

0

JDO

Fata

lUse

rExc

eptio

n(c

om

ple

te)

124

0,9

47 4

9

0,6

67 5

SQ

LE

xceptio

n(c

om

ple

te)

9

0,6

67 7

IOE

xceptio

n(c

om

ple

te)

27

0,7

5 2

2

Pess

oaC

ole

ctiv

aN

otF

oundE

xceptio

n(c

om

ple

te)

23

0,7

5 2

0

Serv

iceD

ele

gate

Rem

ote

Exc

eptio

n(c

om

ple

te)

3

0,5 2

0,5 5

PA

SE

xce

ptio

n(c

om

ple

te)

2

0,5 1

File

NotF

oundE

xceptio

n(c

om

ple

te)

31

0,7

5 1

3

QgenM

IPara

metr

izedB

usi

ness

Exc

eptio

n(c

om

ple

te)

1

0,5 1

AD

OP

Mess

ageE

xceptio

n(c

om

ple

te)

3 0,5 2

Layo

ffE

xceptio

n(c

om

ple

te)

1

0,5 1

0,7

5 8

CM

PE

xceptio

n(c

om

ple

te)

1

0,5 1

GR

EJB

Rem

ote

Serv

iceE

xceptio

n(c

om

ple

te)

34

0,7

5 4

RS

IPers

iste

nce

Exc

eptio

n(c

om

ple

te)

24

0,7

5 4

CS

IRem

ote

Exc

eptio

n(c

om

ple

te)

3

0,5 1

SIP

SC

Fata

lRem

ote

CallE

xceptio

n(c

om

ple

te)

3

0,5 1

SIP

SC

Data

base

Exc

eptio

n(c

om

ple

te)

1

0,5 1

Busi

ness

Exc

eptio

n(c

om

ple

te)

159

0,6

67 9

SV

IBusi

ness

Exc

eptio

n(c

om

ple

te)

1

0,5 1

Para

metr

izedB

usi

ness

Exc

eptio

n(c

om

ple

te)

2

0,5 2

GD

Serv

icesE

xceptio

n(c

om

ple

te)

4

0,5 3

Serv

erE

xceptio

n(c

om

ple

te)

132

0,7

5 1

6

PG

Exc

eptio

n(c

om

ple

te)

6

0,6

67 5

0,7

5 4

DE

SE

xceptio

n(c

om

ple

te)

135

0,6

67 1

3

0,6

67 2

0,7

5 9 SIP

SC

Exc

eptio

n(c

om

ple

te)

27

0,7

5 9

Report

Exc

eptio

n(c

om

ple

te)

5

0,6

67 2

SS

NS

erv

iceE

xceptio

n(c

om

ple

te)

1

0,5 1

AF

Exc

eptio

n(c

om

ple

te)

1

0,5 1

Inva

lidN

ISS

Exc

eptio

n(c

om

ple

te)

14 0

,75

4

0,7

5 1

4

GIL

Concu

rrency

Exc

eptio

n(c

om

ple

te)

1

0,5 1

RS

ISys

tem

Exc

eptio

n(c

om

ple

te)

28

0,7

5 7

0,6

67 5

0,6

67 1

0,7

5 2

0,6

67 5

0,8

33 5

0,6

67 5

0,6

67 4

0,7

5 1

2

0,9

81 5

3

AD

OP

Use

rChoic

eE

xceptio

n(c

om

ple

te)

1

0,5 1

0,6

67 5

RP

CE

xceptio

n(c

om

ple

te)

1

0,5 1

GR

EJB

Concu

rrency

Exc

eptio

n(c

om

ple

te)

15 0

,875

8

0,5 1

0,5 1

0,6

67 1

Mora

daP

ort

uguesa

NotF

oundE

xceptio

n(c

om

ple

te)

1

0,5 1

0,7

5 4

0,5 1

0,6

67 6

0,5 1

0,5 2

0,8

89 8

0,7

5 3

0,8 3

RS

IExc

eptio

n(c

om

ple

te)

1

0,5 1

0,5 1

0,5 1

0,6

67 4

0,6

67 3

0,5 1

0,5 2

0,7

5 5

0,5 1

0,5 1

0,5 2 0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,5 1

0,8 1

0,5 1

0,5 1

0,5 1

Fig

.4.

Spag

het

tim

odel

obta

ined

from

the

applica

tion

serv

erlo

gsusi

ng

the

heu

rist

ics

min

er.

Usi

ngth

ese

quen

cecl

uste

ring

plug

-inan

dit

spr

epro

cess

ing

capa

bilit

ies,

asw

ella

sthe

poss

ibili

tyof

visu

ally

adju

stin

gth

ecl

uste

rmod

elsa

ccor

ding

toce

rtai

nth

resh

olds

,itw

aspo

ssib

leto

iden

tify

seve

ralp

atte

rnsin

volv

ing

di�e

rent

type

sof

exce

ptio

ns.T

hese

patt

erns

wer

efo

und

afte

rse

vera

latt

empt

sof

tuni

ngw

ith

the

prep

roce

ssin

gpa

ram

eter

s,se

lect

ing

the

num

ber

ofcl

uste

rs(t

ypic

ally

from

3to

Page 66: Verso una gestione IT delle organizzazioni fondata sulla realtà

L’impasse

• Esperti di dominio: visione locale

• Management: visione globale ma spesso non allineata alla realtà

• Come facciamo a riportare la realtà in azienda?

66

Page 67: Verso una gestione IT delle organizzazioni fondata sulla realtà

Economia digitale

Validare i modelli rispetto alla realtà richiede innanzitutto di ottenere una “impronta digitale” della realtà

67

Page 68: Verso una gestione IT delle organizzazioni fondata sulla realtà

Dati nei sistemi controllati

• Tracciatura di tutti gli eventi importanti necessaria

• Alla gestione interna

• Al calcolo di indicatori importanti (KPI)

• Per legge (compliance e audit esterni)

68

Page 69: Verso una gestione IT delle organizzazioni fondata sulla realtà

Dati “fuori controllo”

Tracciati da qualche parte! La nostra è una società digitale!

69

Page 70: Verso una gestione IT delle organizzazioni fondata sulla realtà

70

Page 71: Verso una gestione IT delle organizzazioni fondata sulla realtà

Data Science

• Nuova area all’intersezione tra informatica, management, statistica, apprendimento automatico

• Richiede nuovi esperti in big data management&analytics, data mining, machine learning, data visualization, aspetti legali ed etici legati alla gestione dei dati, …

71

Page 72: Verso una gestione IT delle organizzazioni fondata sulla realtà

72

http://www.delphianalytics.net/more-data-than-analysts-the-real-big-data-problem/

Page 73: Verso una gestione IT delle organizzazioni fondata sulla realtà

Alcuni esempi

73

Page 74: Verso una gestione IT delle organizzazioni fondata sulla realtà

I modelli servono?

74

Page 75: Verso una gestione IT delle organizzazioni fondata sulla realtà

Mars Orbiter• Dispositivo per lo studio del

clima marziano • Costo missione:

327.600.000 € • Perso al momento di

entrare in orbita su Marte

75

Why Data is not Enough

• Developed to study the martian climateand atmosphere.

• Mission cost: $ 327.6M.• During the orbital insertion maneuver, it

went out of radio contact permanently.• Why? Metric Mixup.

I Software on orbiter: Newtons;Software on earth: Pound-force.Conversion factor: ≥ 4.5.

I Same data, di�erent interpretations.I Lack of testing (and budget). Danger of

re-use.

Marco Montali (unibz) DPM - 1.Intro A.Y. 2014/2015 18 / 43

Page 76: Verso una gestione IT delle organizzazioni fondata sulla realtà

Causalità vs Casualità

76

Page 77: Verso una gestione IT delle organizzazioni fondata sulla realtà

Causalità vs Casualità

77

Page 78: Verso una gestione IT delle organizzazioni fondata sulla realtà

Verso il completamento del ciclo

78

8 1 Introduction

Fig. 1.3 The BPM life-cycle showing the different uses of process models

As Fig. 1.3 shows, process models play a dominant role in the (re)design andconfiguration/implementation phases, whereas data plays a dominant role in theenactment/monitoring and diagnosis/requirements phases. The figure also lists thedifferent ways in which process models are used (as identified in Sect. 1.2). Untilrecently, there were few connections between the data produced while executingthe process and the actual process design. In fact, in most organizations the diag-nosis/requirements phase is not supported in a systematic and continuous manner.Only severe problems or major external changes will trigger another iteration of thelife-cycle, and factual information about the current process is not actively used inredesign decisions. Process mining offers the possibility to truly “close” the BPMlife-cycle. Data recorded by information systems can be used to provide a betterview on the actual processes, i.e., deviations can be analyzed and the quality ofmodels can be improved.

Process mining is a relative young research discipline that sits between machinelearning and data mining on the one hand and process modeling and analysis onthe other hand. The idea of process mining is to discover, monitor and improve realprocesses (i.e., not assumed processes) by extracting knowledge from event logsreadily available in today’s systems.

Figure 1.4 shows that process mining establishes links between the actual pro-cesses and their data on the one hand and process models on the other hand.As explained in Sect. 1.1, the digital universe and the physical universe becomemore and more aligned. Today’s information systems log enormous amounts ofevents. Classical WFM systems (e.g., Staffware and COSA), BPM systems (e.g.,BPM|one by Pallas Athena, SmartBPM by Pegasystems, FileNet, Global 360, andTeamwork by Lombardi Software), ERP systems (e.g., SAP Business Suite, Ora-cle E-Business Suite, and Microsoft Dynamics NAV), PDM systems (e.g., Wind-chill), CRM systems (e.g., Microsoft Dynamics CRM and SalesForce), middleware(e.g., IBM’s WebSphere and Cordys Business Operations Platform), and hospitalinformation systems (e.g., Chipsoft and Siemens Soarian) provide detailed infor-mation about the activities that have been executed. Figure 1.4 refers to such dataas event logs. All of the PAISs just mentioned directly provide such event logs.

Page 79: Verso una gestione IT delle organizzazioni fondata sulla realtà

Process Mining

79

1.3 Process Mining 9

Fig. 1.4 Positioning of the three main types of process mining: discovery, conformance, and en-hancement

However, most information systems store such information in unstructured form,e.g., event data is scattered over many tables or needs to be tapped off from sub-systems exchanging messages. In such cases, event data exist but some efforts areneeded to extract them. Data extraction is an integral part of any process miningeffort.

Let us assume that it is possible to sequentially record events such that eachevent refers to an activity (i.e., a well-defined step in the process) and is related toa particular case (i.e., a process instance). Consider, for example, the handling ofrequests for compensation modeled in Fig. 1.1. The cases are individual requestsand per case a trace of events can be recorded. An example of a possible traceis ⟨register request, examine casually, check ticket, decide, reinitiate request, checkticket, examine thoroughly, decide, pay compensation⟩. Here activity names are usedto identify events. However, there are two decide events that occurred at differenttimes (the fourth and eighth event of the trace), produced different results, and mayhave been conducted by different people. Obviously, it is important to distinguishthese two decisions. Therefore, most event logs store additional information aboutevents. In fact, whenever possible, process mining techniques use extra informationsuch as the resource (i.e., person or device) executing or initiating the activity, thetimestamp of the event, or data elements recorded with the event (e.g., the size of anorder).

Event logs can be used to conduct three types of process mining as shown inFig. 1.4.

Page 80: Verso una gestione IT delle organizzazioni fondata sulla realtà

Punto di partenza• Visione orientata ai processi

dei dati che tracciano la realtà

• IEEE Standard XES

• Dati di partenza ottenibili con…

• Tecniche ETL

• Data warehousing

• OBDA (ricerca attiva)

80

Technische Universiteit Eindhoven University of Technology

Log

Trace

Event

Float

Int

Date

String

Container

List

Attribute

Classifier

Extension name

prefix

URI

Key

Value

<declares>

<defines> <defines>

<defines><trace-global>

<event-global>

<contains>

<contains><contains>

<contains>

ID

Boolean

<orders>

Figure 2.1: The UML 2.0 class diagram for the complete meta-model for the XES standard

• One examination in which the x-ray machine is employed

• One visit of the website, by one specific user

Tag name for the trace object in the XML serialization of XES: <trace>

No XML attributes are defined for the <trace> tag.

2.1.3 Event

Every trace contains an arbitrary number (may be empty) of event objects. Events representatomic granules of activity that have been observed during the execution of a process. As such,an event has no duration. Examples of an event are:

• Recording the client’s personal information in the database has been completed

3 XES / Version 2.0

Page 81: Verso una gestione IT delle organizzazioni fondata sulla realtà

Play-out

81

register travel request (a)

get detailed motivation letter (c)

get support from local

manager (b)

check budget by finance (d)

decide (e)

accept request (g)

reject request (h)

reinitiate request (f)

start end

Case Activity Timestamp Resource432 register travel request (a) 18-3-2014:9.15 John432 get support from local manager (b) 18-3-2014:9.25 Mary432 check budget by finance (d) 19-3-2014:8.55 John432 decide (e) 19-3-2014:9.36 Sue432 accept request (g) 19-3-2014:9.48 Mary

credits to W.M.P. van der Aalst

Page 82: Verso una gestione IT delle organizzazioni fondata sulla realtà

82

Page 83: Verso una gestione IT delle organizzazioni fondata sulla realtà

Play-in

83

register travel request (a)

get detailed motivation letter (c)

get support from local

manager (b)

check budget by finance (d)

decide (e)

accept request (g)

reject request (h)

reinitiate request (f)

start end

Case Activity Timestamp Resource432 register travel request (a) 18-3-2014:9.15 John432 get support from local manager (b) 18-3-2014:9.25 Mary432 check budget by finance (d) 19-3-2014:8.55 John432 decide (e) 19-3-2014:9.36 Sue432 accept request (g) 19-3-2014:9.48 Mary

credits to W.M.P. van der Aalst

Page 84: Verso una gestione IT delle organizzazioni fondata sulla realtà

Discovery

84 credits to W.M.P. van der Aalst

Page 85: Verso una gestione IT delle organizzazioni fondata sulla realtà

Replay

85

register travel request (a)

get detailed motivation letter (c)

get support from local

manager (b)

check budget by finance (d)

decide (e)

accept request (g)

reject request (h)

reinitiate request (f)

start end

Case Activity Timestamp Resource432 register travel request (a) 18-3-2014:9.15 John432 get support from local manager (b) 18-3-2014:9.25 Mary432 check budget by finance (d) 19-3-2014:8.55 John432 decide (e) 19-3-2014:9.36 Sue432 accept request (g) 19-3-2014:9.48 Mary

credits to W.M.P. van der Aalst

Page 86: Verso una gestione IT delle organizzazioni fondata sulla realtà

Conformance Checking

86 credits to W.M.P. van der Aalst

Page 87: Verso una gestione IT delle organizzazioni fondata sulla realtà

Hands-on

• Piccola azienda dedicata allo sviluppo di tecniche di process mining

• Tool Disco

• Slide successive: credits a Anne Rozinat e Christian Guenther

87

Page 88: Verso una gestione IT delle organizzazioni fondata sulla realtà

Scenario

88

Purchasing process ERP

Requester PurchasingAgent

RequesterManager

Supplier FinancialManager

Page 89: Verso una gestione IT delle organizzazioni fondata sulla realtà

Strategia

89

Questions Data Extraction Presentation Data

Analysis

Page 90: Verso una gestione IT delle organizzazioni fondata sulla realtà

Problemi

1.Gestione inefficiente

2.Lamentele sui tempi di gestione

3.Necessità di mostrare compliance

90

Page 91: Verso una gestione IT delle organizzazioni fondata sulla realtà

Estrazione dati

• Il personale IT estrae i log di eventi dal sistema ERP dell’azienda

• Il log è estratto come file di testo (campi separati da virgole)

91

ERP

CSVData

Page 92: Verso una gestione IT delle organizzazioni fondata sulla realtà

92

Page 93: Verso una gestione IT delle organizzazioni fondata sulla realtà

Importazione dei dati• Identificazione delle colonne

• Dove si trova l’identificativo dell’istanza di processo (id dell’ordine)?

• Dove stanno le attività?

• E i tempi di esecuzione?

• Dove trovo i ruoli e i responsabili delle attività?

93

Page 94: Verso una gestione IT delle organizzazioni fondata sulla realtà

94

Page 95: Verso una gestione IT delle organizzazioni fondata sulla realtà

Magia…

95

Page 96: Verso una gestione IT delle organizzazioni fondata sulla realtà

Dettagli

96

Page 97: Verso una gestione IT delle organizzazioni fondata sulla realtà

Zoom

97

Uscita!!!

Page 98: Verso una gestione IT delle organizzazioni fondata sulla realtà

Interazione!

98

Page 99: Verso una gestione IT delle organizzazioni fondata sulla realtà

fluxicon

Page 100: Verso una gestione IT delle organizzazioni fondata sulla realtà

fluxicon

Vista sui tempi di esecuzione

Page 101: Verso una gestione IT delle organizzazioni fondata sulla realtà

fluxicon

Page 102: Verso una gestione IT delle organizzazioni fondata sulla realtà

Visione organizzativa

102

Page 103: Verso una gestione IT delle organizzazioni fondata sulla realtà

Uno sguardo ulteriore• ProM framework (iniziativa accademica, centinaia di plug-in)

103

Screenshot of ProM 5.2

PAGE 7

Page 104: Verso una gestione IT delle organizzazioni fondata sulla realtà

Conclusioni• BPM come metafora di gestione organizzativa

orientata alla “qualità totale”

• Necessità di connettere i modelli prodotti alla realtà

• Supporto alla creazione di modelli di qualità

• Process mining per arricchire, modificare, approfondire i modelli con “l’impronta digitale” della realtà

104

Page 105: Verso una gestione IT delle organizzazioni fondata sulla realtà

Grazie

105