Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

22
24 Febbraio 2014 Il percorso di Cerved per connettere i Big Data KNOWLEDGE GRAPH Diego Sanvito - Data Innovation Manager

Transcript of Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

Page 1: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

24 Febbraio 2014

Il percorso di Cerved per connettere i Big Data

KNOWLEDGE GRAPH

Diego Sanvito - Data Innovation Manager

Page 2: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

2

Indice

Il contesto aziendale

Prodotti su grafi

Uno sguardo al futuro

Page 3: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

Il contesto aziendale

Page 4: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

4

Il contesto & i suoi numeri

CREDIT INFORMATION Tutelarsi dal rischio di

credito

MARKETING SOLUTIONS Crescere con nuove

opportunità di business

CREDIT MANAGEMENT Gestire e recuperare i

crediti in sofferenza

Ricerche Anagrafiche:

110.000

Blocchi di informazione Erogati:

2.200.000

Chiamate a Servizi

8.500.000

Eventi su Dati

4.500.000

Operazioni su Storage documentale

6.500.000

Calcoli Rating

300.000

40 milioni di righe di codice

Services e Microservices

2.500

2.000 Persone

34.000 Clienti

Ricavi 2015

353 Milioni €

1.100 Server On premise e 1.000

TB di Storage

IN UN GIORNO IN CERVED:

Page 5: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

5

I nostri “big data

Web Data

Open Data

Dati proprietari

Dato ufficiale non camerale

Dato ufficiale camerale

Accuratezza

Complessità

Page 6: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

Prodotti su grafi

Page 7: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

7

Il titolare effettivo

Livello 1 Willy 10%

Livello 3 Willy 24.4%

Livello 4 Willy 34.2%

TITOLARE EFFETTIVO

ALPHA spa

Soc. A (40%)

Soc. B (50%)

Willy (10%)

Soc. A1 (40%)

Soc. A2 (60%)

Soc. B1 (40%)

Soc. B2 (60%)

Willy (40%)

Duffy (60%)

Willy (40%)

Soc. B1.1 (60%)

Soc. B2.1 (50%)

Speedy (50%)

Willy (90%)

Bunny (10%)

Livello 2 Willy 10%

La persona fisica o le persone che, in ultima istanza, possiedano o controllino la società stessa, attraverso il possesso/controllo diretto/ind di una % delle partecipazioni al capitale sociale o dei diritti di voto in seno a essa pari ad almeno il 25%+1 di partecipazione al capitale sociale

Page 8: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

8

Livello Titolare effettivi

1 3.395.074

2 202.500

3 44.432

4 11.256

5 3.350

6 1.144

7 411

8 339

9 97

10 31

11 16

12 10

13 6

14 4

15 2

TOT 3.658.672

Il titolare effettivo /2

• Totale titolari effettivi 3.658.672

• 2.756.00 titolari effettivi distinti calcolati su 2.238.000 aziende

• Circa 150.000 computazioni/ora

• Più di 350.000 notifiche push verso i nostri clienti (principalmente banche) negli ultimi 6 mesi

• Su grafo occorrono 39 ms per arrivare al 15° livello (contro i 369 ms su DB relazionale prestazionale per arrivare solo al 4° livello)

Statistiche 2016

Page 9: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

9

221.821

Gli attuali gruppi economici Cerved ammontato a circa 220 mila unità, con

un aumento del 22% della recall rispetto al precedente modello.

Il nuovo modello ha migliorato l’accuratezza di circa il 30% con una miglior gestione dei cicli di controllo 75%

Capogruppo

persona fisica

25% Capogrupo

persona giuridica

Gruppi economici Cerved

Page 10: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

10

Cerved Knowledge Graph

Produzione di software non

connesso all'edizione

SPAZIODATI 0,4 mln

25%

10%

CERVED 320 mln 49%

ERRE3 ltd 2.320 mln

ERRE3 99 mln

90%

Socio Esponente Tit.Effettivo Web Link Ateco

25%

CEO

CEO

Page 11: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

11

Graph4you

• Società 10 M • Iscritte 8,1 M (di cui cessate) 1,9 M • Non iscritte 1,6 • Estere 350 K

• Persone fisiche 16,4 M • Indirizzi 4,5 M • Customer data

• Esponente di.. 15,6 M

• Socio di.. 8 M

• Condivisione immobili 14,7 M

• Residenza in.. 16,7 M

• Titolare effettivo 3,6 M

• Fusioni 100K

Filtri

• Tipologie di nodi • Profondità connessione • Tipo di relazione • Proprietà delle relazioni

NODI ≌ 30 milioni

RELAZIONI ≌ 59 milioni

Page 12: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

12

Overview dell’architettura

WEB APP

FRONT - END

SPRING BOOT

LINKURIOUS.JS

BOOTSTRAP

CUSTOM CODE

JASPER REPORT

SPRING BOOT

SPRING

GRAPH DATA

JAVA

Shortest Path

Traversal

REST API

BACK - END

API

Transactional

HTTP API INGESTION

Graph file

MySQL

Page 13: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

14

Corporate Web Crawler

Crawling Annotation

Indexing Matching & filtering

Domain seed

Page 14: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

15

Web Data

Dati Cerved

News Social Data

Gov Open Data

Business Graph

Page 15: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

16

Atoka – Sales & Marketing intelligence

Trovare nuovi clienti, fornitori e partner

Monitorare la concorrenza

Coinvolgere potenziali clienti

Page 16: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

17

Atoka – Ricerche & filtri

Ricerche semplici ed efficaci!

Page 17: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

18

Atoka – Ricerca in modo innovativo

Ricerche per keyword

Ricerche web avanzate

Page 18: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

19

Atoka – Dettagli delle aziende

Page 19: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

Uno sguardo al futuro

Page 20: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

23

Present & future in innovation journey

Work in Progress

Similarity Score / Lead generations

Servizi di recommendation e di similarity su clienti in portafoglio, in base a settori merceologici, dimensioni, locations, et al.

Company Activities Clustering / Activies supply chain map

Creazione di nuovi cluster settoriali in base alle keywords delle aziende da web / creazione di nuove filiere di prodotto

Next

Critical Chain (Contagion Risk, Debts Restructuring, Acquisition Strategy)

Modelli di rischio di contagio, analisi della ristrutturazione di debiti, analisi per strategia di acquisizione.

Next

Page 21: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

24

Innovation

Big Data Technologies

Agile Minimum viable product,

Scrum , Kanban

Data Exploration To find new value from our data

Spaziodati

Open Innovation Data Visualization To shine our uniquess

Page 22: Knowledge graph: il percorso di Cerved per connettere i Big Data - Diego Sanvito

Not Cerved images in the presentation © Jurgen Appelo, Creative Commons 3.0 BY http://www.management30.com/

https://creativecommons.org/licenses/by-nc-sa/3.0/ Licensing presentation:

Q&A to Diego Sanvito – Data Innovation Manager

Twitter: jk.diego.sanvito

Linkedin: https://it.linkedin.com/in/diego-sanvito

Mail: [email protected]

Thanks!