24 Febbraio 2014
Il percorso di Cerved per connettere i Big Data
KNOWLEDGE GRAPH
Diego Sanvito - Data Innovation Manager
2
Indice
Il contesto aziendale
Prodotti su grafi
Uno sguardo al futuro
Il contesto aziendale
4
Il contesto & i suoi numeri
CREDIT INFORMATION Tutelarsi dal rischio di
credito
MARKETING SOLUTIONS Crescere con nuove
opportunità di business
CREDIT MANAGEMENT Gestire e recuperare i
crediti in sofferenza
Ricerche Anagrafiche:
110.000
Blocchi di informazione Erogati:
2.200.000
Chiamate a Servizi
8.500.000
Eventi su Dati
4.500.000
Operazioni su Storage documentale
6.500.000
Calcoli Rating
300.000
40 milioni di righe di codice
Services e Microservices
2.500
2.000 Persone
34.000 Clienti
Ricavi 2015
353 Milioni €
1.100 Server On premise e 1.000
TB di Storage
IN UN GIORNO IN CERVED:
5
I nostri “big data
Web Data
Open Data
Dati proprietari
Dato ufficiale non camerale
Dato ufficiale camerale
Accuratezza
Complessità
Prodotti su grafi
7
Il titolare effettivo
Livello 1 Willy 10%
Livello 3 Willy 24.4%
Livello 4 Willy 34.2%
TITOLARE EFFETTIVO
ALPHA spa
Soc. A (40%)
Soc. B (50%)
Willy (10%)
Soc. A1 (40%)
Soc. A2 (60%)
Soc. B1 (40%)
Soc. B2 (60%)
Willy (40%)
Duffy (60%)
Willy (40%)
Soc. B1.1 (60%)
Soc. B2.1 (50%)
Speedy (50%)
Willy (90%)
Bunny (10%)
Livello 2 Willy 10%
La persona fisica o le persone che, in ultima istanza, possiedano o controllino la società stessa, attraverso il possesso/controllo diretto/ind di una % delle partecipazioni al capitale sociale o dei diritti di voto in seno a essa pari ad almeno il 25%+1 di partecipazione al capitale sociale
8
Livello Titolare effettivi
1 3.395.074
2 202.500
3 44.432
4 11.256
5 3.350
6 1.144
7 411
8 339
9 97
10 31
11 16
12 10
13 6
14 4
15 2
TOT 3.658.672
Il titolare effettivo /2
• Totale titolari effettivi 3.658.672
• 2.756.00 titolari effettivi distinti calcolati su 2.238.000 aziende
• Circa 150.000 computazioni/ora
• Più di 350.000 notifiche push verso i nostri clienti (principalmente banche) negli ultimi 6 mesi
• Su grafo occorrono 39 ms per arrivare al 15° livello (contro i 369 ms su DB relazionale prestazionale per arrivare solo al 4° livello)
Statistiche 2016
9
221.821
Gli attuali gruppi economici Cerved ammontato a circa 220 mila unità, con
un aumento del 22% della recall rispetto al precedente modello.
Il nuovo modello ha migliorato l’accuratezza di circa il 30% con una miglior gestione dei cicli di controllo 75%
Capogruppo
persona fisica
25% Capogrupo
persona giuridica
Gruppi economici Cerved
10
Cerved Knowledge Graph
Produzione di software non
connesso all'edizione
SPAZIODATI 0,4 mln
25%
10%
CERVED 320 mln 49%
ERRE3 ltd 2.320 mln
ERRE3 99 mln
90%
Socio Esponente Tit.Effettivo Web Link Ateco
25%
CEO
CEO
11
Graph4you
• Società 10 M • Iscritte 8,1 M (di cui cessate) 1,9 M • Non iscritte 1,6 • Estere 350 K
• Persone fisiche 16,4 M • Indirizzi 4,5 M • Customer data
• Esponente di.. 15,6 M
• Socio di.. 8 M
• Condivisione immobili 14,7 M
• Residenza in.. 16,7 M
• Titolare effettivo 3,6 M
• Fusioni 100K
Filtri
• Tipologie di nodi • Profondità connessione • Tipo di relazione • Proprietà delle relazioni
NODI ≌ 30 milioni
RELAZIONI ≌ 59 milioni
12
Overview dell’architettura
WEB APP
FRONT - END
SPRING BOOT
LINKURIOUS.JS
BOOTSTRAP
CUSTOM CODE
JASPER REPORT
SPRING BOOT
SPRING
GRAPH DATA
JAVA
Shortest Path
Traversal
REST API
BACK - END
API
Transactional
HTTP API INGESTION
Graph file
MySQL
14
Corporate Web Crawler
Crawling Annotation
Indexing Matching & filtering
Domain seed
15
Web Data
Dati Cerved
News Social Data
Gov Open Data
Business Graph
16
Atoka – Sales & Marketing intelligence
Trovare nuovi clienti, fornitori e partner
Monitorare la concorrenza
Coinvolgere potenziali clienti
17
Atoka – Ricerche & filtri
Ricerche semplici ed efficaci!
18
Atoka – Ricerca in modo innovativo
Ricerche per keyword
Ricerche web avanzate
19
Atoka – Dettagli delle aziende
Uno sguardo al futuro
23
Present & future in innovation journey
Work in Progress
Similarity Score / Lead generations
Servizi di recommendation e di similarity su clienti in portafoglio, in base a settori merceologici, dimensioni, locations, et al.
Company Activities Clustering / Activies supply chain map
Creazione di nuovi cluster settoriali in base alle keywords delle aziende da web / creazione di nuove filiere di prodotto
Next
Critical Chain (Contagion Risk, Debts Restructuring, Acquisition Strategy)
Modelli di rischio di contagio, analisi della ristrutturazione di debiti, analisi per strategia di acquisizione.
Next
24
Innovation
Big Data Technologies
Agile Minimum viable product,
Scrum , Kanban
Data Exploration To find new value from our data
Spaziodati
Open Innovation Data Visualization To shine our uniquess
Not Cerved images in the presentation © Jurgen Appelo, Creative Commons 3.0 BY http://www.management30.com/
https://creativecommons.org/licenses/by-nc-sa/3.0/ Licensing presentation:
Q&A to Diego Sanvito – Data Innovation Manager
Twitter: jk.diego.sanvito
Linkedin: https://it.linkedin.com/in/diego-sanvito
Mail: [email protected]
Thanks!
Top Related