I Big Data di Cerved su imprese e individui...Il motore di innovazione di Cerved Web Data e analisi...
Transcript of I Big Data di Cerved su imprese e individui...Il motore di innovazione di Cerved Web Data e analisi...
I Big Data di Cerved su imprese e individui
Credit Council
Verona, 16 novembre 2016
Natalia Leonardi, Head of Centrale dei Bilanci
2
Indice
Chi è oggi Cerved Overview
I nostri big data Il motore dell’innovazione Cerved
I progetti big data e advanced analytics di Cerved live
3
Cerved: ”data driven company”
CREDIT INFORMATION
Tutelarsi dal rischio di credito
MARKETING SOLUTIONS
Crescere con nuove opportunità di business
CREDIT MANAGEMENT
Gestire e recuperare i crediti in sofferenza
353 milioni Euro (2015) Ricavi
34,000 Clienti
40 milioni Euro Investimenti/anno dati e tecnologia
4
Cerved: elementi essenziali
Dati Un database di 800 TB in
crescita continua, 17 dei
primi 30 database più diffusi
in produzione
Algoritmi Più di 2000 business rules
attive che generano oltre
600 milioni di eventi di
monitoraggio l’anno
Persone Più di 2000 persone, di cui
350 sviluppatori software e
300 analisti
I nostri big data Il motore dell’innovazione Cerved
6
Lo scheletro dei nostri “big data”
6 milioni di aziende attive Informazioni e valutazioni
strutturate ed arricchite con dati
proprietari innovativi
1,4 milioni di attività economiche non iscritte
Anagrafiche qualificate e
valutazioni dedicate
Oltre 8 milioni di persone attive
connesse ad aziende
(esponenti e soci)
7
I muscoli dei nostri “big data”
Web Data
Open Data
Dati proprietari
Dato ufficiale non camerale
Dato ufficiale camerale
A
c
c
u
r
a
c
y
C
o
m
p
l
e
s
s
i
t
à
8
Big Data Technologies
Advanced Analytics e business competence
Data Exploration e Visualization
Piattaforme evolute di visualizzazione, integrazione e business analytics con primari partner
Il motore di innovazione di Cerved
Web Data e analisi semantica
SIC - Sistemi di informazioni creditizie
I progetti Big data
10
I progetti Big data e advanced analytics di Cerved
Dati catastali e del territorio
• Score immobiliare • Score socio-economici geolocalizzati • Stima del valore degli immobili (stima 2.0)
Open data
• Open Coesione • Dati sulla PA
Analisi dei grafi / relazioni
• Graph4You
Web Data
• Web sites • News da web • Start-up innovative
11
Dati catastali Il dato catastale è disponibile sui nostri archivi e monitorato sulla maggior parte delle persone
giuridiche, sulle persone fisiche connesse (esponenti e soci) e sui privati consultati
Tipologia
•Residenziali
•Non residenziali
Qualità
Abitazioni
•Lusso, civile, villini
•Economico
•Popolare, rurale Pertinenze residenziali
Consistenze •Vani (abitazioni)
•Metri quadrati
(terreni/pertinenze/uffici e
studi/fabbricati/magazzini)
•Metri Cubi (edifici pubblici)
Rendita •Rendite (tutti gli immobili esclusi
terreni)
•Reddito dominicale (terreni)
•Reddito agrario (terreni)
Rischio
Numero di vani residenziali
Fabbricati italiani Terreni italiani 51 % 55 %
Lo score immobiliare nei rapporti Cerved
13
Lo score immobiliare ed il rischio di credito Lo score immobiliare fornisce un contributo significativo alla performance degli score di accettazione nel
segmento retail
• L’assenza di proprietà immobiliari si accompagna a bad rates più elevati
• Man mano che lo score immobiliare registra indici di consistenza patrimoniale maggiori, si osservano tassi di insolvenza sempre più bassi
81,7%
8,9% 8,3%1,2%
34,2%
23,7%
12,8%
5,8%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
30,0%
35,0%
40,0%
6 - nessun immobile
5 - patrimonio limitato
4+3 -consistenza
media
1+2 proprietà rilevanti
Bad
rat
e
bad - %
Bad Rate
14
Lo score immobiliare si è rivelato molto efficace anche per differenziare livelli di recovery rates
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
1 - Elevata 2 - Ampia 3 - Buona 4 - Discreta 5 - Moderata 6 - Non significativa
Re
cove
ry R
ate
Classe di consistenza immobiliare
Recovery Rate Medio per classe Score Immobiliare
1_ UTILITIES CESSATO
2_ UTILITIES ATTIVO
3_ TLC/SERVIZI CESSATO
Lo score immobiliare e la probabilità di recupero
15
Gli score socio-economici geolocalizzati
In presenza dell’indirizzo della persona è possibile incorporare nella valutazione del profilo di rischio delle
informazioni originali sulla micro-cella censuaria di residenza/domicilio
•Profilo socio-demografico dell’area
(fonte ISTAT):
• degrado sociale
• % disoccupati
• …..
• Grado di attrattività dell’area (fonte
OpenStreetMap): • vicinanza ai mezzi di trasporto
• lunghezza percorsi pedonali
• …..
• Indici socio-economici dell’Area da
dati Cerved
• concentrazione soci/managers
• concentrazione industrie pesanti
• …….
16
Score socio-economici ed il rischio di credito Gli indicatori sui dati micro-censuari consentono di migliorare la predittività dei modelli di accettazione nel segmento retail:
• Misurano le specificità del territorio a livello molto analitico di cella censuaria (360 mila)
• Integrati nei credit check consentono di dare maggiore granularità alla valutazione e di aumentarne l’accuratezza predittiva
0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
30.00%
35.00%
40.00%
0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
1 2 3 4 5 6 7 8 9 10
% im
pag
ato
%
Decili griglia privati + Istat
+ 7% di AR
17
Open Coesione
• OpenCoesione è il portale sull'attuazione dei progetti finanziati dalle politiche di coesione economica e sociale in Italia, volte a ridurre la disparità di sviluppo tra le regioni. Cos’è:
• maggior trasparenza, maggior partecipazione civica, monitoraggio fruibile a tutti maggior efficacia e maggior controllo degli interventi. Obiettivo:
• Opendata, inerenti risorse, localizzazioni, ambiti tematici, soggetti coinvolti, tempi di realizzazione e pagamenti dei singoli progetti.
• Aggiornamenti bimestrali (ultimo aggiornamento al 30 aprile 2016) Struttura:
• Fondi Strutturali Europei (FSE); Fondi per lo Sviluppo e la Coesione (FSC); Piano d’azione della coesione (PAC). Fondi:
• ogni progetto è finanziato da un soggetto programmatore ed è destinato ad uno o più soggetti attuatori, gli effettivi beneficiari del contributo finanziario.
• Un soggetto può essere programmatore e/o attuatore di più progetti.
• Solitamente un progetto ha un solo programmatore e un solo attuatore.
Progetti / Soggetti:
18
Il progetto Cerved su Open Coesione
Dati al 30/06/2014
65%
35%
•Matching evoluto •Risoluzione manuale •Accorpamento
Match con Codice Fiscale o Partita Iva
Matching dati Open Coesione con banca dati Cerved
Tipologia soggetto Attuatore
# soggetti
% soggetti
Imprese 50,433 59.5%
Enti 3,030 3.6%
Organi statali, pubblici 16,449 19.4%
Privati 14,791 17.5%
Totale 84,703 100.0%
809 615
PROGETTI
69.9 mld €
finanziamento Pubblico
86.5 mila €
Finanziamento medio
46.76%
% di pagamento
pubblico
19
Le imprese che hanno avuto accesso ai finanziamenti presentano tassi di sopravvivenza maggiori nel medio-lungo termine
7.0%
6.3%
7.0%
7.8%
9.0%
11.4%
0.0%
10.0%
20.0%
30.0%
40.0%
50.0%
60.0%
5.0%
6.0%
7.0%
8.0%
9.0%
10.0%
11.0%
12.0%
1. Inclusione sociale, formazione
2. Investimenti, beni, servizi, opere
pubbliche
3. Ricerca e innovazione
Confronto Tassi di Insolvenza per natura del progetto finanziato
% Soggetti (possibili più
progetti)
Sì Finanziamento OC
No Finanziamento OC
•Analizzando le imprese con
caratteristiche simili alla data del
finanziamento del progetto
(forma giuridica, settore, area
geografica, dimensione, classe
di rischio) si osserva un tasso di
insolvenza da 3 a 6 anni dopo
l’avvio del progetto fortemente
differenziato
• Le imprese finanziate sono
connotate da tassi di insolvenza
più bassi
Il progetto Cerved su Open Coesione
Open Coesione nei rapporti Cerved
21
I Web Data ‘catturati’ da Cerved
22
Web Sites e rischio di credito
-100%
-80%
-60%
-40%
-20%
0%
20%
40%
60%
80%
Sicurezza Vulnerabilità Rischio Rischio Elevato
Totale
Delta % rischio rispetto al rischio medio di classe
Obsoleta
Normale
Aggiornata
Innovativa
• Sono stati censiti i dati sulla
tecnologia del sito, il grado di
aggiornamento del sito, le lingue in cui
è tradotto, il numero di pagine e
l’articolazione, ….
• Chi adotta una tecnologia innovativa
ha un rischio di default fino all’80%
inferiore
Correlazione tra grado di innovazione della tecnologia
del sito web e profilo di rischio
Le informazioni dei siti Web sono utili per arricchire il profilo di valutazione del rischio di credito delle imprese
23
News
X1: 50K News/Mese (Italia)
IDG Internet Data Gathering
Self-Published (Ciò che il soggetto dice di sè)
co
n T
as
so
no
mia
Enti Locali
10K Fonti
External-Published (Ciò che è pubblicato da altri)
Fla
t
X2: 1,6M News/Mese (Italia)
Fonte:
Company News
6K Fonti
Governo e
Istituzioni
1K Fonti Rassegna
Stampa
2K Fonti
News di Settore
8K Fonti
170K
Blogs
Innovation &
Complexity
Impatto:
Top Industry News
21K Fonti
Arricchimento Cerved
tramite associazione
dell'identificativo univoco
di società ed esponente a
ciascuno dei soggetti
citati:
24
Start-up e PMI innovative dai Web Data
L’analisi utilizza il set informativo estratto dai siti Web aziendali e tecniche di machine learning & analisi semantica per identificare cluster di imprese simili a quelle “ufficialmente” innovative
Fonte: La Repubblica – Affari & Finanza (14 novembre 2016): “Il Cerved scova 10 mila PMI Innovative”
25
Atoka – la piattaforma di navigazione
26
Graph4You: the italian business network
La nuova piattaforma per esplorare le relazioni tra soggetti presenti nel database Cerved
Ogni nodo del grafo identifica un soggetto (Società, Persona, Ente, Impresa Non Iscritta, ecc…)
Innovativa
La sua struttura a grafo permette di identificare e
approfondire facilmente le relazioni tra i soggetti
Completa
Non solo connessioni ma anche info di dettaglio
su ciascun soggetto (es. Ateco, Fatturato,
dipendenti..)
2
Integrabile
Può essere facilmente integrata nei sistemi
gestionali del cliente, per permetterne un utilizzo
ottimale
3
1