Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al...
Transcript of Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al...
Trieste, 28 marzo 2001
Data Mining nel Marketing: l'esperienza in una società di internet
CRM & Profiling
Confidential CRM&Profiling2
Agenda
1. Lo scenario di mercatoActual FiguresBasic concepts
2. Tin.it
3. Il Customer Base ManagementCRM Profiling e segmentazioneLa Statistica e il Data-mining per il Marketing sulla Customer
Base
4. Alcuni casi: metodologia e praticaIl valoreIl churnI surfers: profiling
Confidential CRM&Profiling3
1.1.Lo scenario di mercatoLo scenario di mercato
Confidential CRM&Profiling4
7 GIORNIN. DI INDIVIDUI N. DI INDIVIDUI
NOVEMBRE 2000
TOTALE UTENTI INTERNETTARGET “ALLARGATO”
(casa, lavoro, scuola, biblioteca, amici, bar)
CASA
LAVORO
SCUOLA
AMICI
BIBLIOTECA
BARTOTALE UTENTI INTERNET
TARGET “PRIMARIO”(casa, lavoro, scuola)
CORSI DI FORMAZIONE
10.400.000
6.200.000
3.100.000
1.400.000
100.000
3.150.000
290.000
430.000
8.800.000
6.600.000
4.600.000
2.100.000
570.000
48.000
770.000
140.000
48.000
6.200.000
3 MESI
16.200.000
9.400.000
POSSIEDONO PC IN CASAPC DI CASA COLLEGATO
AD INTERNET
21,7
13
6,5
3
0,2
6,6
0,6
0,9
18,5
33,9
19,6
13,9
9,6
4,4
1,2
0,1
1,6
0,3
0,1
12,9
Fonte : Eurisko
Actual Figures: collegamento a internet
Confidential CRM&Profiling5
Actual Figures: l’evoluzione POSSIEDONO PC IN CASA
UTENTI INTERNETCASA (ult. 3 mesi)
PC DI CASACOLL. ADINTERNET
UTENTI DI PC A CASA
Ute
nti (
in m
iglia
ia)
in migliaia di individuiNOVEMBRE
1997GIUGNO
1998NOVEMBRE
1998GIUGNO
1999NOVEMBRE
1999GIUGNO
2000
POSSIEDONO PC IN CASA 10.400 11.300 11.900 12.900 13.050 15.000UTENTI DI PC A CASA 5.600 6.700 6.900 7.500 8.000 9.000PC DI CASA COLLEGATOAD INTERNET 860 1.400 1.900 2.800 4.100 7.100UTENTI INTERNET CASA(ultimi 3 mesi) 520 850 1.200 1.700 2.500 4.600
NOVEMBRE 2000
16.200
10.600
9.400
6.200
Nov.97 Giu.98 Nov.98 Giu.99 Nov.99 Giu.00 Nov.000
2000
4000
6000
8000
10000
12000
14000
16000
Fonte : Eurisko
Confidential CRM&Profiling6
Actual Figures: target potenziale
TOTALE
20.500
8.800
CASA LAVORO
AMBITI DI COLLEGAMENTO
TARGET POTENZIALE (A)(migliaia di individui)
TARGET ATTUALE (B)(migliaia di individui)
16.900
6.200
6.800
3.100
SCUOLA
4.800
1.400
42.9INDICE DI SATURAZIONE %( A/B ) 36.7 45.6 29.2
Fonte : Eurisko
Confidential CRM&Profiling7
Actual figures: penetrazione
0
10
20
30
40
50
1998 1999 2000 2001 2002 2003 2004 2005
totale on line
broadband
Penetrazione di internet in Italia(% del totale famiglie)
Fonte: Forrester Research, july 2000
%
Confidential CRM&Profiling8
Actual figures: i provider
SPONTANEANOTORIETÀ TOTALE CASA
(n=676)SCUOLA(n=177)
LAVORO(n=391)
NOTORIETA’ TOTALE
AMBITI DI COLLEGAMENTO
TIN.IT
KATAWEBYAHOO! ON LINE
ITALIA ON LINE (IOL)
CIAOWEB
INTERFREE
WIND
INFOSTRADATISCALI FREENET
JUMPY
LIBERO
CLUBNET
TELECOM ITALIA NET (NET)INFOSTRADA (NET)
878375
79
5862595246474319939649
888377
79
5563625840454514949543
818370
83
5571684244493621899550DADANET (NET)
8682
748080
6756
6059
5042
4541
1692
9645
6245
393231
28201918
1411108
474
6912
SUPEREVA
INFINITO
71
69
79
64
80
67
Fonte : Eurisko
Confidential CRM&Profiling9
Actual figures: il contenuto
ConnotazioneConnotazione
AmpiezzaAmpiezza
Siti Aziendali
Siti Monotematici
Portals
Target PortalsV-ortals
Confidential CRM&Profiling10
Actual Figures: I primi 10 portali
Fonte : AC Nielsen
0 50000 100000 150000 200000
iol.it
virgilio.it
msn.com
supereva.it
yahoo.it
tiscali.it
kataweb.it
msn.it
clarence.com
tin.it
0 50000 100000 150000 200000 250000 300000 350000
iol.it
virgilio.it
kataw eb.it
yahoo.com
supereva.it
msn.it
tiscalinet.it
altavista.com
yahoo.it
tin.it
Fonte : One to One Research
Confidential CRM&Profiling11
Actual figures: Starting Page
ConnotazioneConnotazioneConnotazioneConnotazione
AmpiezzaAmpiezzaAmpiezzaAmpiezza
Siti Aziendali
Siti Monotematici
Portals
Target PortalsV-ortals
.> 90 %
0 50000 100000 150000 200000
iol.it
virgilio.it
msn.com
supereva.it
yahoo.it
tiscali.it
kataweb.it
msn.it
clarence.com
tin.it
0 50000 100000 150000 200000 250000 300000 350000
iol.it
virgilio.it
kataw eb.it
yahoo.com
supereva.it
msn.it
tiscalinet.it
altavista.com
yahoo.it
tin.it
Confidential CRM&Profiling12
Actual figures: Service UsageFonte : Ipsos - Explorer Active Adv / Eurisko
40 %
EE--mailmailSurfingSurfingDownloadDownload/FTP/FTP(mp3+SW)(mp3+SW)
Chat Chat / / VideoChatVideoChatNewsgroupNewsgroup/Forum/ForumInvio SMSInvio SMSA/V A/V StreamingStreamingRadio On Line Radio On Line NewslettersNewslettersInstant MessagingInstant MessagingCommunityCommunityVoIPVoIP
26 %
21 %
10 %
29 %
94 % 82 %93 % 92 %
45 % 46 %33 % 40 %32 % 31 %
20 % 19 %13 %10 %
Confidential CRM&Profiling13
2.2.Tin.Tin.itit
Confidential CRM&Profiling14
Tin.it: lo scenario di riferimento
Il primo ISP del mercato Internet ItaliaIl primo ISP del mercato Internet Italia
Il titolare della maggioreIl titolare della maggiore CustomerCustomer Base di Base di surferssurfers
Il più capillare gestore italiano di POP fisiciIl più capillare gestore italiano di POP fisici
Confidential CRM&Profiling15
Tin.it: il modello di business
Presidio capillare del territorioPresidio capillare del territorio
Portafoglio prodotti segmentato Portafoglio prodotti segmentato
Modello evolutivo : ISP Portale OrizzontaleModello evolutivo : ISP Portale Orizzontale
FocalizzazioneFocalizzazione verso C.R.M. verso C.R.M.
Linee di Linee di RevenuesRevenues ::Canone mensile / annualeCanone mensile / annualeTraffico Traffico IncomingIncoming (da T.I.)(da T.I.)ImpressionsImpressionsCommissioni da Commissioni da clicktroughclicktrough & & feefee mensilemensile
Confidential CRM&Profiling16
Tin.it: Consumer Strategy
Collegare il business al consumer aggregando
– attraverso i diversi media –una massa critica di utenti
La mission è divenire il leader italiano nei servizi interattivi online, integrando accesso,
comunicazione, navigazione, contenuti e commercio per
aiutare gli utilizzatori a realizzare i benefici di un mondo connesso
On line Strategy
Confidential CRM&Profiling17
Tin.it: la catena del valore - consumer
ContentContentAccessAccessDevicesDevices
Web on TVSet Top Box
AdvertisingAdvertising&&
Commerce Commerce AggregaAggrega--
tiontion
Simpleappliances
Confidential CRM&Profiling18
Tin.it: offerta consumer
Confidential CRM&Profiling19
Tin.it: la catena del valore
Portare le piccole/medie imprese e i professionisti online per aumentare sia la
produttività che la competitività e per stimolarli alla interazione online con i
clienti
Confidential CRM&Profiling20
Tin.it: la catena del valore - business
eBusinesseBusiness & & eCommerce eCommerce
Web Web PublishingPublishing
Web Web HostingHosting
Un’offerta completa per aiutare i clienti a ottenere valore da Internet
VASVASAccessAccessWeb Web ServicesServices
Advanced Messaging
Desktop productivity
solutions
WAP servicesLAN
Confidential CRM&Profiling21
Tin.it: l’offerta business
E-commerceE-commerce
Integratede-businessIntegratede-business
Accesso
Servizi
Web presenceWeb presence
Sophisticated access
Sophisticated access
Basic accessBasic
access
LAN access LAN access
Di Base IntegrazioneEntry Level
Alta velocità
VirtualCompany
Confidential CRM&Profiling22
Tin.it: posizionamento
Internet Internet Actor’s MatrixActor’s Matrix
ConnotazioneConnotazioneConnotazioneConnotazione
AmpiezzaAmpiezzaAmpiezzaAmpiezza
Siti Aziendali
Siti Monotematici
Portals
Target PortalsV-ortals
neo users
Confidential CRM&Profiling23
Tin.it: posizionamento
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
Confidential CRM&Profiling24
Tin.it: posizionamento
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
Confidential CRM&Profiling25
Tin.it: posizionamento
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
3 %
26 %
26 %
9 %
12 %
5 %
9 %
9 %
customer customer needsneeds
???
Confidential CRM&Profiling26
Tin.it: posizionamento
Attivazione Fruizione
Heavy Users
Dummies
e-commerce5 %
ISP / Prodotti26%
help / CCareloyalty26 %
news12 %
advertising12 %
Aree tematiche
9 %
communitymsg chat
9 %
pers- e-mail5 %
Confidential CRM&Profiling27
Virgilio: posizionamento
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
Confidential CRM&Profiling28
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
Virgilio: posizionamento
Confidential CRM&Profiling29
Virgilio: posizionamento
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
1 %
3 %
33 %
44 %
10 %
0 %
1 %
8 %
customer customer needsneeds
???
Confidential CRM&Profiling30
Virgilio: posizionamento
Attivazione Fruizione
Heavy Users
Dummies
e-commerce0 %
ISP / Prodotti3%
help / CCareloyalty33 %
news10 %
Aree tematiche
44 %
communitymsg chat
1 %
pers. e-mail1 %
advertising8 %
Confidential CRM&Profiling31
Insieme: tin.it-Virgilio
Area ISP / Prodotti
Help / Ccare / Loyalty
Area Personal Mail
Area Themes
Area News
Area e-commerce
Community / Messaging / Chat
Advertising
1 %
3 %
33 %
44 %
10 %
0 %
1 %
8 %
3 %
26 %
26 %
9 %
12 %
5 %
9 %
9 %
Tin.it - VirgilioTin.Tin.itit -- VirgilioVirgilio
Confidential CRM&Profiling32
3.3.Il Il customer customer base base
managementmanagement
Confidential CRM&Profiling33
Tin.it Customer Base di
c-99
feb-
00
apr-0
0
giu-
00
ago-
00
ott-0
0
dic-
00pa
yto
tale
0500
10001500
2000
2500
3000
3500
4000
paytotale
dic-
99
feb-
00
apr-0
0
giu-
00
ago-
00
ott-0
0
dic-
00 pay
tota
le
0
200
400
600
800
1000
1200
paytotale
Nuove AcquisizioniCustomer Base
IL MANAGEMENT DELLA CUSTOMER BASE IL MANAGEMENT DELLA CUSTOMER BASE GUIDA LA NOSTRA STRATEGIA DI MARKETINGGUIDA LA NOSTRA STRATEGIA DI MARKETING
Confidential CRM&Profiling34
Customer base: Approccio strategico
Un unico obiettivo:Un unico obiettivo:
Aumentare ilAumentare il Customer Lifetime ValueCustomer Lifetime Valueattraversoattraverso lala riduzione delriduzione del churn churn ee l’aumento dell’ARPUl’aumento dell’ARPU
PROFILING & SEGMENTATIONPROFILING & SEGMENTATION
��Identificare i potenziali “Identificare i potenziali “churnerschurners””
��Massimizzare la soddisfazione dei clientiMassimizzare la soddisfazione dei clienti
��Focalizzarsi su target per cross e up sellFocalizzarsi su target per cross e up sell
Ridurre il Ridurre il churnchurn
Massimizzare ilMassimizzare ilvalore del clientevalore del cliente
… attraverso… attraverso
Confidential CRM&Profiling35
Basic concept: Customer Relationship Management
IdentificareRealizzarePraticare
tutte le attività necessarie a garantire il processo di attenzione e
fidelizzazione dell’individuo verso l’azienda e la sua offerta di prodotti e
servizi
e, conseguentemente
la massimizzazione delle opportunità di business attraverso la
soddisfazione costante dei bisogni
Confidential CRM&Profiling36
Segmentazione per azioni di “massa”?
2. 2. AZIONI DI “MASS”AZIONI DI “MASS”�� Impatto sui Prodotti & ServiziImpatto sui Prodotti & Servizi�� Alto VolumeAlto Volume�� Economie di ScalaEconomie di Scala
�� Sviluppo dei prodotti principaliSviluppo dei prodotti principali�� Crescita dei VAS / Offerte opzionaliCrescita dei VAS / Offerte opzionali�� Aumento del valore dellaAumento del valore della CustomerCustomer BaseBase�� Diminuzione del Diminuzione del ChurnChurn
1. 1. POCHE VARIABILIPOCHE VARIABILI�� approccio Si/Noapproccio Si/No�� approccio “approccio “BehaviouralBehavioural””
3. 3. UN OBIETTIVO ALLA VOLTAUN OBIETTIVO ALLA VOLTA
Confidential CRM&Profiling37
Profiling per servizi “customized”
2. 2. AZIONI INDIRIZZATE AL CLIENTEAZIONI INDIRIZZATE AL CLIENTE�� Impatto su ogni singolo cliente/NavigatoreImpatto su ogni singolo cliente/Navigatore�� Alti costiAlti costi�� Alta “Alta “redemptionredemption” / Valore” / Valore
3. 3. MOLTI OBIETTIVI CONTEMPORANEAMENTE!MOLTI OBIETTIVI CONTEMPORANEAMENTE!�� Aumento della fedeltà (Aumento della fedeltà (LoyaltyLoyalty))�� Azioni di push: Up Sell / Cross SellAzioni di push: Up Sell / Cross Sell�� Azioni di push: passaparolaAzioni di push: passaparola�� Raccolta di informazioniRaccolta di informazioni
1. 1. MOLTE VARIABILI: MOLTE VARIABILI: PrevisivoPrevisivo & “& “BehaviouralBehavioural””�� Utilizzo dei VASUtilizzo dei VAS�� Pattern d’usoPattern d’uso�� Chiamate al CCChiamate al CC
�� Valore e Valore e RevenueRevenue atteseattese�� Rischio di Rischio di churnchurn�� Scelta dell’abbonamento giustoScelta dell’abbonamento giusto
�� Dropped callsDropped calls�� InsolvenzeInsolvenze�� Reazione a campagne di Reazione a campagne di mktgmktg
Confidential CRM&Profiling38
Customer base: Segmentazione di base0%
VA
LOR
E D
EL C
LIEN
TE
100%
0%
V
ALO
RE
DEL
CLI
ENTE
10
0%
0% FEDELTA’ DEL CLIENTE 0% FEDELTA’ DEL CLIENTE 100%100%
MASSIMIZZARE MASSIMIZZARE IL VALOREIL VALORE
�� OPERATORE CC PERSONALEOPERATORE CC PERSONALE�� NUOVI VASNUOVI VAS�� MEMBER GETS MEMBERMEMBER GETS MEMBER�� CURA & ATTENZIONECURA & ATTENZIONE
AZIONI A BASSO AZIONI A BASSO COSTO/ NO COSTO/ NO
PROMOZIONIPROMOZIONI
�� NON COSTI AGGIUNTIVI PER LANON COSTI AGGIUNTIVI PER LAGESTIONE DEL CLIENTEGESTIONE DEL CLIENTE
�� AZIONI DI “MASSA”AZIONI DI “MASSA”
AUMETARE IL AUMETARE IL VALOREVALORE
�� AZIONI DI UP / CROSS SELLAZIONI DI UP / CROSS SELL�� INCENTIVARE L’USOINCENTIVARE L’USO�� INCENTIVARE ATTIVAZIONE DI VASINCENTIVARE ATTIVAZIONE DI VAS
COSTRUIRE COSTRUIRE FELDELTA’FELDELTA’
�� DIFFERENZIAZIONE DEI SERVIZIDIFFERENZIAZIONE DEI SERVIZIINBOUND & OUTBOUNDINBOUND & OUTBOUND
�� SCHEMA DI LOYALTY (Incentivi)SCHEMA DI LOYALTY (Incentivi)�� BLOCCHI (Disincentivi alla fuga)BLOCCHI (Disincentivi alla fuga)
…ALLA CONCORRENZA!…ALLA CONCORRENZA!
Confidential CRM&Profiling39
Basic Concept: Dimesione per fase
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Fonte :
35 %26 %39 %
Corrispondenza dati Datamedia – 09/2000
!!! Piu’ del 60% della popolazione non e’ ancora in fasi di fruizione evoluta dei servizi di rete !!!
0 – 12 mesi 12 – 24 mesi > 24 mesiTEMPO
Frequenza di utilizzoFrequenza di utilizzoFrequenza di utilizzo
Confidential CRM&Profiling40
Actual figures: Needs x segment
Needs
Premium AccessPremium AccessFreeFree AccessAccessDirectory Directory servicesservicesSearch Search EngineEngineEE--mailmailChatChatVideo Video ChatChatNewsGroupNewsGroupEE--mail / SMS pushmail / SMS pushAudio / Video Audio / Video StreamingStreamingVoIPVoIPFTPFTP
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
Segment
Confidential CRM&Profiling41
Market trends: Customer interest/needs
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
☺☺☺☺ ☺☺☺☺ ���� ���� ����
���� ☺☺☺☺ ☺☺☺☺ ���� ����
AdvertisingHelp / Ccare / LoyaltyDirectoriesInvio SMSAree TematicheChat / Video ChatPersonal MailISP ProdottiArea General News
ServicesServices
���� ☺☺☺☺ ☺☺☺☺ ���� ����
��������������������
☺☺☺☺ ☺☺☺☺ ���� ���� ����
���� ☺☺☺☺ ���� ���� ����
���� ☺☺☺☺ ☺☺☺☺ ���� ����
���� ���� ☺☺☺☺ ☺☺☺☺ ����
☺☺☺☺���� �������� ����
Confidential CRM&Profiling42
Market trends: customer interest/needs
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Audio Video StreamingRadio On LineDownload (mp3+SW)
CommunityInstant MessagingNewslettersArea e-commerceMobile ChannelsMobile Commerce
ServicesServices
����
����
����
����
���� ����
����
☺☺☺☺
☺☺☺☺ ☺☺☺☺
���� ���� ���� ☺☺☺☺ ☺☺☺☺
���� ���� ☺☺☺☺ ☺☺☺☺ ����
���� ���� ☺☺☺☺���� ☺☺☺☺
���� ���� ���� ����☺☺☺☺
���� ���� ���� ☺☺☺☺ ☺☺☺☺
���� ���� ���� ☺☺☺☺����
���� ���� ���� ☺☺☺☺����
Confidential CRM&Profiling43
Market trends: l’evoluzione
Dimensione Dimensione per per FaseFase
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti
Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti
Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3
FASE
Fonte :
35 %35%30 %1o S 2001
2o S 2001 50 %30%20 %
35 %26 %39 %2o S 2000
Confidential CRM&Profiling44
Basic concept: Profiling
IdentificareClassificareAcquisireGestire
tutte le informazioni che consentono la conoscenza e l’analisi
del proprio target di riferimento
e, conseguentemente
la realizzazione di prodotti e servizi ad elevata probabilità di
soddisfazione dei suoi bisogni
sources analysis mgmnt
Confidential CRM&Profiling45
3.bis3.bisIl Il customer customer base managementbase management
Il data Il data mining mining come strumentocome strumento
Confidential CRM&Profiling46
Customer base: il DWH
InformaziniInformazinisocio demografichesocio demografiche
DATAWAREHOUSEDATAWAREHOUSE
InformazioniInformazionisulla attivazionesulla attivazione
Dati sull’uso & Dati sull’uso & sulla retesulla rete
Informazioni da Informazioni da ricerche di mercatoricerche di mercato((customer satisfactioncustomer satisfaction, U & A, …), U & A, …)
dati dal dati dal callcall centercenter((callscalls, , complainscomplains, , billing problemsbilling problems))
Pattern di utilizzoPattern di utilizzo(log (log filesfiles, , cookiescookies…)…)
Confidential CRM&Profiling47
Customer base: data mining
analisianalisi
statisticastatistica e e
data miningdata mining Reti neuraliReti neuralialberialberi CARTCART
queries queries su liste di clientisu liste di clientiRegressioni di Regressioni di base e base e modernemoderneK K -- nearest neighborsnearest neighbors
GAM, MARSGAM, MARS
Confidential CRM&Profiling48
Profiling: i problemi
Numero uno:Numero uno:costruire un DWH costruire un DWH
è enorme!è enorme!
Campioni di clienti possono essere molto utiliCampioni di clienti possono essere molto utili
Per esempioPer esempio
•• tieni conto degli obiettivi dell’analisitieni conto degli obiettivi dell’analisi
•• non concentrarti solo su da dove e come non concentrarti solo su da dove e come raccogliere le informazioniraccogliere le informazioni
•• utilizza estrazioni di parti del DWH (utilizza estrazioni di parti del DWH (datamartdatamart) ) diverse a seconda degli obiettividiverse a seconda degli obiettivi
Nel Nel datamart datamart per la previsione del per la previsione del churnchurn, è più utile tenere , è più utile tenere l’informazione sugli errori di fatturazione rispetto ai dettaglil’informazione sugli errori di fatturazione rispetto ai dettaglisociodemograficisociodemografici
DWHDWH
Confidential CRM&Profiling49
Profiling: i problemi
Numero due:Numero due:analisi e data analisi e data miningmining
Mantienilo semplice!Mantienilo semplice!
Non fidarti sulle soluzioni automatiche (black box) come: Non fidarti sulle soluzioni automatiche (black box) come: ”schiaccia il bottone e la rete farà tutto per te!””schiaccia il bottone e la rete farà tutto per te!”
Parti da un approccio di base e gradualmente spostati su Parti da un approccio di base e gradualmente spostati su soluzioni più sofisticatesoluzioni più sofisticate
Confidential CRM&Profiling50
4.4.Alcuni casi: Alcuni casi:
metodologia e praticametodologia e pratica
Confidential CRM&Profiling51
4.14.1Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica
Il valoreIl valore
Confidential CRM&Profiling52
Il valore del cliente
ObiettiviObiettivi�Individuazione dei clienti da trattarecon maggior cura�Individuazione di clienti su cui agireper aumentare la redditività
StrumentiStrumenti�Determinazione di un indicatore del valore per tin.it di cascun cliente�Definizione di poche classi di valore
Confidential CRM&Profiling53
Il valore: le classi
25.1%
30.8%
15.7%
quota clienti quota valore totale
4
5.7%
5.47%
14.0%
48.4%
14.5%
18.5%
13.1%
3.8%
81.4%
5
3
12
6.9%
20.7%
67
1.0%
0.7%
•Si determina per ogni cliente un indicatore di “valore” (ARPU) con caratteristiche di semplicità, intuitività e stabilità nel tempo
•Si determina la classifica dei clienti ordinata secondo il “valore” che essi portano a tin.it e si cerca un numero limitato di classi per i vari sottogruppi di clienti
Login premium, clubnet, ADSL e PWH per classe a valore
0%
20%
40%
60%
80%
100%
Classe 1 Classe 2 Classe 3 Classe 4 Classe 5 Classe 6 Classe 7Classi a valore
PWHPremiumClubnetADSL
Login per tipo di Abbonamento e classe a valore
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
ADSL Clubnet Premium PWH
Classe 7Classe 6Classe 5Classe 4Classe 3Classe 2Classe 1
Confidential CRM&Profiling54
4.24.2Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica
Il Il churnchurn
Confidential CRM&Profiling55
Customer Base: il churn
Modellare la disattivazione:Modellare la disattivazione:costruire, validare, interpretare un modello che descriva il comportamento degli utenti in termini di disattivazione in relazione ad altre variabili note
Perché?Perché?�Per descrivere il fenomeno�Per prevedere i potenziali futuri disattivi�Per predisporre azioni�Per verificare l’efficacia di operazioni di marketing/Customer Operation
Confidential CRM&Profiling56
Cutomer base: churn
Le fontiLe fonti
Aziendali: (“DWH”, RADIUS, logs, Remedy,…) •Per tutti i clienti•Informazioni su
trafficoservizi opzionalicomportamento del clientereclami-rapporti con customer careazioni di marketing/customer carefatture/ricarichedati demografico/anagrafici
Altre fonti: Ricerche di mercato
•Per un piccolo campione “casuale” di clienti
•Informazioni su
comportamenti
stili di vita
motivi della disattivazione
tempi della scelta
•ottenuti tramite interviste
Confidential CRM&Profiling57
Il churn: obiettivi
■ Determinare un indicatore di propensione alla disattivazione per ogni login
■ Prevedere i potenziali futuri disattivi
■ Capire i motivi fondamentali che portano alla disattivazione e i comportamenti che la precedono
■ Individuare possibili azioni volte alla retention del cliente
■ Verificare l’efficacia di operazioni di Marketing/Customer Operation
Confidential CRM&Profiling58
Il churn: obiettivi
■ Caratteristiche demografiche■ Usage di internet■ Comportamenti di traffico■ Contatti con tin.it■ Informazioni sul billing■ Copertura della rete dei pop
Comportamento Comportamento dei clienti sul dei clienti sul churnchurn
Chi è a Chi è a rischio di rischio di disattivazionedisattivazione??
PerchéPerché sonosono a a rischiorischio didi
disattivazionedisattivazione??
QuandoQuando è è maggiore maggiore il rischio di il rischio di
disattivazionedisattivazione??
■ Promozioni della concorrenza■ Eventi della vita
■ Offerte della concorrenza■ convenienza dei prezzi■ Prezzo dell’Hardware■ Servizio al cliente■ Programmi a premi
Confidential CRM&Profiling59
Il churn: la previsione
Costi nella Costi nella previsione del previsione del churnchurn
Grado di successo Grado di successo dell’azione preventiva dell’azione preventiva del del churnchurn
Alto
Medi
Medio
Alti
Basso
Alti
Intera Customer
base
Clienti ad alta propensione al
churn
Clienti chestanno
disattivando
Clienti già disattivati
N/A
N/A
Stadio più efficiente
Azioni di retention
Confidential CRM&Profiling60
Churn: Data mining FreeFree
■ Identificazione della popolazione
■ Determinazione e reperimento delle variabili
■ Definizione del target
■ Stima del modello
■ Verifica dell’accuratezza
■ Utilizzo del modello
Background■■ Clubnet rappresentaClubnet rappresenta l’ 80%l’ 80% delladella customer basecustomer base
■■ NonNon sisi èè fatto unfatto un pilot/casepilot/case studie su questo tipo di clientistudie su questo tipo di clienti
■■ NonNon esiste un eventoesiste un evento churnchurn osservabileosservabile, ma, ma deducibilededucibile
Passi principali
Confidential CRM&Profiling61
Churn: Data miningPreparazione datiPreparazione dati
SelezionareSelezionare lala popolazionepopolazione
Prima di estrarre i dati da DWH è necessario definire in maniera precisa la popolazione da analizzare.
Ad es. Le login utilizzate per costruire un modello di churn per i clienti pay sono dunque le login che hanno data di attivazione precedente il 1/12/2000 ed aventi data di disattivazione superiore al 31/1/2001 o ancora attive nel mese di Febbraio 2001.
Per ciascuna di queste login sono stati estratti da DWH (input al sistema di data mining) i dati di Luglio 2000, Agosto 2000, Settembre 2000, Ottobre 2000, Novembre 2000.
Confidential CRM&Profiling62
Churn: data miningPreparazione datiPreparazione dati
Esclusione variabili leakerEsclusione variabili leakerAlcune delle variabili presenti nei dati in ingresso sono strettamente correlate con l’oggetto della previsione per diversi motivi.
Le variabili che “trasudano” informazione sulla variabile target (leakers) devono venire identificate ed escluse dall’insieme di dati a disposizione (ad es. data di Disattivazione, status della login, flag varii)
L’oggetto della previsioneL’oggetto della previsioneLa variabile target va definita con precisione in termini di status della login e date degli eventi considerati (disattivazione, attivazione, sospensione…)
Confidential CRM&Profiling63
Churn: data miningPreparazione datiPreparazione dati
PredisposizionePredisposizione data setdata set�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).
�Dal file TOP, selezione di tutte le login disattivate.
�Selezione casuale (senza senza ripetizione) di un insieme di login attive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.
�Divisione dei dataset ottenuto in due parti uguali selezionate casualmente, l’una servirà per stimare il modello e l’altra per selezionare il modello migliore.
Confidential CRM&Profiling64
Data mining: i modelli
Regressione Regressione projection pursuitprojection pursuit//
GAMGAM
MARS/MARS/reti neuralireti neurali Alberi di Alberi di
regressione/regressione/CARTCART
Regressione Regressione lineare/logisticalineare/logistica
Il modello più semplice (lineare) non è sufficiente a descrivere i dati
�bisogna ipotizzare modelli più complessi
�lasciarsi guidare dalle osservazioni per costruire le relazioni tra variabili e disattivazione
Confidential CRM&Profiling65
Basic Concept: Data mining
Insieme di tecniche statisticheper la stima di modelli non-lineari
per grosse quantità di dati, ma caratterizzate da ridotta complessità computazionale.
Tali tecniche vengono utilizzate secondo la guida dell’analista che guida la scelta dei modelli
e delle interpretazioni dei risultatiin modo da evitare di cogliere
relazioni spurie
Confidential CRM&Profiling66
Data mining: modellipolinomipolinomi binbin medie mobilimedie mobili
rette mobilirette mobili loessloess Kernel gaussianoKernel gaussiano
smoothing splinesmoothing spline splinespline di regressionedi regressione splinespline naturalinaturali
SmoothersSmoothers monodimensionalimonodimensionali
�Stimatori nonparametrici basati sulle serie o su regressioni(polinomiali, regressione diFourier, splines di regressione,filtraggio)
�Stimatori nonparametrici kernel (Nadaraya-Watson, medie localmente pesate, regressionelocale, loess)
�Smoothing Splines(penalizzazione)
�Stimatori nonparametrici sui vicini più prossimi - Near neighbor (medie mobili,mediane, stimatori di Tukey)
Confidential CRM&Profiling67
Data mining: la valutazione dei modelli
Il modello viene stimato per poter essere utilizzato per fare previsione:deve essere valido per qualsiasi altra
situazione analoga. (PCR)
Misure di accuratezza��Matrice diMatrice di ““confusioneconfusione””
��LiftLift
Confidential CRM&Profiling68
Omissione: percentuale di login previste ad altorischio sul totale delle login effettivamente disattivate (cioè quanti di quelli effettivamente disattivati erano nella classe più a rischio il mese prima). L’errore di omissione viene indicato anche come “falsi negativi”
Commissione: percentuale delle login disattivate sul totale delle login nella classe più a rischio (cioèquanti di quelli considerati a rischio sono stati effettivamente disattivati il mese successivo).L’errore di commissione è indicato anche con il termine “falsi positivi”.
AccuratezzaAccuratezza
Misure globaliMisure globali:: gli errorigli errori
Data mining: la valutazione dei modelli
Confidential CRM&Profiling69
AccuratezzaAccuratezza
I record (le login) vengono ordinate per propensione al churndecrescente, in modo da avere gli elementi ritenuti più a rischio nella parte alta della lista.Si suddivide l’insieme così ottenuto in quantili e si calcola quanti disattivati reali si trovano nel primo quantile.Il rapporto fra la percentuale di disattivati reali nel primo quantile rispetto alla percentuale di disattivati su tutta la popolazione considerataè detto lift.Il lift misura quindi di quanto nel sottogruppo selezionato si prevede meglio la disattivazione rispetto a quello che si farebbe nella popolazione globale.
Più in generale tale misura è definita per un selezionato sottogruppo di una popolazione più vasta come la proporzione di disattivi nel sottogruppo diviso la proporzione di disattivi in tutta la popolazione.
Misure localiMisure locali:: ilil liftlift
Data mining: la valutazione dei modelli
Confidential CRM&Profiling70
Ad esempio:
Se l’insieme totale di login esaminate sia costituito da 100.000elementi di cui 3.000 disattivi, il tasso di churn per questa popolazione sarà di 3.000/100.000=0,03.
Se ordinando i risultati del sistema di previsione perpropensione al churn decrescente si individuano, fra le prime 1000 login di questa lista, 150 disattivati, il tasso di churn saràdi 150/1000=0.15. Ciò significa che il lift del sistema di previsione utilizzato è pari a 0.15/0.03=5.
AccuratezzaAccuratezzaData mining: la valutazione dei modelli
Confidential CRM&Profiling71
Nelle telecomunicazioni in Italia il tasso di churn in un mese èmolto basso (si aggira attorno all’1%-5%). In questo caso, anche un metodo particolarmente accurato (es. lift=6) ha comunque un numero molto elevato di falsi positivi, cioèun errore di commissione particolarmente elevato (infatti per es. sui 100 clienti più a rischio secondo il sistema previsionaleutilizzato, solo 6 saranno effettivamente disattivati).
AccuratezzaAccuratezza
NotaNota
Data mining: la valutazione dei modelli
Confidential CRM&Profiling72
Il churn: la previsione
data mining data mining puropuro Esempio in tin.it: Primo modello
��Calo del trafficoCalo del trafficonon actionable!non actionable!
data mining data mining guidatoguidato Esempio in tin.it:Secondo modello��caratteristiche di traffico caratteristiche di traffico ((eses. Alto usage . Alto usage nellenelle ore ore didi piccopicco))��Uso dei serviziUso dei servizi��calo nel trafficocalo nel traffico��ReclamiReclami
Soluzione Soluzione aa black boxblack box in in cui il cui il software (IT) software (IT) seleziona seleziona le le variabili variabili e e determina il modello determina il modello in in maniera maniera completamente automaticacompletamente automatica
Soluzione Soluzione inin cui l’analistacui l’analista guidaguidale le analisi nella sceltaanalisi nella scelta, , almenoalmenoparzialeparziale, , delle variabilidelle variabili, , utilizzando utilizzando i i modelli di modelli di data data mining come mining come strumenti di analisistrumenti di analisi
AzioniAzioni didi Marketing Marketing e customer e customer
carecare
Confidential CRM&Profiling73
4.2.bis4.2.bisAlcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica
Il Il churnchurn: 3 esempi concreti e un : 3 esempi concreti e un paio di ideepaio di idee
Confidential CRM&Profiling74
Il churn: free e pay
E’ necessario un diverso approccio tra free e pay perché
■ Per il pay➡ Il cliente CHIEDECHIEDE di essere disattivato via raccomandata o
■ Per il free➡ Il cliente non si disattiva, ma passa tra i non active quando non
naviga per 3 mesi (45 giorni)
I I clienticlienti free free decidonodecidono didi andareandare allaalla concorrenzaconcorrenzasenzasenza disattivaredisattivare
Confidential CRM&Profiling75
Tin.it accesso: pay vs free
Per disattivare il servizio è necessario inviare un email ouna raccomandata
C’è un chiaro evento:tin.it sa quandol’utilizzatore vuole disattivare
Non c’è evidenza di quando il clientedecide di abbandonare tin.it
Il free non viene disattivato. Esce dallaCustomer basedegliactive users dopo3 mesi (45 giorni, 30giorni) consecutivi senza navigazione
Confidential CRM&Profiling76
Churn: data miningModello guidatoModello guidato
Selezione della PopolazioneSelezione della Popolazione�Si analizza la customer base dei clienti freefree al 31 gennaio 2001 che si fosse attivata almeno 6 mesi prima (prima di agosto 2000) confrontando coloro che hanno mostrato il “segnale” per la prima volta nel mese di gennaio 2000 rispetto agli altri. Per queste login si è considerato il traffico fino a novembre 2000.
L’oggetto della previsioneL’oggetto della previsioneLa variabile target viene definita con precisione attraverso un semplice ““segnalesegnale”” che si basa sul pattern di utilizzo del servizio.
Confidential CRM&Profiling77
Churn: Data miningModello guidatoModello guidato
� Identificazione di un segnalesegnale del churn effettivoTaleTale segnale dovrebbe esseresegnale dovrebbe essere
� “intuitivo” e “semplice” da calcolare� “legato” alla decisionedecisione del cliente di andarsene� accurato e autoesplicativo
�� IlIl ““segnalesegnale”” viene individuato sullaviene individuato sulla basebase didi� Traffico di connessione� Traffico email
L’oggetto della previsioneL’oggetto della previsione
Confidential CRM&Profiling78
Churn: data miningModello guidatoModello guidato
PredisposizionePredisposizione data setdata set
�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).
�Dal file TOP, selezione di tutte le login disattivate.
�Selezione casuale (senza ripetizione) di un insieme di loginattive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.
Confidential CRM&Profiling79
Churn: data miningModello guidatoModello guidato
Stima del modelloStima del modello�Si predispone un cammino di stima guidato, per cui le variabili da inserire nel modello e l’ordine di entrata viene definito e deciso a priori sulla base di
�Conoscenza del business�Actionability�Modello di data mining stimato in precedenza�Analisi preliminari e stime univariate
�Si utilizza come regola di split l’indice di Gini�Le variabili risultate non significative all’entrata per qualche ramo vengono eliminate solo nel ramo di riferimento�Per scelta (aumentare l’acrtionability) non si effettua una analisi di pruning per eliminare variabili�Calcolo della stima di una misura di propensione al churn per ciascun nodo nel dataset BOTTOM e determinazione dell’ordine dei nodi rispetto alla propensione alla disattivazione.
Confidential CRM&Profiling80
Churn: data miningModello guidatoModello guidato
PrevisionePrevisione
�Determinazione delle soglie per la scelta delle tre classi di rischio sulla base di numerosità dei nodi nel datasetBOTTOM e del livello di rischio dei nodi.
�Per ciascuna login si determina la foglia nell’albero a cui appartiene e si definisce Propensione al churn per quella login il valore della propensione nella foglia di riferimento.�Classificazione delle login nelle tre classi di rischio
Confidential CRM&Profiling81
Churn: data mining
Ad ogni nodo e foglia dell’albero è associato un diverso indice di propensione al churn (segnale). (I colori delle “foglie” dell’albero indicano classi di rischio: ���� bassa, ���� media, ���� alta)
attivazione prima del xxx"churn"=4.6%
usa servizio B"churn"=2.5%
più di m mail ricevute"churn"=2.6%
meno di m mail ricevute"churn"=6.8%
più di n connessioni/mese"churn"=3.1%
età superiore ai k anni"churn"=14.0%
non persona fisica"churn"=16.0%
femmina"churn"=17.8%
residente nelle regiorni a,b,c,d,e"churn"=19.2%
residente nelle altre regionipercentuale della customer base=1.8%
"churn"=21.1%
maschio"churn"=20.3%
età inferiore ai k anni"churn"=19.6%
meno di n connessioni/mese"churn"=16.1%
non usa servizio B"churn"=7.2%
attivazione dopo il xxx"churn"=6.0%
sottoscrive servizio A"churn"=5.5%
non sottoscrive servizio A"churn"=1.4%
campione CB"churn"=1.8%
Modello guidatoModello guidato
Confidential CRM&Profiling82
Percentile della popolazione 1% 5% 10% 20%
Lift 11.8 10.8 8.9 5.6
Churn: data miningModello guidatoModello guidato
Accuratezza del modelloAccuratezza del modelloOmissione:
Comissione:
SC = NSC = N
SC = YSC = Y 27.94%3.57% 6.83%
29.46% 42.60 %89.60%
( = 100%)
( = 100%)
SC = NSC = NSC = YSC = Y49.33%34.92%5.58%
50.67%65.08%94.42%
( = 100%)
( = 100%)
( = 100%)
AltoAlto RischioRischio Medio RischioMedio Rischio Basso RischioBasso Rischio
AltoAlto RischioRischioMedio RischioMedio RischioBasso RischioBasso Rischio
LiftLift
Confidential CRM&Profiling83
Churn: data miningModello ibridoModello ibrido
Selezione della PopolazioneSelezione della Popolazione�Si analizza la customer base dei clienti paypay al 31 gennaio 2001 che si fosse attivata almeno 6 mesi prima (prima di agosto 2000) confrontando coloro che si sono disattivati nel mese di gennaio 2000 rispetto agli altri. Per queste login si è considerato le informazioni fino a novembre 2000.
L’oggetto della previsioneL’oggetto della previsioneLa variabile target è un indicatore (variabile dummy) dell’evento disattivazione nel mese di febbraio 2001.
Confidential CRM&Profiling84
Churn: data miningModello ibridoModello ibrido
PredisposizionePredisposizione data setdata set�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).
�Dal file TOP, selezione di tutte le login disattivate. Replicazione di tali SIM in 11 file TOP01-TOP11.
�Selezione sistematica (con campionamento sistematico) di 10 insiemi di login attive (quindi mutuamente escusivi) di numerosità circa uguale al numero di attivi nel TOP. Unione di queste login alle disattive già presenti nei file TOP01-TOP11.
�Divisione dei dataset TOP01-TOP11 in due parti uguali selezionate casualmente, l’una servirà per stimare il modello e l’altra per selezionare il modello migliore.
Confidential CRM&Profiling85
Churn: data miningModello ibridoModello ibrido
Stima dei modelliStima dei modelli�Utilizzando i dataset preparati per la stima, si adattano 11 modelli CART, uno per ciascun dataset.�Si utilizza: regola di split: Gini
regola di prune: Costo densità: 0.01
�Calcolo della stima di una misura di predittività (confidence) per ciascun nodo e determinazione dell’ordine dei nodi rispetto alla propensione alla disattivazione (per i nodi che prevedono disattivazione propensione alla disattivazione è la confidence, per i nodi che prevedono login attive propensione alla disattivazione è(1-confidence) ).
�Determinazione, sui dataset preposti, dei migliori sottoalberi per ciascun insieme di dati usato.
�Determinazione delle misure di accuratezza usuali (matrice di confusione e lift) per ogni singolo modello utilizzando il datasetBOTTOM.
Confidential CRM&Profiling86
Churn: data miningModello ibridoModello ibrido
Costruzione del modello ibridoCostruzione del modello ibrido�Stima della Propensione al churn del nuovo modello attraverso una media pesata della Propensione al churn (IPC=Indice di propensione al churn) di ciascun modello. I pesi sono proporzionali al rango (numero d’ordine) del nodo rispetto all’ordine determinato per ogni modello nel punto 5 in base alla Propensione al churn.�Il nuovo IPC è ottenuto dalla formula
dove il max dei ranghi corrisponde al massimo numero di nodi in ciascun albero.
IPCIPC
rank IPCrank IPCrank IPC
rank IPC
ibridoi
i
ii
N
i
ii
N= =
=
∑
∑
max( ( ))( )
max( ( ))( )
1
1
Confidential CRM&Profiling87
Churn: data miningModello ibridoModello ibrido
PrevisionePrevisione�Per determinare la previsione delle login che verranno disattivate si considera la distribuzione della nuova IPCibrido e controllando gli errori che si commettono, si è fissata una soglia. Per IPCibrido
maggiore della soglia le login vengono considerate a rischio di disattivazione.
�Determinazione delle regole. Si utilizza per ciascuna loginl’intersezione delle regole che la coinvolgono. Ogni regola determina un sistema di insiemi in un sistema cartesiano di ordine n. Le intersezione degli 11 sistemi di insiemi determinano la regola del modello ibrido.
�Tale scelta, coerente con il calcolo della propensione al churn del modello ibrido, risulta però di difficile (costosa in termini di tempo) implementazione informatica. In una prima fase si è scelto quindi (facendo un’analisi costi/benefici) di utilizzare le regole del modello che meglio si comporta nel dataset BOTTOM.
Confidential CRM&Profiling88
Per determinare un indicatore di rischio, si predispone la distribuzione dell’IPCibrido nell’insieme BOTTOM.
Distribuzione cumulata dell’ IPCibrido
Per valori superiori a 0.7 dell’IPCibrido la login sarà considerata a rischio.
Churn: data miningModello ibridoModello ibrido
Alcuni risultatiAlcuni risultati
IPCibrido
Confidential CRM&Profiling89
Churn: data miningModello ibrido Modello ibrido
Le variabili che maggiormente influiscono sulla previsione delladisattivazione dei pay sono :
�variabili di traffico �utilizzo di chat�abbonamento scelto�eventuale precedente entrata o l’uscita dal dunning�eventuali informazioni riguardo la richiesta di documentazione per supposte errate fatturazioni�informazioni sulla regione di appartenenza�informazione sulla fatturazione
Alcuni risultatiAlcuni risultati
Confidential CRM&Profiling90
Churn: data miningModello ibridoModello ibrido
Accuratezza del modelloAccuratezza del modelloLe misure di adattabilità globale usualmente usate fanno riferimento alla matrice di confusione. Tale tabella racchiude le informazioni che legano, sull’insieme BOTTOM, la previsione di disattivazione con l’effettiva disattivazione. I risultqati salienti sono
L’accuratezza globale risulta dell’85%. La percentuale di SIM disattive tra quelle previste disattive(errore di commissione) è del 5.7%. Tale percentuale se confrontata con l’analoga proporzione nella customer base (che è di circa 1%) porta a un lift per l’intero gruppo selezionato (circa il 10% della customer base) di quasi 6.La percentuale di disattivi previsti dal modello tra tutti coloro che davvero sono disattivi raggiunge il 45%.
Confidential CRM&Profiling91
Churn: data miningModello ibridoModello ibrido
Accuratezza del modelloAccuratezza del modello: lift: liftPer misurare la capacità predittiva del modello generalmente si ordinano le login a seconda dell’IPCstimato e si calcola il lift per i sottogruppi della popolazione determinati dai quantili della distribuzione risultante.
La funzione che traccia i lift al crescere dei percentilidella distribuzione delle login ordinata per IPC in linea teorica è una funzione non crescente (è una misura su insiemi ordinati in cui l’i-esimo comprende tutti i precedenti).
Confidential CRM&Profiling92
Churn: data miningModello ibridoModello ibrido
Accuratezza del modelloAccuratezza del modello: lift: lift
La stima della funzione dei lift ottenuta utilizzando il dataset BOTTOM per misurare un modello ottenuto su un diverso dataset non è non-crescente. Considerando piccole percentuali della customer base si può verificare la presenza di perturbazioni stocastiche (rumore) che localmente non fanno mantenere l’ordine di pericolosità definito dall’IPC in uso. Èchiaro che tale proprietà viene invece soddisfatta appena le numerositànei sottogruppi divengono sufficienti (i percentili crescono).
Percentile
Lift del percentile
1 9.30 2 10.92 3 9.32 4 8.59 5 8.75 10 3.21 20 2.50 30 2.09 40 1.80 50 1.60 100 1
Confidential CRM&Profiling93
Data mining:teoria
Idea di base: usare stimatori non parametrici unidimensionali come blocchi per la costruzione di una classe ristretta di modelli non parametrici per la regressione multipla
GAMGAM
Generalized Additive ModelsGeneralized Additive Models
( ) εα ++= ∑=
p
jjjf
1XY
Definizione:
�Le fj sono funzioni arbitrarie, una per ogni variabile predittiva
�Gli εi sono variabili aleatorie di errore e vengono assunti indipendenti tra loro, dalle Xj con E(εi)=0 e var(εi)=σ2
� inoltre per l’identificabilità si assume che ( ){ } 0=jjfE X
Confidential CRM&Profiling94
Data mining:teoria
La convergenza non è assicurata in generale, ma per casi particolari.
GAMGAM
StimaStima:: algoritmo di backfittingalgoritmo di backfitting
1. Inizializzazione: α ==∑
11n
yii
n
( ) jff jj ,1,0 ✫== …, p
2. Ciclo: per i=1, 2..., j=1,..., p
f S fji
j ki
k jk
( ) ( )= − −
−
≠∑Y Xα 1
3. Fino a: ciascuna funzione è uguale alla funzione .f ji( ) f j
i( )−1
Confidential CRM&Profiling95
Churn: data miningModelloModello GAMGAM
Selezione della PopolazioneSelezione della PopolazioneSi analizza la customer base dei clienti paypay al 31 ottobre 2000 che si fosse attivata almeno 4 mesi prima (prima di luglio 2000) confrontando coloro che si sono disattivati nel mese di novembre 2000 rispetto agli altri. Per queste login si è considerato il traffico fino a settembre 2000.
L’oggetto della previsioneL’oggetto della previsioneLa variabile target è un indicatore (variabile dummy) dell’evento disattivazione nel mese di novembre 2001.
Confidential CRM&Profiling96
Churn: data miningModelloModello GAMGAM
PredisposizionePredisposizione data setdata set
�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).
�Dal file TOP, selezione di tutte le login disattivate.
�Selezione casuale (senza ripetizione) di un insieme di loginattive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.
Confidential CRM&Profiling97
Churn: data miningModelloModello GAMGAM
Stima del modelloStima del modello�Si stima un modello GAM con i seguenti parametri:
•funzione legame logistica •per le variabili continue, stimatore univariato spline cubiche•selezione dei parametri di “lisciamento” attraverso ispezione grafica/tuning manuale sul file di test•stima con algoritmo di backfitting sul file di test
�Le variabili risultate non significative effettuando test statistici asintotici approssimati sono state escluse
�Calcolo della stima di una misura di propensione al churn per ciascuna login del BOTTOM utilizzando il modello stimato e determinazione di eventuali classi di rischio.
Confidential CRM&Profiling98
Churn: data mining ModelloModello GAMGAM
-2.5
-1.0
0.0
N Y
Prop
ensi
one
alla
dis
attiv
azio
ne Internet Mailbox
-1.5
-0.5
0.5
N Y
Prop
ensi
one
alla
dis
attiv
azio
ne Opzione Segreteria
-1.0
0.0
1.0
1 2 3 4Pr
open
sion
e al
la d
isat
tivaz
ione Zona di Attivazione
Traffico ougoingPr
open
sion
e al
la d
isat
tivaz
ione
0 20000 40000 60000 80000
-1.0
0.0
1.0
Traffico incoming Tariffa 'Picco'
Prop
ensi
one
alla
dis
attiv
azio
ne
0 5000 10000 15000
-1.0
0.0
1.0
Traffico incoming Tariffa 'Ordinaria'
Prop
ensi
one
alla
dis
attiv
azio
ne
0 2000 4000 6000 8000
-1.0
0.0
1.0
Altre Sim Attive
Prop
ensi
one
alla
dis
attiv
azio
ne
0 1 2 3 4
-1.0
0.0
1.0
Data di Attivazione
Prop
ensi
one
alla
dis
attiv
azio
ne
-10
12
3
1995 1996 1997 1997 1998 1998
-0.5
0.0
0.5
1.0
15 - Busin
ess Time
20 - Gold
50 - V
alore
51 - V
alore 50
52 - Valore
25
Prop
ensi
one
alla
dis
attiv
azio
ne
Piano Tariffario-0
.50.
00.
51.
0
Bollettino Pos
tale
Carta di C
redito
Domiciliazio
ne Bancaria
Prop
ensi
one
alla
dis
attiv
azio
ne
Metodo di Pagamento
-20
24
Cellular Promoters
Franchise
e
GDO Dealers
Indipendent D
ealers
Major Acco
unts
OPI Stores
Office Auto
mation
Special C
hannels
Prop
ensi
one
alla
dis
attiv
azio
ne
Canale di Vendita
-0.5
0.5
1.5
N Y
Prop
ensi
one
alla
dis
attiv
azio
ne Programma Affari
Variabile A Variabile B Variabile C
Variabile D Variabile E
SI NO
Variabile I
a b c d e
Variabile F
a b c d e f g h
Variabile Ha b c
Variabile I
Variabile H Variabile M Variabile N
Alcuni risultatiAlcuni risultati
Confidential CRM&Profiling99
� L’analisi ex post è essenziale per identificare quale azione agisce meglio e su quale target
�Costruire un modello (CART) per determinare il segmento più reattivo
�Clienti che hanno già tanti servizi ne accetteranno di nuovi
Customer base: massimizzare la redemptionAzioniAzioni
Confidential CRM&Profiling100
4.24.2Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica
Il Il profiling profiling sui valorisui valori
Confidential CRM&Profiling101
Actual figures: Segmentation
Fonte :
APERTURA
Cultura industriale e post-industriale, aperta al
cambiamento, all’innovazione e alla complessità sociale.
APERTURA
Cultura industriale e post-industriale, aperta al
cambiamento, all’innovazione e alla complessità sociale.
CHIUSURA
Cultura di stampo arcaico e
preindustriale arroccata sui valori
tradizionali e diffidente verso il nuovo.
CHIUSURA
Cultura di stampo arcaico e
preindustriale arroccata sui valori
tradizionali e diffidente verso il nuovo.
PRIVATO
Cultura intessuta di valori materiali ed aspirazioni
individualistiche. Orientamento ai valori
del sé e del privato
PRIVATO
Cultura intessuta di valori materiali ed aspirazioni
individualistiche. Orientamento ai valori
del sé e del privato
SOCIALE
Cultura solidaristicaimpregnata di valori etici e
spirituali. Orientamento alla collettività e al
sociale.
SOCIALE
Cultura solidaristicaimpregnata di valori etici e
spirituali. Orientamento alla collettività e al
sociale.McCANNMcCANN--ERICKSONERICKSON
LA MAPPA SOCIOCULTURALELA MAPPA SOCIOCULTURALE
Confidential CRM&Profiling102
Actual figures: Segmentation
Fonte : McCANNMcCANN--ERICKSONERICKSON
LA MAPPA SOCIOCULTURALELA MAPPA SOCIOCULTURALE
APERTURA
Attenzioneall’aspetto
AnomiaConsumismoEdonismo
Interesseper la moda
Narcisismo
Amore per l’aventura
AntiproibizionismoIndustrialismo
Esoterismo
Welfare
Insicurezza
Cosmopolititsmo Semplificazione della vita
Etnocentrismo
Secolarizzazione
Chiusura mentale
Ostentazione eprestigio
Paura della violenza
Interesse apparenza
Diffidenza per la pubblicità
Centralità della famiglia
Localismo
Bisogno di radicazione
Comunitarismo
Nostalgia natura
Perbenismo
Idealismo
Interesse tecnologia
PolisensualismoAdesione al nuovo
Liberalismo sessuale
Gestione della complessità
Partecipazione
EcologiaVita sociale
Revisione ruoli sessuali
AntiautoritarismoEspressione personalità
Impegno
VolontariatoCreatività personale
Spiritualità
CHIUSURA
PRIVATO
SOCIALE
Ricerca interiore
Confidential CRM&Profiling103
Fonte : GPF&A
INTERESSE• PER LA MODA
• ETNOCENTRISMO
• OSTENTAZIONE
E PRESTIGIO
• INTERESSE APPARENZA
• CHIUSURA
MENTALE
• PAURA DELLAVIOLENZA
• INSICUREZZA
DECALAGE •
• LOCALISMOWELFARE •
• CENTRALITÀ DELLA
FAMIGLIA• PERBENISMO
• NOSTALGIANATURA
DIFFIDENZA PER • LA PUBBLICITÀ
COMUNITARISMO•
• IDEALISMO
• BISOGNO DIRADICAZIONE
• NARCISISMO
• SECOLARIZZAZIONE
• SPIRITUALITÀ
ESOTERISMO •
• POLISENSUALISMO• LIBERALISMO SESSUALE
CONSUMERISMO •ECOLOGIA •VITA SOCIALE •
IMPEGNO •
• VOLONTARIATO
ANOMIA •
COSMOPOLITISMO •
SEMPLIFICAZIONE • DELLA VITA
GESTIONE DELLA •COMPLESSITÀ
• ADESIONEAL NUOVO • INTERESSE
TECNOLOGIA
RICERCA• INTERIORE
REVISIONE •RUOLI SESSUALI
ESPRESSIONE •PERSONALITÀPARTECIPAZIONE •
ANTIAUTORITARISMO•
CREATIVITÀ •PERSONALE
• AMORE PERL’AVVENTURA
ANTIPROIBIZIONISMO •
• CONSUMISMO
INDUSTRIALISMO •
EDONISMO • ATTENZIONE• ALL’ASPETTO
CENTRALITÀ DEL CORPO E
DEL CONSUMO [7.0%]
[12.0%]
CULTURAPICCOLO
BORGHESE[21.7%]
TRADIZIONALISMO [11.6%]
IMPEGNO[10.3%]
RADICI [17.3%]
NUOVA FRONTIERA
[12.0%]
INTERIORITÀ [8.1%]
Actual figures: Segmentation
Confidential CRM&Profiling104
Segmentation: i bisogni
APERTURA CHIUSURA
PRIVATO
SOCIALE
aver successo e diventare qualcuno• divertirsi
•
• fare il proprio dovere
avere molto denaro•
sentirsi al riparo e al sicuro dai pericoli•
fare una vita intensa di
relazioni sociali•
viaggiare•
•sentire la stima/approvazione delle personeche ci circondano
•sentireaffettointorno a sé
•imparare/arricchire le proprie
conoscenze
fare una vita intensa e piena di esperienza
•
Fonte : GPF&A
Confidential CRM&Profiling105
I navigatori: profiling
ObiettiviObiettivi�Capire quanti e quali pattern di utilizzondi internet hanno i navigatori dei siti di tin.it�Scoprire le caratteristiche di particolari gruppi di clienti per personalizzare siti eazioni
StrumentiStrumenti�Analisi esplorativa per ladeterminazione dei gruppi�Posizionamento dei navigatori/clienti sulla mappa dei valori