Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al...

106
Trieste, 28 marzo 2001 Data Mining nel Marketing: l'esperienza in una società di internet CRM & Profiling

Transcript of Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al...

Page 1: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Trieste, 28 marzo 2001

Data Mining nel Marketing: l'esperienza in una società di internet

CRM & Profiling

Page 2: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling2

Agenda

1. Lo scenario di mercatoActual FiguresBasic concepts

2. Tin.it

3. Il Customer Base ManagementCRM Profiling e segmentazioneLa Statistica e il Data-mining per il Marketing sulla Customer

Base

4. Alcuni casi: metodologia e praticaIl valoreIl churnI surfers: profiling

Page 3: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling3

1.1.Lo scenario di mercatoLo scenario di mercato

Page 4: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling4

7 GIORNIN. DI INDIVIDUI N. DI INDIVIDUI

NOVEMBRE 2000

TOTALE UTENTI INTERNETTARGET “ALLARGATO”

(casa, lavoro, scuola, biblioteca, amici, bar)

CASA

LAVORO

SCUOLA

AMICI

BIBLIOTECA

BARTOTALE UTENTI INTERNET

TARGET “PRIMARIO”(casa, lavoro, scuola)

CORSI DI FORMAZIONE

10.400.000

6.200.000

3.100.000

1.400.000

100.000

3.150.000

290.000

430.000

8.800.000

6.600.000

4.600.000

2.100.000

570.000

48.000

770.000

140.000

48.000

6.200.000

3 MESI

16.200.000

9.400.000

POSSIEDONO PC IN CASAPC DI CASA COLLEGATO

AD INTERNET

21,7

13

6,5

3

0,2

6,6

0,6

0,9

18,5

33,9

19,6

13,9

9,6

4,4

1,2

0,1

1,6

0,3

0,1

12,9

Fonte : Eurisko

Actual Figures: collegamento a internet

Page 5: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling5

Actual Figures: l’evoluzione POSSIEDONO PC IN CASA

UTENTI INTERNETCASA (ult. 3 mesi)

PC DI CASACOLL. ADINTERNET

UTENTI DI PC A CASA

Ute

nti (

in m

iglia

ia)

in migliaia di individuiNOVEMBRE

1997GIUGNO

1998NOVEMBRE

1998GIUGNO

1999NOVEMBRE

1999GIUGNO

2000

POSSIEDONO PC IN CASA 10.400 11.300 11.900 12.900 13.050 15.000UTENTI DI PC A CASA 5.600 6.700 6.900 7.500 8.000 9.000PC DI CASA COLLEGATOAD INTERNET 860 1.400 1.900 2.800 4.100 7.100UTENTI INTERNET CASA(ultimi 3 mesi) 520 850 1.200 1.700 2.500 4.600

NOVEMBRE 2000

16.200

10.600

9.400

6.200

Nov.97 Giu.98 Nov.98 Giu.99 Nov.99 Giu.00 Nov.000

2000

4000

6000

8000

10000

12000

14000

16000

Fonte : Eurisko

Page 6: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling6

Actual Figures: target potenziale

TOTALE

20.500

8.800

CASA LAVORO

AMBITI DI COLLEGAMENTO

TARGET POTENZIALE (A)(migliaia di individui)

TARGET ATTUALE (B)(migliaia di individui)

16.900

6.200

6.800

3.100

SCUOLA

4.800

1.400

42.9INDICE DI SATURAZIONE %( A/B ) 36.7 45.6 29.2

Fonte : Eurisko

Page 7: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling7

Actual figures: penetrazione

0

10

20

30

40

50

1998 1999 2000 2001 2002 2003 2004 2005

totale on line

broadband

Penetrazione di internet in Italia(% del totale famiglie)

Fonte: Forrester Research, july 2000

%

Page 8: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling8

Actual figures: i provider

SPONTANEANOTORIETÀ TOTALE CASA

(n=676)SCUOLA(n=177)

LAVORO(n=391)

NOTORIETA’ TOTALE

AMBITI DI COLLEGAMENTO

TIN.IT

KATAWEBYAHOO! ON LINE

ITALIA ON LINE (IOL)

CIAOWEB

INTERFREE

WIND

INFOSTRADATISCALI FREENET

JUMPY

LIBERO

CLUBNET

TELECOM ITALIA NET (NET)INFOSTRADA (NET)

878375

79

5862595246474319939649

888377

79

5563625840454514949543

818370

83

5571684244493621899550DADANET (NET)

8682

748080

6756

6059

5042

4541

1692

9645

6245

393231

28201918

1411108

474

6912

SUPEREVA

INFINITO

71

69

79

64

80

67

Fonte : Eurisko

Page 9: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling9

Actual figures: il contenuto

ConnotazioneConnotazione

AmpiezzaAmpiezza

Siti Aziendali

Siti Monotematici

Portals

Target PortalsV-ortals

Page 10: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling10

Actual Figures: I primi 10 portali

Fonte : AC Nielsen

0 50000 100000 150000 200000

iol.it

virgilio.it

msn.com

supereva.it

yahoo.it

tiscali.it

kataweb.it

msn.it

clarence.com

tin.it

0 50000 100000 150000 200000 250000 300000 350000

iol.it

virgilio.it

kataw eb.it

yahoo.com

supereva.it

msn.it

tiscalinet.it

altavista.com

yahoo.it

tin.it

Fonte : One to One Research

Page 11: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling11

Actual figures: Starting Page

ConnotazioneConnotazioneConnotazioneConnotazione

AmpiezzaAmpiezzaAmpiezzaAmpiezza

Siti Aziendali

Siti Monotematici

Portals

Target PortalsV-ortals

.> 90 %

0 50000 100000 150000 200000

iol.it

virgilio.it

msn.com

supereva.it

yahoo.it

tiscali.it

kataweb.it

msn.it

clarence.com

tin.it

0 50000 100000 150000 200000 250000 300000 350000

iol.it

virgilio.it

kataw eb.it

yahoo.com

supereva.it

msn.it

tiscalinet.it

altavista.com

yahoo.it

tin.it

Page 12: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling12

Actual figures: Service UsageFonte : Ipsos - Explorer Active Adv / Eurisko

40 %

EE--mailmailSurfingSurfingDownloadDownload/FTP/FTP(mp3+SW)(mp3+SW)

Chat Chat / / VideoChatVideoChatNewsgroupNewsgroup/Forum/ForumInvio SMSInvio SMSA/V A/V StreamingStreamingRadio On Line Radio On Line NewslettersNewslettersInstant MessagingInstant MessagingCommunityCommunityVoIPVoIP

26 %

21 %

10 %

29 %

94 % 82 %93 % 92 %

45 % 46 %33 % 40 %32 % 31 %

20 % 19 %13 %10 %

Page 13: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling13

2.2.Tin.Tin.itit

Page 14: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling14

Tin.it: lo scenario di riferimento

Il primo ISP del mercato Internet ItaliaIl primo ISP del mercato Internet Italia

Il titolare della maggioreIl titolare della maggiore CustomerCustomer Base di Base di surferssurfers

Il più capillare gestore italiano di POP fisiciIl più capillare gestore italiano di POP fisici

Page 15: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling15

Tin.it: il modello di business

Presidio capillare del territorioPresidio capillare del territorio

Portafoglio prodotti segmentato Portafoglio prodotti segmentato

Modello evolutivo : ISP Portale OrizzontaleModello evolutivo : ISP Portale Orizzontale

FocalizzazioneFocalizzazione verso C.R.M. verso C.R.M.

Linee di Linee di RevenuesRevenues ::Canone mensile / annualeCanone mensile / annualeTraffico Traffico IncomingIncoming (da T.I.)(da T.I.)ImpressionsImpressionsCommissioni da Commissioni da clicktroughclicktrough & & feefee mensilemensile

Page 16: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling16

Tin.it: Consumer Strategy

Collegare il business al consumer aggregando

– attraverso i diversi media –una massa critica di utenti

La mission è divenire il leader italiano nei servizi interattivi online, integrando accesso,

comunicazione, navigazione, contenuti e commercio per

aiutare gli utilizzatori a realizzare i benefici di un mondo connesso

On line Strategy

Page 17: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling17

Tin.it: la catena del valore - consumer

ContentContentAccessAccessDevicesDevices

Web on TVSet Top Box

AdvertisingAdvertising&&

Commerce Commerce AggregaAggrega--

tiontion

Simpleappliances

Page 18: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling18

Tin.it: offerta consumer

Page 19: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling19

Tin.it: la catena del valore

Portare le piccole/medie imprese e i professionisti online per aumentare sia la

produttività che la competitività e per stimolarli alla interazione online con i

clienti

Page 20: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling20

Tin.it: la catena del valore - business

eBusinesseBusiness & & eCommerce eCommerce

Web Web PublishingPublishing

Web Web HostingHosting

Un’offerta completa per aiutare i clienti a ottenere valore da Internet

VASVASAccessAccessWeb Web ServicesServices

Advanced Messaging

Desktop productivity

solutions

WAP servicesLAN

Page 21: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling21

Tin.it: l’offerta business

E-commerceE-commerce

Integratede-businessIntegratede-business

Accesso

Servizi

Web presenceWeb presence

Sophisticated access

Sophisticated access

Basic accessBasic

access

LAN access LAN access

Di Base IntegrazioneEntry Level

Alta velocità

VirtualCompany

Page 22: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling22

Tin.it: posizionamento

Internet Internet Actor’s MatrixActor’s Matrix

ConnotazioneConnotazioneConnotazioneConnotazione

AmpiezzaAmpiezzaAmpiezzaAmpiezza

Siti Aziendali

Siti Monotematici

Portals

Target PortalsV-ortals

neo users

Page 23: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling23

Tin.it: posizionamento

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

Page 24: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling24

Tin.it: posizionamento

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

Page 25: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling25

Tin.it: posizionamento

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

3 %

26 %

26 %

9 %

12 %

5 %

9 %

9 %

customer customer needsneeds

???

Page 26: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling26

Tin.it: posizionamento

Attivazione Fruizione

Heavy Users

Dummies

e-commerce5 %

ISP / Prodotti26%

help / CCareloyalty26 %

news12 %

advertising12 %

Aree tematiche

9 %

communitymsg chat

9 %

pers- e-mail5 %

Page 27: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling27

Virgilio: posizionamento

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

Page 28: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling28

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

Virgilio: posizionamento

Page 29: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling29

Virgilio: posizionamento

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

1 %

3 %

33 %

44 %

10 %

0 %

1 %

8 %

customer customer needsneeds

???

Page 30: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling30

Virgilio: posizionamento

Attivazione Fruizione

Heavy Users

Dummies

e-commerce0 %

ISP / Prodotti3%

help / CCareloyalty33 %

news10 %

Aree tematiche

44 %

communitymsg chat

1 %

pers. e-mail1 %

advertising8 %

Page 31: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling31

Insieme: tin.it-Virgilio

Area ISP / Prodotti

Help / Ccare / Loyalty

Area Personal Mail

Area Themes

Area News

Area e-commerce

Community / Messaging / Chat

Advertising

1 %

3 %

33 %

44 %

10 %

0 %

1 %

8 %

3 %

26 %

26 %

9 %

12 %

5 %

9 %

9 %

Tin.it - VirgilioTin.Tin.itit -- VirgilioVirgilio

Page 32: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling32

3.3.Il Il customer customer base base

managementmanagement

Page 33: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling33

Tin.it Customer Base di

c-99

feb-

00

apr-0

0

giu-

00

ago-

00

ott-0

0

dic-

00pa

yto

tale

0500

10001500

2000

2500

3000

3500

4000

paytotale

dic-

99

feb-

00

apr-0

0

giu-

00

ago-

00

ott-0

0

dic-

00 pay

tota

le

0

200

400

600

800

1000

1200

paytotale

Nuove AcquisizioniCustomer Base

IL MANAGEMENT DELLA CUSTOMER BASE IL MANAGEMENT DELLA CUSTOMER BASE GUIDA LA NOSTRA STRATEGIA DI MARKETINGGUIDA LA NOSTRA STRATEGIA DI MARKETING

Page 34: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling34

Customer base: Approccio strategico

Un unico obiettivo:Un unico obiettivo:

Aumentare ilAumentare il Customer Lifetime ValueCustomer Lifetime Valueattraversoattraverso lala riduzione delriduzione del churn churn ee l’aumento dell’ARPUl’aumento dell’ARPU

PROFILING & SEGMENTATIONPROFILING & SEGMENTATION

��Identificare i potenziali “Identificare i potenziali “churnerschurners””

��Massimizzare la soddisfazione dei clientiMassimizzare la soddisfazione dei clienti

��Focalizzarsi su target per cross e up sellFocalizzarsi su target per cross e up sell

Ridurre il Ridurre il churnchurn

Massimizzare ilMassimizzare ilvalore del clientevalore del cliente

… attraverso… attraverso

Page 35: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling35

Basic concept: Customer Relationship Management

IdentificareRealizzarePraticare

tutte le attività necessarie a garantire il processo di attenzione e

fidelizzazione dell’individuo verso l’azienda e la sua offerta di prodotti e

servizi

e, conseguentemente

la massimizzazione delle opportunità di business attraverso la

soddisfazione costante dei bisogni

Page 36: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling36

Segmentazione per azioni di “massa”?

2. 2. AZIONI DI “MASS”AZIONI DI “MASS”�� Impatto sui Prodotti & ServiziImpatto sui Prodotti & Servizi�� Alto VolumeAlto Volume�� Economie di ScalaEconomie di Scala

�� Sviluppo dei prodotti principaliSviluppo dei prodotti principali�� Crescita dei VAS / Offerte opzionaliCrescita dei VAS / Offerte opzionali�� Aumento del valore dellaAumento del valore della CustomerCustomer BaseBase�� Diminuzione del Diminuzione del ChurnChurn

1. 1. POCHE VARIABILIPOCHE VARIABILI�� approccio Si/Noapproccio Si/No�� approccio “approccio “BehaviouralBehavioural””

3. 3. UN OBIETTIVO ALLA VOLTAUN OBIETTIVO ALLA VOLTA

Page 37: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling37

Profiling per servizi “customized”

2. 2. AZIONI INDIRIZZATE AL CLIENTEAZIONI INDIRIZZATE AL CLIENTE�� Impatto su ogni singolo cliente/NavigatoreImpatto su ogni singolo cliente/Navigatore�� Alti costiAlti costi�� Alta “Alta “redemptionredemption” / Valore” / Valore

3. 3. MOLTI OBIETTIVI CONTEMPORANEAMENTE!MOLTI OBIETTIVI CONTEMPORANEAMENTE!�� Aumento della fedeltà (Aumento della fedeltà (LoyaltyLoyalty))�� Azioni di push: Up Sell / Cross SellAzioni di push: Up Sell / Cross Sell�� Azioni di push: passaparolaAzioni di push: passaparola�� Raccolta di informazioniRaccolta di informazioni

1. 1. MOLTE VARIABILI: MOLTE VARIABILI: PrevisivoPrevisivo & “& “BehaviouralBehavioural””�� Utilizzo dei VASUtilizzo dei VAS�� Pattern d’usoPattern d’uso�� Chiamate al CCChiamate al CC

�� Valore e Valore e RevenueRevenue atteseattese�� Rischio di Rischio di churnchurn�� Scelta dell’abbonamento giustoScelta dell’abbonamento giusto

�� Dropped callsDropped calls�� InsolvenzeInsolvenze�� Reazione a campagne di Reazione a campagne di mktgmktg

Page 38: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling38

Customer base: Segmentazione di base0%

VA

LOR

E D

EL C

LIEN

TE

100%

0%

V

ALO

RE

DEL

CLI

ENTE

10

0%

0% FEDELTA’ DEL CLIENTE 0% FEDELTA’ DEL CLIENTE 100%100%

MASSIMIZZARE MASSIMIZZARE IL VALOREIL VALORE

�� OPERATORE CC PERSONALEOPERATORE CC PERSONALE�� NUOVI VASNUOVI VAS�� MEMBER GETS MEMBERMEMBER GETS MEMBER�� CURA & ATTENZIONECURA & ATTENZIONE

AZIONI A BASSO AZIONI A BASSO COSTO/ NO COSTO/ NO

PROMOZIONIPROMOZIONI

�� NON COSTI AGGIUNTIVI PER LANON COSTI AGGIUNTIVI PER LAGESTIONE DEL CLIENTEGESTIONE DEL CLIENTE

�� AZIONI DI “MASSA”AZIONI DI “MASSA”

AUMETARE IL AUMETARE IL VALOREVALORE

�� AZIONI DI UP / CROSS SELLAZIONI DI UP / CROSS SELL�� INCENTIVARE L’USOINCENTIVARE L’USO�� INCENTIVARE ATTIVAZIONE DI VASINCENTIVARE ATTIVAZIONE DI VAS

COSTRUIRE COSTRUIRE FELDELTA’FELDELTA’

�� DIFFERENZIAZIONE DEI SERVIZIDIFFERENZIAZIONE DEI SERVIZIINBOUND & OUTBOUNDINBOUND & OUTBOUND

�� SCHEMA DI LOYALTY (Incentivi)SCHEMA DI LOYALTY (Incentivi)�� BLOCCHI (Disincentivi alla fuga)BLOCCHI (Disincentivi alla fuga)

…ALLA CONCORRENZA!…ALLA CONCORRENZA!

Page 39: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling39

Basic Concept: Dimesione per fase

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Fonte :

35 %26 %39 %

Corrispondenza dati Datamedia – 09/2000

!!! Piu’ del 60% della popolazione non e’ ancora in fasi di fruizione evoluta dei servizi di rete !!!

0 – 12 mesi 12 – 24 mesi > 24 mesiTEMPO

Frequenza di utilizzoFrequenza di utilizzoFrequenza di utilizzo

Page 40: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling40

Actual figures: Needs x segment

Needs

Premium AccessPremium AccessFreeFree AccessAccessDirectory Directory servicesservicesSearch Search EngineEngineEE--mailmailChatChatVideo Video ChatChatNewsGroupNewsGroupEE--mail / SMS pushmail / SMS pushAudio / Video Audio / Video StreamingStreamingVoIPVoIPFTPFTP

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

Segment

Page 41: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling41

Market trends: Customer interest/needs

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

☺☺☺☺ ☺☺☺☺ ���� ���� ����

���� ☺☺☺☺ ☺☺☺☺ ���� ����

AdvertisingHelp / Ccare / LoyaltyDirectoriesInvio SMSAree TematicheChat / Video ChatPersonal MailISP ProdottiArea General News

ServicesServices

���� ☺☺☺☺ ☺☺☺☺ ���� ����

��������������������

☺☺☺☺ ☺☺☺☺ ���� ���� ����

���� ☺☺☺☺ ���� ���� ����

���� ☺☺☺☺ ☺☺☺☺ ���� ����

���� ���� ☺☺☺☺ ☺☺☺☺ ����

☺☺☺☺���� �������� ����

Page 42: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling42

Market trends: customer interest/needs

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Audio Video StreamingRadio On LineDownload (mp3+SW)

CommunityInstant MessagingNewslettersArea e-commerceMobile ChannelsMobile Commerce

ServicesServices

����

����

����

����

���� ����

����

☺☺☺☺

☺☺☺☺ ☺☺☺☺

���� ���� ���� ☺☺☺☺ ☺☺☺☺

���� ���� ☺☺☺☺ ☺☺☺☺ ����

���� ���� ☺☺☺☺���� ☺☺☺☺

���� ���� ���� ����☺☺☺☺

���� ���� ���� ☺☺☺☺ ☺☺☺☺

���� ���� ���� ☺☺☺☺����

���� ���� ���� ☺☺☺☺����

Page 43: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling43

Market trends: l’evoluzione

Dimensione Dimensione per per FaseFase

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Specializzazione e Propensione all’acquisto on linee propensione all’uso di servizi evoluti

Specializzazione eSpecializzazione e Propensione all’acquisto on linePropensione all’acquisto on linee e propensione all’uso di servizi evolutipropensione all’uso di servizi evoluti

Barriera Tecnologica Curiosita’ Fruizione 1 Fruizione 2 Fruizione 3

FASE

Fonte :

35 %35%30 %1o S 2001

2o S 2001 50 %30%20 %

35 %26 %39 %2o S 2000

Page 44: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling44

Basic concept: Profiling

IdentificareClassificareAcquisireGestire

tutte le informazioni che consentono la conoscenza e l’analisi

del proprio target di riferimento

e, conseguentemente

la realizzazione di prodotti e servizi ad elevata probabilità di

soddisfazione dei suoi bisogni

sources analysis mgmnt

Page 45: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling45

3.bis3.bisIl Il customer customer base managementbase management

Il data Il data mining mining come strumentocome strumento

Page 46: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling46

Customer base: il DWH

InformaziniInformazinisocio demografichesocio demografiche

DATAWAREHOUSEDATAWAREHOUSE

InformazioniInformazionisulla attivazionesulla attivazione

Dati sull’uso & Dati sull’uso & sulla retesulla rete

Informazioni da Informazioni da ricerche di mercatoricerche di mercato((customer satisfactioncustomer satisfaction, U & A, …), U & A, …)

dati dal dati dal callcall centercenter((callscalls, , complainscomplains, , billing problemsbilling problems))

Pattern di utilizzoPattern di utilizzo(log (log filesfiles, , cookiescookies…)…)

Page 47: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling47

Customer base: data mining

analisianalisi

statisticastatistica e e

data miningdata mining Reti neuraliReti neuralialberialberi CARTCART

queries queries su liste di clientisu liste di clientiRegressioni di Regressioni di base e base e modernemoderneK K -- nearest neighborsnearest neighbors

GAM, MARSGAM, MARS

Page 48: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling48

Profiling: i problemi

Numero uno:Numero uno:costruire un DWH costruire un DWH

è enorme!è enorme!

Campioni di clienti possono essere molto utiliCampioni di clienti possono essere molto utili

Per esempioPer esempio

•• tieni conto degli obiettivi dell’analisitieni conto degli obiettivi dell’analisi

•• non concentrarti solo su da dove e come non concentrarti solo su da dove e come raccogliere le informazioniraccogliere le informazioni

•• utilizza estrazioni di parti del DWH (utilizza estrazioni di parti del DWH (datamartdatamart) ) diverse a seconda degli obiettividiverse a seconda degli obiettivi

Nel Nel datamart datamart per la previsione del per la previsione del churnchurn, è più utile tenere , è più utile tenere l’informazione sugli errori di fatturazione rispetto ai dettaglil’informazione sugli errori di fatturazione rispetto ai dettaglisociodemograficisociodemografici

DWHDWH

Page 49: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling49

Profiling: i problemi

Numero due:Numero due:analisi e data analisi e data miningmining

Mantienilo semplice!Mantienilo semplice!

Non fidarti sulle soluzioni automatiche (black box) come: Non fidarti sulle soluzioni automatiche (black box) come: ”schiaccia il bottone e la rete farà tutto per te!””schiaccia il bottone e la rete farà tutto per te!”

Parti da un approccio di base e gradualmente spostati su Parti da un approccio di base e gradualmente spostati su soluzioni più sofisticatesoluzioni più sofisticate

Page 50: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling50

4.4.Alcuni casi: Alcuni casi:

metodologia e praticametodologia e pratica

Page 51: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling51

4.14.1Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica

Il valoreIl valore

Page 52: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling52

Il valore del cliente

ObiettiviObiettivi�Individuazione dei clienti da trattarecon maggior cura�Individuazione di clienti su cui agireper aumentare la redditività

StrumentiStrumenti�Determinazione di un indicatore del valore per tin.it di cascun cliente�Definizione di poche classi di valore

Page 53: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling53

Il valore: le classi

25.1%

30.8%

15.7%

quota clienti quota valore totale

4

5.7%

5.47%

14.0%

48.4%

14.5%

18.5%

13.1%

3.8%

81.4%

5

3

12

6.9%

20.7%

67

1.0%

0.7%

•Si determina per ogni cliente un indicatore di “valore” (ARPU) con caratteristiche di semplicità, intuitività e stabilità nel tempo

•Si determina la classifica dei clienti ordinata secondo il “valore” che essi portano a tin.it e si cerca un numero limitato di classi per i vari sottogruppi di clienti

Login premium, clubnet, ADSL e PWH per classe a valore

0%

20%

40%

60%

80%

100%

Classe 1 Classe 2 Classe 3 Classe 4 Classe 5 Classe 6 Classe 7Classi a valore

PWHPremiumClubnetADSL

Login per tipo di Abbonamento e classe a valore

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

ADSL Clubnet Premium PWH

Classe 7Classe 6Classe 5Classe 4Classe 3Classe 2Classe 1

Page 54: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling54

4.24.2Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica

Il Il churnchurn

Page 55: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling55

Customer Base: il churn

Modellare la disattivazione:Modellare la disattivazione:costruire, validare, interpretare un modello che descriva il comportamento degli utenti in termini di disattivazione in relazione ad altre variabili note

Perché?Perché?�Per descrivere il fenomeno�Per prevedere i potenziali futuri disattivi�Per predisporre azioni�Per verificare l’efficacia di operazioni di marketing/Customer Operation

Page 56: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling56

Cutomer base: churn

Le fontiLe fonti

Aziendali: (“DWH”, RADIUS, logs, Remedy,…) •Per tutti i clienti•Informazioni su

trafficoservizi opzionalicomportamento del clientereclami-rapporti con customer careazioni di marketing/customer carefatture/ricarichedati demografico/anagrafici

Altre fonti: Ricerche di mercato

•Per un piccolo campione “casuale” di clienti

•Informazioni su

comportamenti

stili di vita

motivi della disattivazione

tempi della scelta

•ottenuti tramite interviste

Page 57: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling57

Il churn: obiettivi

■ Determinare un indicatore di propensione alla disattivazione per ogni login

■ Prevedere i potenziali futuri disattivi

■ Capire i motivi fondamentali che portano alla disattivazione e i comportamenti che la precedono

■ Individuare possibili azioni volte alla retention del cliente

■ Verificare l’efficacia di operazioni di Marketing/Customer Operation

Page 58: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling58

Il churn: obiettivi

■ Caratteristiche demografiche■ Usage di internet■ Comportamenti di traffico■ Contatti con tin.it■ Informazioni sul billing■ Copertura della rete dei pop

Comportamento Comportamento dei clienti sul dei clienti sul churnchurn

Chi è a Chi è a rischio di rischio di disattivazionedisattivazione??

PerchéPerché sonosono a a rischiorischio didi

disattivazionedisattivazione??

QuandoQuando è è maggiore maggiore il rischio di il rischio di

disattivazionedisattivazione??

■ Promozioni della concorrenza■ Eventi della vita

■ Offerte della concorrenza■ convenienza dei prezzi■ Prezzo dell’Hardware■ Servizio al cliente■ Programmi a premi

Page 59: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling59

Il churn: la previsione

Costi nella Costi nella previsione del previsione del churnchurn

Grado di successo Grado di successo dell’azione preventiva dell’azione preventiva del del churnchurn

Alto

Medi

Medio

Alti

Basso

Alti

Intera Customer

base

Clienti ad alta propensione al

churn

Clienti chestanno

disattivando

Clienti già disattivati

N/A

N/A

Stadio più efficiente

Azioni di retention

Page 60: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling60

Churn: Data mining FreeFree

■ Identificazione della popolazione

■ Determinazione e reperimento delle variabili

■ Definizione del target

■ Stima del modello

■ Verifica dell’accuratezza

■ Utilizzo del modello

Background■■ Clubnet rappresentaClubnet rappresenta l’ 80%l’ 80% delladella customer basecustomer base

■■ NonNon sisi èè fatto unfatto un pilot/casepilot/case studie su questo tipo di clientistudie su questo tipo di clienti

■■ NonNon esiste un eventoesiste un evento churnchurn osservabileosservabile, ma, ma deducibilededucibile

Passi principali

Page 61: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling61

Churn: Data miningPreparazione datiPreparazione dati

SelezionareSelezionare lala popolazionepopolazione

Prima di estrarre i dati da DWH è necessario definire in maniera precisa la popolazione da analizzare.

Ad es. Le login utilizzate per costruire un modello di churn per i clienti pay sono dunque le login che hanno data di attivazione precedente il 1/12/2000 ed aventi data di disattivazione superiore al 31/1/2001 o ancora attive nel mese di Febbraio 2001.

Per ciascuna di queste login sono stati estratti da DWH (input al sistema di data mining) i dati di Luglio 2000, Agosto 2000, Settembre 2000, Ottobre 2000, Novembre 2000.

Page 62: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling62

Churn: data miningPreparazione datiPreparazione dati

Esclusione variabili leakerEsclusione variabili leakerAlcune delle variabili presenti nei dati in ingresso sono strettamente correlate con l’oggetto della previsione per diversi motivi.

Le variabili che “trasudano” informazione sulla variabile target (leakers) devono venire identificate ed escluse dall’insieme di dati a disposizione (ad es. data di Disattivazione, status della login, flag varii)

L’oggetto della previsioneL’oggetto della previsioneLa variabile target va definita con precisione in termini di status della login e date degli eventi considerati (disattivazione, attivazione, sospensione…)

Page 63: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling63

Churn: data miningPreparazione datiPreparazione dati

PredisposizionePredisposizione data setdata set�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).

�Dal file TOP, selezione di tutte le login disattivate.

�Selezione casuale (senza senza ripetizione) di un insieme di login attive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.

�Divisione dei dataset ottenuto in due parti uguali selezionate casualmente, l’una servirà per stimare il modello e l’altra per selezionare il modello migliore.

Page 64: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling64

Data mining: i modelli

Regressione Regressione projection pursuitprojection pursuit//

GAMGAM

MARS/MARS/reti neuralireti neurali Alberi di Alberi di

regressione/regressione/CARTCART

Regressione Regressione lineare/logisticalineare/logistica

Il modello più semplice (lineare) non è sufficiente a descrivere i dati

�bisogna ipotizzare modelli più complessi

�lasciarsi guidare dalle osservazioni per costruire le relazioni tra variabili e disattivazione

Page 65: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling65

Basic Concept: Data mining

Insieme di tecniche statisticheper la stima di modelli non-lineari

per grosse quantità di dati, ma caratterizzate da ridotta complessità computazionale.

Tali tecniche vengono utilizzate secondo la guida dell’analista che guida la scelta dei modelli

e delle interpretazioni dei risultatiin modo da evitare di cogliere

relazioni spurie

Page 66: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling66

Data mining: modellipolinomipolinomi binbin medie mobilimedie mobili

rette mobilirette mobili loessloess Kernel gaussianoKernel gaussiano

smoothing splinesmoothing spline splinespline di regressionedi regressione splinespline naturalinaturali

SmoothersSmoothers monodimensionalimonodimensionali

�Stimatori nonparametrici basati sulle serie o su regressioni(polinomiali, regressione diFourier, splines di regressione,filtraggio)

�Stimatori nonparametrici kernel (Nadaraya-Watson, medie localmente pesate, regressionelocale, loess)

�Smoothing Splines(penalizzazione)

�Stimatori nonparametrici sui vicini più prossimi - Near neighbor (medie mobili,mediane, stimatori di Tukey)

Page 67: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling67

Data mining: la valutazione dei modelli

Il modello viene stimato per poter essere utilizzato per fare previsione:deve essere valido per qualsiasi altra

situazione analoga. (PCR)

Misure di accuratezza��Matrice diMatrice di ““confusioneconfusione””

��LiftLift

Page 68: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling68

Omissione: percentuale di login previste ad altorischio sul totale delle login effettivamente disattivate (cioè quanti di quelli effettivamente disattivati erano nella classe più a rischio il mese prima). L’errore di omissione viene indicato anche come “falsi negativi”

Commissione: percentuale delle login disattivate sul totale delle login nella classe più a rischio (cioèquanti di quelli considerati a rischio sono stati effettivamente disattivati il mese successivo).L’errore di commissione è indicato anche con il termine “falsi positivi”.

AccuratezzaAccuratezza

Misure globaliMisure globali:: gli errorigli errori

Data mining: la valutazione dei modelli

Page 69: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling69

AccuratezzaAccuratezza

I record (le login) vengono ordinate per propensione al churndecrescente, in modo da avere gli elementi ritenuti più a rischio nella parte alta della lista.Si suddivide l’insieme così ottenuto in quantili e si calcola quanti disattivati reali si trovano nel primo quantile.Il rapporto fra la percentuale di disattivati reali nel primo quantile rispetto alla percentuale di disattivati su tutta la popolazione considerataè detto lift.Il lift misura quindi di quanto nel sottogruppo selezionato si prevede meglio la disattivazione rispetto a quello che si farebbe nella popolazione globale.

Più in generale tale misura è definita per un selezionato sottogruppo di una popolazione più vasta come la proporzione di disattivi nel sottogruppo diviso la proporzione di disattivi in tutta la popolazione.

Misure localiMisure locali:: ilil liftlift

Data mining: la valutazione dei modelli

Page 70: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling70

Ad esempio:

Se l’insieme totale di login esaminate sia costituito da 100.000elementi di cui 3.000 disattivi, il tasso di churn per questa popolazione sarà di 3.000/100.000=0,03.

Se ordinando i risultati del sistema di previsione perpropensione al churn decrescente si individuano, fra le prime 1000 login di questa lista, 150 disattivati, il tasso di churn saràdi 150/1000=0.15. Ciò significa che il lift del sistema di previsione utilizzato è pari a 0.15/0.03=5.

AccuratezzaAccuratezzaData mining: la valutazione dei modelli

Page 71: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling71

Nelle telecomunicazioni in Italia il tasso di churn in un mese èmolto basso (si aggira attorno all’1%-5%). In questo caso, anche un metodo particolarmente accurato (es. lift=6) ha comunque un numero molto elevato di falsi positivi, cioèun errore di commissione particolarmente elevato (infatti per es. sui 100 clienti più a rischio secondo il sistema previsionaleutilizzato, solo 6 saranno effettivamente disattivati).

AccuratezzaAccuratezza

NotaNota

Data mining: la valutazione dei modelli

Page 72: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling72

Il churn: la previsione

data mining data mining puropuro Esempio in tin.it: Primo modello

��Calo del trafficoCalo del trafficonon actionable!non actionable!

data mining data mining guidatoguidato Esempio in tin.it:Secondo modello��caratteristiche di traffico caratteristiche di traffico ((eses. Alto usage . Alto usage nellenelle ore ore didi piccopicco))��Uso dei serviziUso dei servizi��calo nel trafficocalo nel traffico��ReclamiReclami

Soluzione Soluzione aa black boxblack box in in cui il cui il software (IT) software (IT) seleziona seleziona le le variabili variabili e e determina il modello determina il modello in in maniera maniera completamente automaticacompletamente automatica

Soluzione Soluzione inin cui l’analistacui l’analista guidaguidale le analisi nella sceltaanalisi nella scelta, , almenoalmenoparzialeparziale, , delle variabilidelle variabili, , utilizzando utilizzando i i modelli di modelli di data data mining come mining come strumenti di analisistrumenti di analisi

AzioniAzioni didi Marketing Marketing e customer e customer

carecare

Page 73: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling73

4.2.bis4.2.bisAlcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica

Il Il churnchurn: 3 esempi concreti e un : 3 esempi concreti e un paio di ideepaio di idee

Page 74: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling74

Il churn: free e pay

E’ necessario un diverso approccio tra free e pay perché

■ Per il pay➡ Il cliente CHIEDECHIEDE di essere disattivato via raccomandata o

email

■ Per il free➡ Il cliente non si disattiva, ma passa tra i non active quando non

naviga per 3 mesi (45 giorni)

I I clienticlienti free free decidonodecidono didi andareandare allaalla concorrenzaconcorrenzasenzasenza disattivaredisattivare

Page 75: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling75

Tin.it accesso: pay vs free

Per disattivare il servizio è necessario inviare un email ouna raccomandata

C’è un chiaro evento:tin.it sa quandol’utilizzatore vuole disattivare

Non c’è evidenza di quando il clientedecide di abbandonare tin.it

Il free non viene disattivato. Esce dallaCustomer basedegliactive users dopo3 mesi (45 giorni, 30giorni) consecutivi senza navigazione

Page 76: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling76

Churn: data miningModello guidatoModello guidato

Selezione della PopolazioneSelezione della Popolazione�Si analizza la customer base dei clienti freefree al 31 gennaio 2001 che si fosse attivata almeno 6 mesi prima (prima di agosto 2000) confrontando coloro che hanno mostrato il “segnale” per la prima volta nel mese di gennaio 2000 rispetto agli altri. Per queste login si è considerato il traffico fino a novembre 2000.

L’oggetto della previsioneL’oggetto della previsioneLa variabile target viene definita con precisione attraverso un semplice ““segnalesegnale”” che si basa sul pattern di utilizzo del servizio.

Page 77: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling77

Churn: Data miningModello guidatoModello guidato

� Identificazione di un segnalesegnale del churn effettivoTaleTale segnale dovrebbe esseresegnale dovrebbe essere

� “intuitivo” e “semplice” da calcolare� “legato” alla decisionedecisione del cliente di andarsene� accurato e autoesplicativo

�� IlIl ““segnalesegnale”” viene individuato sullaviene individuato sulla basebase didi� Traffico di connessione� Traffico email

L’oggetto della previsioneL’oggetto della previsione

Page 78: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling78

Churn: data miningModello guidatoModello guidato

PredisposizionePredisposizione data setdata set

�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).

�Dal file TOP, selezione di tutte le login disattivate.

�Selezione casuale (senza ripetizione) di un insieme di loginattive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.

Page 79: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling79

Churn: data miningModello guidatoModello guidato

Stima del modelloStima del modello�Si predispone un cammino di stima guidato, per cui le variabili da inserire nel modello e l’ordine di entrata viene definito e deciso a priori sulla base di

�Conoscenza del business�Actionability�Modello di data mining stimato in precedenza�Analisi preliminari e stime univariate

�Si utilizza come regola di split l’indice di Gini�Le variabili risultate non significative all’entrata per qualche ramo vengono eliminate solo nel ramo di riferimento�Per scelta (aumentare l’acrtionability) non si effettua una analisi di pruning per eliminare variabili�Calcolo della stima di una misura di propensione al churn per ciascun nodo nel dataset BOTTOM e determinazione dell’ordine dei nodi rispetto alla propensione alla disattivazione.

Page 80: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling80

Churn: data miningModello guidatoModello guidato

PrevisionePrevisione

�Determinazione delle soglie per la scelta delle tre classi di rischio sulla base di numerosità dei nodi nel datasetBOTTOM e del livello di rischio dei nodi.

�Per ciascuna login si determina la foglia nell’albero a cui appartiene e si definisce Propensione al churn per quella login il valore della propensione nella foglia di riferimento.�Classificazione delle login nelle tre classi di rischio

Page 81: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling81

Churn: data mining

Ad ogni nodo e foglia dell’albero è associato un diverso indice di propensione al churn (segnale). (I colori delle “foglie” dell’albero indicano classi di rischio: ���� bassa, ���� media, ���� alta)

attivazione prima del xxx"churn"=4.6%

usa servizio B"churn"=2.5%

più di m mail ricevute"churn"=2.6%

meno di m mail ricevute"churn"=6.8%

più di n connessioni/mese"churn"=3.1%

età superiore ai k anni"churn"=14.0%

non persona fisica"churn"=16.0%

femmina"churn"=17.8%

residente nelle regiorni a,b,c,d,e"churn"=19.2%

residente nelle altre regionipercentuale della customer base=1.8%

"churn"=21.1%

maschio"churn"=20.3%

età inferiore ai k anni"churn"=19.6%

meno di n connessioni/mese"churn"=16.1%

non usa servizio B"churn"=7.2%

attivazione dopo il xxx"churn"=6.0%

sottoscrive servizio A"churn"=5.5%

non sottoscrive servizio A"churn"=1.4%

campione CB"churn"=1.8%

Modello guidatoModello guidato

Page 82: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling82

Percentile della popolazione 1% 5% 10% 20%

Lift 11.8 10.8 8.9 5.6

Churn: data miningModello guidatoModello guidato

Accuratezza del modelloAccuratezza del modelloOmissione:

Comissione:

SC = NSC = N

SC = YSC = Y 27.94%3.57% 6.83%

29.46% 42.60 %89.60%

( = 100%)

( = 100%)

SC = NSC = NSC = YSC = Y49.33%34.92%5.58%

50.67%65.08%94.42%

( = 100%)

( = 100%)

( = 100%)

AltoAlto RischioRischio Medio RischioMedio Rischio Basso RischioBasso Rischio

AltoAlto RischioRischioMedio RischioMedio RischioBasso RischioBasso Rischio

LiftLift

Page 83: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling83

Churn: data miningModello ibridoModello ibrido

Selezione della PopolazioneSelezione della Popolazione�Si analizza la customer base dei clienti paypay al 31 gennaio 2001 che si fosse attivata almeno 6 mesi prima (prima di agosto 2000) confrontando coloro che si sono disattivati nel mese di gennaio 2000 rispetto agli altri. Per queste login si è considerato le informazioni fino a novembre 2000.

L’oggetto della previsioneL’oggetto della previsioneLa variabile target è un indicatore (variabile dummy) dell’evento disattivazione nel mese di febbraio 2001.

Page 84: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling84

Churn: data miningModello ibridoModello ibrido

PredisposizionePredisposizione data setdata set�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).

�Dal file TOP, selezione di tutte le login disattivate. Replicazione di tali SIM in 11 file TOP01-TOP11.

�Selezione sistematica (con campionamento sistematico) di 10 insiemi di login attive (quindi mutuamente escusivi) di numerosità circa uguale al numero di attivi nel TOP. Unione di queste login alle disattive già presenti nei file TOP01-TOP11.

�Divisione dei dataset TOP01-TOP11 in due parti uguali selezionate casualmente, l’una servirà per stimare il modello e l’altra per selezionare il modello migliore.

Page 85: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling85

Churn: data miningModello ibridoModello ibrido

Stima dei modelliStima dei modelli�Utilizzando i dataset preparati per la stima, si adattano 11 modelli CART, uno per ciascun dataset.�Si utilizza: regola di split: Gini

regola di prune: Costo densità: 0.01

�Calcolo della stima di una misura di predittività (confidence) per ciascun nodo e determinazione dell’ordine dei nodi rispetto alla propensione alla disattivazione (per i nodi che prevedono disattivazione propensione alla disattivazione è la confidence, per i nodi che prevedono login attive propensione alla disattivazione è(1-confidence) ).

�Determinazione, sui dataset preposti, dei migliori sottoalberi per ciascun insieme di dati usato.

�Determinazione delle misure di accuratezza usuali (matrice di confusione e lift) per ogni singolo modello utilizzando il datasetBOTTOM.

Page 86: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling86

Churn: data miningModello ibridoModello ibrido

Costruzione del modello ibridoCostruzione del modello ibrido�Stima della Propensione al churn del nuovo modello attraverso una media pesata della Propensione al churn (IPC=Indice di propensione al churn) di ciascun modello. I pesi sono proporzionali al rango (numero d’ordine) del nodo rispetto all’ordine determinato per ogni modello nel punto 5 in base alla Propensione al churn.�Il nuovo IPC è ottenuto dalla formula

dove il max dei ranghi corrisponde al massimo numero di nodi in ciascun albero.

IPCIPC

rank IPCrank IPCrank IPC

rank IPC

ibridoi

i

ii

N

i

ii

N= =

=

max( ( ))( )

max( ( ))( )

1

1

Page 87: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling87

Churn: data miningModello ibridoModello ibrido

PrevisionePrevisione�Per determinare la previsione delle login che verranno disattivate si considera la distribuzione della nuova IPCibrido e controllando gli errori che si commettono, si è fissata una soglia. Per IPCibrido

maggiore della soglia le login vengono considerate a rischio di disattivazione.

�Determinazione delle regole. Si utilizza per ciascuna loginl’intersezione delle regole che la coinvolgono. Ogni regola determina un sistema di insiemi in un sistema cartesiano di ordine n. Le intersezione degli 11 sistemi di insiemi determinano la regola del modello ibrido.

�Tale scelta, coerente con il calcolo della propensione al churn del modello ibrido, risulta però di difficile (costosa in termini di tempo) implementazione informatica. In una prima fase si è scelto quindi (facendo un’analisi costi/benefici) di utilizzare le regole del modello che meglio si comporta nel dataset BOTTOM.

Page 88: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling88

Per determinare un indicatore di rischio, si predispone la distribuzione dell’IPCibrido nell’insieme BOTTOM.

Distribuzione cumulata dell’ IPCibrido

Per valori superiori a 0.7 dell’IPCibrido la login sarà considerata a rischio.

Churn: data miningModello ibridoModello ibrido

Alcuni risultatiAlcuni risultati

IPCibrido

Page 89: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling89

Churn: data miningModello ibrido Modello ibrido

Le variabili che maggiormente influiscono sulla previsione delladisattivazione dei pay sono :

�variabili di traffico �utilizzo di chat�abbonamento scelto�eventuale precedente entrata o l’uscita dal dunning�eventuali informazioni riguardo la richiesta di documentazione per supposte errate fatturazioni�informazioni sulla regione di appartenenza�informazione sulla fatturazione

Alcuni risultatiAlcuni risultati

Page 90: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling90

Churn: data miningModello ibridoModello ibrido

Accuratezza del modelloAccuratezza del modelloLe misure di adattabilità globale usualmente usate fanno riferimento alla matrice di confusione. Tale tabella racchiude le informazioni che legano, sull’insieme BOTTOM, la previsione di disattivazione con l’effettiva disattivazione. I risultqati salienti sono

L’accuratezza globale risulta dell’85%. La percentuale di SIM disattive tra quelle previste disattive(errore di commissione) è del 5.7%. Tale percentuale se confrontata con l’analoga proporzione nella customer base (che è di circa 1%) porta a un lift per l’intero gruppo selezionato (circa il 10% della customer base) di quasi 6.La percentuale di disattivi previsti dal modello tra tutti coloro che davvero sono disattivi raggiunge il 45%.

Page 91: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling91

Churn: data miningModello ibridoModello ibrido

Accuratezza del modelloAccuratezza del modello: lift: liftPer misurare la capacità predittiva del modello generalmente si ordinano le login a seconda dell’IPCstimato e si calcola il lift per i sottogruppi della popolazione determinati dai quantili della distribuzione risultante.

La funzione che traccia i lift al crescere dei percentilidella distribuzione delle login ordinata per IPC in linea teorica è una funzione non crescente (è una misura su insiemi ordinati in cui l’i-esimo comprende tutti i precedenti).

Page 92: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling92

Churn: data miningModello ibridoModello ibrido

Accuratezza del modelloAccuratezza del modello: lift: lift

La stima della funzione dei lift ottenuta utilizzando il dataset BOTTOM per misurare un modello ottenuto su un diverso dataset non è non-crescente. Considerando piccole percentuali della customer base si può verificare la presenza di perturbazioni stocastiche (rumore) che localmente non fanno mantenere l’ordine di pericolosità definito dall’IPC in uso. Èchiaro che tale proprietà viene invece soddisfatta appena le numerositànei sottogruppi divengono sufficienti (i percentili crescono).

Percentile

Lift del percentile

1 9.30 2 10.92 3 9.32 4 8.59 5 8.75 10 3.21 20 2.50 30 2.09 40 1.80 50 1.60 100 1

Page 93: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling93

Data mining:teoria

Idea di base: usare stimatori non parametrici unidimensionali come blocchi per la costruzione di una classe ristretta di modelli non parametrici per la regressione multipla

GAMGAM

Generalized Additive ModelsGeneralized Additive Models

( ) εα ++= ∑=

p

jjjf

1XY

Definizione:

�Le fj sono funzioni arbitrarie, una per ogni variabile predittiva

�Gli εi sono variabili aleatorie di errore e vengono assunti indipendenti tra loro, dalle Xj con E(εi)=0 e var(εi)=σ2

� inoltre per l’identificabilità si assume che ( ){ } 0=jjfE X

Page 94: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling94

Data mining:teoria

La convergenza non è assicurata in generale, ma per casi particolari.

GAMGAM

StimaStima:: algoritmo di backfittingalgoritmo di backfitting

1. Inizializzazione: α ==∑

11n

yii

n

( ) jff jj ,1,0 ✫== …, p

2. Ciclo: per i=1, 2..., j=1,..., p

f S fji

j ki

k jk

( ) ( )= − −

≠∑Y Xα 1

3. Fino a: ciascuna funzione è uguale alla funzione .f ji( ) f j

i( )−1

Page 95: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling95

Churn: data miningModelloModello GAMGAM

Selezione della PopolazioneSelezione della PopolazioneSi analizza la customer base dei clienti paypay al 31 ottobre 2000 che si fosse attivata almeno 4 mesi prima (prima di luglio 2000) confrontando coloro che si sono disattivati nel mese di novembre 2000 rispetto agli altri. Per queste login si è considerato il traffico fino a settembre 2000.

L’oggetto della previsioneL’oggetto della previsioneLa variabile target è un indicatore (variabile dummy) dell’evento disattivazione nel mese di novembre 2001.

Page 96: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling96

Churn: data miningModelloModello GAMGAM

PredisposizionePredisposizione data setdata set

�Divisione casuale circa a metà dell’insieme dei dati a disposizione. Creazione dei dataset “TOP” (che verrà utilizzato per la stima) e “BOTTOM” (che verrà utilizzato per la validazione).

�Dal file TOP, selezione di tutte le login disattivate.

�Selezione casuale (senza ripetizione) di un insieme di loginattive di numerosità circa uguale al numero di disattivi nel TOP. Unione di queste login alle disattive appena estratte dal file TOP.

Page 97: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling97

Churn: data miningModelloModello GAMGAM

Stima del modelloStima del modello�Si stima un modello GAM con i seguenti parametri:

•funzione legame logistica •per le variabili continue, stimatore univariato spline cubiche•selezione dei parametri di “lisciamento” attraverso ispezione grafica/tuning manuale sul file di test•stima con algoritmo di backfitting sul file di test

�Le variabili risultate non significative effettuando test statistici asintotici approssimati sono state escluse

�Calcolo della stima di una misura di propensione al churn per ciascuna login del BOTTOM utilizzando il modello stimato e determinazione di eventuali classi di rischio.

Page 98: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling98

Churn: data mining ModelloModello GAMGAM

-2.5

-1.0

0.0

N Y

Prop

ensi

one

alla

dis

attiv

azio

ne Internet Mailbox

-1.5

-0.5

0.5

N Y

Prop

ensi

one

alla

dis

attiv

azio

ne Opzione Segreteria

-1.0

0.0

1.0

1 2 3 4Pr

open

sion

e al

la d

isat

tivaz

ione Zona di Attivazione

Traffico ougoingPr

open

sion

e al

la d

isat

tivaz

ione

0 20000 40000 60000 80000

-1.0

0.0

1.0

Traffico incoming Tariffa 'Picco'

Prop

ensi

one

alla

dis

attiv

azio

ne

0 5000 10000 15000

-1.0

0.0

1.0

Traffico incoming Tariffa 'Ordinaria'

Prop

ensi

one

alla

dis

attiv

azio

ne

0 2000 4000 6000 8000

-1.0

0.0

1.0

Altre Sim Attive

Prop

ensi

one

alla

dis

attiv

azio

ne

0 1 2 3 4

-1.0

0.0

1.0

Data di Attivazione

Prop

ensi

one

alla

dis

attiv

azio

ne

-10

12

3

1995 1996 1997 1997 1998 1998

-0.5

0.0

0.5

1.0

15 - Busin

ess Time

20 - Gold

50 - V

alore

51 - V

alore 50

52 - Valore

25

Prop

ensi

one

alla

dis

attiv

azio

ne

Piano Tariffario-0

.50.

00.

51.

0

Bollettino Pos

tale

Carta di C

redito

Domiciliazio

ne Bancaria

Prop

ensi

one

alla

dis

attiv

azio

ne

Metodo di Pagamento

-20

24

Cellular Promoters

Franchise

e

GDO Dealers

Indipendent D

ealers

Major Acco

unts

OPI Stores

Office Auto

mation

Special C

hannels

Prop

ensi

one

alla

dis

attiv

azio

ne

Canale di Vendita

-0.5

0.5

1.5

N Y

Prop

ensi

one

alla

dis

attiv

azio

ne Programma Affari

Variabile A Variabile B Variabile C

Variabile D Variabile E

SI NO

Variabile I

a b c d e

Variabile F

a b c d e f g h

Variabile Ha b c

Variabile I

Variabile H Variabile M Variabile N

Alcuni risultatiAlcuni risultati

Page 99: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling99

� L’analisi ex post è essenziale per identificare quale azione agisce meglio e su quale target

�Costruire un modello (CART) per determinare il segmento più reattivo

�Clienti che hanno già tanti servizi ne accetteranno di nuovi

Customer base: massimizzare la redemptionAzioniAzioni

Page 100: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling100

4.24.2Alcuni casi: metodologia e praticaAlcuni casi: metodologia e pratica

Il Il profiling profiling sui valorisui valori

Page 101: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling101

Actual figures: Segmentation

Fonte :

APERTURA

Cultura industriale e post-industriale, aperta al

cambiamento, all’innovazione e alla complessità sociale.

APERTURA

Cultura industriale e post-industriale, aperta al

cambiamento, all’innovazione e alla complessità sociale.

CHIUSURA

Cultura di stampo arcaico e

preindustriale arroccata sui valori

tradizionali e diffidente verso il nuovo.

CHIUSURA

Cultura di stampo arcaico e

preindustriale arroccata sui valori

tradizionali e diffidente verso il nuovo.

PRIVATO

Cultura intessuta di valori materiali ed aspirazioni

individualistiche. Orientamento ai valori

del sé e del privato

PRIVATO

Cultura intessuta di valori materiali ed aspirazioni

individualistiche. Orientamento ai valori

del sé e del privato

SOCIALE

Cultura solidaristicaimpregnata di valori etici e

spirituali. Orientamento alla collettività e al

sociale.

SOCIALE

Cultura solidaristicaimpregnata di valori etici e

spirituali. Orientamento alla collettività e al

sociale.McCANNMcCANN--ERICKSONERICKSON

LA MAPPA SOCIOCULTURALELA MAPPA SOCIOCULTURALE

Page 102: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling102

Actual figures: Segmentation

Fonte : McCANNMcCANN--ERICKSONERICKSON

LA MAPPA SOCIOCULTURALELA MAPPA SOCIOCULTURALE

APERTURA

Attenzioneall’aspetto

AnomiaConsumismoEdonismo

Interesseper la moda

Narcisismo

Amore per l’aventura

AntiproibizionismoIndustrialismo

Esoterismo

Welfare

Insicurezza

Cosmopolititsmo Semplificazione della vita

Etnocentrismo

Secolarizzazione

Chiusura mentale

Ostentazione eprestigio

Paura della violenza

Interesse apparenza

Diffidenza per la pubblicità

Centralità della famiglia

Localismo

Bisogno di radicazione

Comunitarismo

Nostalgia natura

Perbenismo

Idealismo

Interesse tecnologia

PolisensualismoAdesione al nuovo

Liberalismo sessuale

Gestione della complessità

Partecipazione

EcologiaVita sociale

Revisione ruoli sessuali

AntiautoritarismoEspressione personalità

Impegno

VolontariatoCreatività personale

Spiritualità

CHIUSURA

PRIVATO

SOCIALE

Ricerca interiore

Page 103: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling103

Fonte : GPF&A

INTERESSE• PER LA MODA

• ETNOCENTRISMO

• OSTENTAZIONE

E PRESTIGIO

• INTERESSE APPARENZA

• CHIUSURA

MENTALE

• PAURA DELLAVIOLENZA

• INSICUREZZA

DECALAGE •

• LOCALISMOWELFARE •

• CENTRALITÀ DELLA

FAMIGLIA• PERBENISMO

• NOSTALGIANATURA

DIFFIDENZA PER • LA PUBBLICITÀ

COMUNITARISMO•

• IDEALISMO

• BISOGNO DIRADICAZIONE

• NARCISISMO

• SECOLARIZZAZIONE

• SPIRITUALITÀ

ESOTERISMO •

• POLISENSUALISMO• LIBERALISMO SESSUALE

CONSUMERISMO •ECOLOGIA •VITA SOCIALE •

IMPEGNO •

• VOLONTARIATO

ANOMIA •

COSMOPOLITISMO •

SEMPLIFICAZIONE • DELLA VITA

GESTIONE DELLA •COMPLESSITÀ

• ADESIONEAL NUOVO • INTERESSE

TECNOLOGIA

RICERCA• INTERIORE

REVISIONE •RUOLI SESSUALI

ESPRESSIONE •PERSONALITÀPARTECIPAZIONE •

ANTIAUTORITARISMO•

CREATIVITÀ •PERSONALE

• AMORE PERL’AVVENTURA

ANTIPROIBIZIONISMO •

• CONSUMISMO

INDUSTRIALISMO •

EDONISMO • ATTENZIONE• ALL’ASPETTO

CENTRALITÀ DEL CORPO E

DEL CONSUMO [7.0%]

[12.0%]

CULTURAPICCOLO

BORGHESE[21.7%]

TRADIZIONALISMO [11.6%]

IMPEGNO[10.3%]

RADICI [17.3%]

NUOVA FRONTIERA

[12.0%]

INTERIORITÀ [8.1%]

Actual figures: Segmentation

Page 104: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling104

Segmentation: i bisogni

APERTURA CHIUSURA

PRIVATO

SOCIALE

aver successo e diventare qualcuno• divertirsi

• fare il proprio dovere

avere molto denaro•

sentirsi al riparo e al sicuro dai pericoli•

fare una vita intensa di

relazioni sociali•

viaggiare•

•sentire la stima/approvazione delle personeche ci circondano

•sentireaffettointorno a sé

•imparare/arricchire le proprie

conoscenze

fare una vita intensa e piena di esperienza

Fonte : GPF&A

Page 105: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Confidential CRM&Profiling105

I navigatori: profiling

ObiettiviObiettivi�Capire quanti e quali pattern di utilizzondi internet hanno i navigatori dei siti di tin.it�Scoprire le caratteristiche di particolari gruppi di clienti per personalizzare siti eazioni

StrumentiStrumenti�Analisi esplorativa per ladeterminazione dei gruppi�Posizionamento dei navigatori/clienti sulla mappa dei valori

Page 106: Trieste, 28 marzo 2001homes.stat.unipd.it/bruno/docs/trieste.pdf · Collegare il business al consumer aggregando – attraverso i diversi media – una massa critica di utenti La

Trieste, 28 marzo 2001

Bruno [email protected]

http://www.brunoscarpa.it/trieste

CRM & Profiling