Customer Profiling, Segmentazione e Strategie di Marketing · Generazione di profitti attraverso...
Transcript of Customer Profiling, Segmentazione e Strategie di Marketing · Generazione di profitti attraverso...
Pavia, 6 Aprile 2005Pavia, 6 Aprile 2005
Bruno ScarpaUniversità di Pavia
Customer Profiling, Segmentazione e Strategie di Marketing
Presentazione del corso di Analisi di dati aziendali
Quelli che s'innamoran di pratica sanza scienziaQuelli che s'innamoran di pratica sanza scienzia son son
come 'lcome 'l nocchier ch'entranocchier ch'entra inin navilio senza timonenavilio senza timone oo
bussolabussola,, che maiche mai haha certezzacertezza dovedove si vadasi vada. .
(Leonardo(Leonardo dada Vinci) Vinci)
la mia esperienza in aziendaNel 1997, dopo gli studi, ho avuto l‘occasione di cominciare
un‘avventura nel mondo delle aziende...
a. in RAS mi sono occupato della quotazione dei rischi e della
definizione delle tariffe e dei prezzi delle assicurazioni non vita
(auto, infortuni, incendio...)
b. Sono poi passato in OMNITEL dove ho avuto modo di impostare le
attività di data mining come strumenti statistici per il marketing
sulla clientela...
c. Dopo un po‘ di esperienza sono passato a TIN.IT dove oltre alle
analisi statistiche avevo il compito di curare le azioni di marketing
verso i clienti/navigatori/sottoscrittori...
d. L‘ultima tappa della mia esperienza aziendale è stata in ,
una azienda in start up, dove avevo il compito di curare
l‘impostazione globale e quindi la definizione di requisiti per la
gestione della relazione con i clienti.
Divisioni di Business
Vendite
CRM
Pianificazione e Controllo
Divisioni Tecniche
Information Technology
Servizi
Rete
Logistica
Marketing
Comunicazione
Analisi
Statistiche
Data mining
???
Dove?
Orientamento al Mercato/
Cliente
Orientamentoal prodotto: la
Fabbrica
Divisioni di Business
Vendite
CRM
Pianificazione e Controllo
Divisioni Tecniche
Information Technology
Servizi
Rete
Logistica
Marketing
Comunicazione
Analisi
Statistiche
Data mining
•È più vicino ai problemi centrali dell‘azienda•Fornisce suggerimenti e utilizza le analisi per modificare e muovere gli orientamenti di business sulle necessità dei clienti•L‘ambiente riunisce insieme esperienze e competenze molto diverse: esperti di marketing, di budget, sulle azioni, sulla comunicazione sulla gestione dei clienti...•...ma è fondamentale collaborare con gli esperti informatici (IT)
Orientamento al Mercato/
Cliente
Orientamentoal prodotto: la
Fabbrica
statistica nel marketing
Guida commerciale e tecnologica
Fare analisi e proporre idee:
è il motore delle azioni di
marketing
Supporto all’uomo di marketing:
aiuto quantitativo alle idee di marketing
Analisi di marketing: “reports” e statistiche
descrittive di base
Diversi livelli di coinvolgimento della statistica nel „fare business“
ReportsTabelle Semplici indicatori
ReportsTabelleSemplici indicatoriSemplici modelli
Tabelle Indicatori/tassiModelliData mining
Modelli StatisticiData miningReportsTabelleIndicatori
Strumenti:
focus sui prodotti
focus sul cliente
dic-
99
feb-
00
apr-
00
giu-
00
ago-
00
ott-0
0
dic-
00
pay
tota
le
0
500
1000
1500
2000
2500
3000
3500
4000
paytotale
dic-
99
feb-
00
apr-0
0
giu-
00
ago-
00
ott-0
0
dic-
00
pay
tota
le
0
200
400
600
800
1000
1200
paytotale
Nuove AcquisizioniCustomer Base
IL MANAGEMENT DELLA CUSTOMER BASE IL MANAGEMENT DELLA CUSTOMER BASE GUIDA LA STRATEGIA DI MARKETINGGUIDA LA STRATEGIA DI MARKETING
un’azienda di telecomunicazioni
Un unico obiettivo
Aumentare ilAumentare il Customer Lifetime ValueCustomer Lifetime Valueattraversoattraverso la la riduzioneriduzione del churn del churn
e e l’aumento dell’ARPUl’aumento dell’ARPU
PROFILING & SEGMENTATIONPROFILING & SEGMENTATION
Identificare i potenziali “Identificare i potenziali “churnerschurners””
Massimizzare la soddisfazione dei clientiMassimizzare la soddisfazione dei clienti
Focalizzarsi su target per cross e up sellFocalizzarsi su target per cross e up sell
Ridurre il Ridurre il churnchurn
Massimizzare ilMassimizzare ilvalore del clientevalore del cliente
… attraverso
customer base: approccio strategico
Identificare
Realizzare
Praticare
tutte le attività necessarie a garantire il processo di attenzione e
fidelizzazione dell’individuo verso l’azienda e la sua offerta di prodotti e
servizi
e, conseguentemente
la massimizzazione delle opportunità di business attraverso la
soddisfazione costante dei bisogni
Customer Relationship Management
Identificare
Classificare
Acquisire
Gestire
tutte le informazioni che consentono la conoscenza e l’analisi del proprio target di
riferimento
e, conseguentemente
la realizzazione di prodotti e servizi ad elevata probabilità di soddisfazione dei
suoi bisogni
sources analysis mgmnt
profiling
0%
V
ALO
RE D
EL C
LIE
NT
E
1
00
%0
% V
ALO
RE D
EL C
LIE
NT
E
1
00
%
0% FEDELTA’ DEL CLIENTE 0% FEDELTA’ DEL CLIENTE 100%100%
MASSIMIZZARE MASSIMIZZARE IL VALOREIL VALORE
OPERATORE CC PERSONALEOPERATORE CC PERSONALENUOVI VASNUOVI VASMEMBER GETS MEMBERMEMBER GETS MEMBERCURA & ATTENZIONECURA & ATTENZIONE
AZIONI A BASSO AZIONI A BASSO COSTO/ NO COSTO/ NO
PROMOZIONIPROMOZIONI
NON COSTI AGGIUNTIVI PER LA NON COSTI AGGIUNTIVI PER LA GESTIONE DEL CLIENTEGESTIONE DEL CLIENTE
AZIONI DI “MASSA”AZIONI DI “MASSA”
AUMENTARE IL AUMENTARE IL VALOREVALORE
AZIONI DI UP / CROSS SELLAZIONI DI UP / CROSS SELL
INCENTIVARE L’USOINCENTIVARE L’USO
INCENTIVARE ATTIVAZIONE DI INCENTIVARE ATTIVAZIONE DI VASVAS
COSTRUIRE COSTRUIRE FELDELTA’FELDELTA’
DIFFERENZIAZIONE DEI SERVIZIDIFFERENZIAZIONE DEI SERVIZIINBOUND & OUTBOUNDINBOUND & OUTBOUNDSCHEMA DI LOYALTY (Incentivi)SCHEMA DI LOYALTY (Incentivi)BLOCCHI (Disincentivi alla fuga)BLOCCHI (Disincentivi alla fuga)
…ALLA CONCORRENZA!…ALLA CONCORRENZA!
customer base: segmentazione di base
DATI “GREZZI”
ANALISI(PROFILING)
AZIONI
OBIETTIVI
Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve”4Acquisizione di clienti (conversione di prospect in clienti)4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell4“trattenere” i clienti (retention)4Attenzione al “cost to serve”
4Campagne4Programmi di “Loyalty”4Personalizzazione dei Servizi4Gestione dei canali di contatto4(sviluppo di nuovi prodotti)
4Analisi di dati sui clienti4Segmentazione & micro-segmentazione4Suggerimenti sui bisogni e le preferenze dei clienti
4Analisi delle propensioni sui “contatti”•Uso dei canali•Ragioni di contatto
4Esperienza del cliente per ogni canale(CC, Portale,chat, Messaging, Dealers)4Efficienza del Customer Care
CUSTOMER DATA4ID (nome, indirizzo, num. di telefono, piano tariffario...)4Dati Demografici (età, città, ...)4Dati Socio-economici (reddito, professione, titolo distudio, classe di valore, ...)4Dati Psicografici (ambiente, preferenze, hobbies, ...)4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...)
4Storia dei contatti del cliente•Uso dei canali•Motivo di contatto•Numero di contatti
DATI SUI LIVELLI DI SERVIZIO DEI CANALI...
L’approccio di crm
DATI “GREZZI”
ANALISI(PROFILING)
AZIONI
OBIETTIVI
Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve”4Acquisizione di clienti (conversione di prospect in clienti)4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell4“trattenere” i clienti (retention)4Attenzione al “cost to serve”
4Campagne4Programmi di “Loyalty”4Personalizzazione dei Servizi4Gestione dei canali di contatto4(sviluppo di nuovi prodotti)
4Analisi di dati sui clienti4Segmentazione & micro-segmentazione4Suggerimenti sui bisogni e le preferenze dei clienti
4Analisi delle propensioni sui “contatti”•Uso dei canali•Ragioni di contatto
4Esperienza del cliente per ogni canale(CC, Portale,chat, Messaging, Dealers)4Efficienza del Customer Care
CUSTOMER DATA4ID (nome, indirizzo, num. di telefono, piano tariffario...)4Dati Demografici (età, città, ...)4Dati Socio-economici (reddito, professione, titolo distudio, classe di valore, ...)4Dati Psicografici (ambiente, preferenze, hobbies, ...)4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...)
4Storia dei contatti del cliente•Uso dei canali•Motivo di contatto•Numero di contatti
DATI SUI LIVELLI DI SERVIZIO DEI CANALI...
L’approccio di crm
TLC: alcuni problemiacquisizione della clientela
prospect
→Raggiungere una soglia minima di clienti ASAP
→Trovare e attrarre i clienti giusti: quanto spendere per ciascun diverso cliente
potenziale?
Scoprire frodi di sottoscrizione
→determinare domande di sottoscrizione fraudolente
profittabilità dei clienti
valore del cliente
„dormienti“ e share of wallet
monitoraggio e management del rischio
→Determinare e ottimizzare i parametri di rischio
fedeltà
Approccio predittivo→modelli di previsione del churn
Attrito e retention
→Modellazione e determinazione e delle
principali cause
Azioni: programmi di loyalty/campagne/up
sell-cross sell
Relazione col cliente
→Personalizzazione dell‘attenzione de del
contatto
Customer satisfaction
TLC: alcuni problemi
Customer profiling
Chi sono i clienti?
Cosa ciascun cliente vuole?
Come contattare ogni cliente?
valutazione delle azioni
Spesso non è possibile effettuare esperimenti caso-controllo
→I clienti sono autoselezionati
Valutare a posteriori alcune azioni
→Stima gli effetti delle azioni condizionatamente all’effetto di tutte le altre variabili
DATI “GREZZI”
ANALISI(PROFILING)
AZIONI
OBIETTIVI
Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve”4Acquisizione di clienti (conversione di prospect in clienti)4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell4“trattenere” i clienti (retention)4Attenzione al “cost to serve”
4Campagne4Programmi di “Loyalty”4Personalizzazione dei Servizi4Gestione dei canali di contatto4(sviluppo di nuovi prodotti)
4Analisi di dati sui clienti4Segmentazione & micro-segmentazione4Suggerimenti sui bisogni e le preferenze dei clienti
4Analisi delle propensioni sui “contatti”•Uso dei canali•Ragioni di contatto
4Esperienza del cliente per ogni canale (CC, Portale,chat, Messaging, Dealers)4Efficienza del Customer Care
CUSTOMER DATA4ID (nome, indirizzo, num. di telefono, piano tariffario...)4Dati Demografici (età, città, ...)4Dati Socio-economici (reddito, professione, titolo di studio, classe di valore, ...)4Dati Psicografici (ambiente, preferenze, hobbies, ...)4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...)
4Storia dei contatti del cliente•Uso dei canali•Motivo di contatto•Numero di contatti
DATI SUI LIVELLI DI SERVIZIO DEI CANALI...
L’approccio di crm
InformaziniInformazinisocio demografichesocio demografiche
DATAWAREHOUSEDATAWAREHOUSE
InformazioniInformazionisulla attivazionesulla attivazione
Dati sull’uso & Dati sull’uso & sulla retesulla rete
Informazioni da Informazioni da ricerche di mercatoricerche di mercato((customer satisfactioncustomer satisfaction, U & A, …), U & A, …)
dati dal dati dal callcall centercenter((callscalls, , complainscomplains, , billing problemsbilling problems))
Pattern di utilizzoPattern di utilizzo(traffico, log (traffico, log filesfiles, , cookiescookies…)…)
Il DWH
Dati sulla gestione Dati sulla gestione della della customer customer basebase((campaigncampaign management, management, loyaltyloyalty, …), …)
datiDati sui clienti
generali
→informazioni socio demografiche
→dati di attivazione (es. Dati di
sottoscrizione, tipo di contratto, piano
sottoscritto, ...)
dati di fatturazione
dati sulle telecomunicazioni
→dati di traffico telco
→Dati sui VAS & Killer Applications
→Dati su altri servizi a valore aggiunto
(internet, Msites ...)
dati esterni
ricerche di mercato
informazioni sui costi
dati da internet
→dati di traffico web
→page provisioning/ Web contents (es. page
views, unique visitors, ...)
→dati sulle e-mail
→dati raccolti attraverso il web (questionari
e customer behaviour)
→dati sulle community
dati sulla gestione della customer base
→dati dal CRM operazionale
→Dati sul campaign Management &
Marketing contact history
→Dati dai programmi di loyalty
Informazioni sugli errori (madornali) dell’azienda (e.g. billing errors, ...)
…
è enorme!è enorme!
Campioni di clienti possono essere molto utiliCampioni di clienti possono essere molto utili
Per esempioPer esempio
•• tener conto degli obiettivi dell’analisitener conto degli obiettivi dell’analisi
•• non concentrarsi solo su da dove e come non concentrarsi solo su da dove e come raccogliere le informazioniraccogliere le informazioni
•• utilizzare estrazioni di parti del DWH utilizzare estrazioni di parti del DWH ((datamartdatamart) diverse a seconda degli obiettivi) diverse a seconda degli obiettivi
Nel Nel datamart datamart per la previsione della disattivazione, è più utile tenere per la previsione della disattivazione, è più utile tenere l’informazione sugli errori di fatturazione rispetto ai dettaglil’informazione sugli errori di fatturazione rispetto ai dettagli sociodemograficisociodemografici
DWHDWHÈ quindi opportuno
Il DWH: i problemi
DATI “GREZZI”
ANALISI(PROFILING)
AZIONI
OBIETTIVI
Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve”4Acquisizione di clienti (conversione di prospect in clienti)4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell4“trattenere” i clienti (retention)4Attenzione al “cost to serve”
4Campagne4Programmi di “Loyalty”4Personalizzazione dei Servizi4Gestione dei canali di contatto4(sviluppo di nuovi prodotti)
4Analisi di dati sui clienti4Segmentazione & micro-segmentazione4Suggerimenti sui bisogni e le preferenze dei clienti
4Analisi delle propensioni sui “contatti”•Uso dei canali•Ragioni di contatto
4Esperienza del cliente per ogni canale(CC, Portale,chat, Messaging, Dealers)4Efficienza del Customer Care
CUSTOMER DATA4ID (nome, indirizzo, num. di telefono, piano tariffario...)4Dati Demografici (età, città, ...)4Dati Socio-economici (reddito, professione, titolo distudio, classe di valore, ...)4Dati Psicografici (ambiente, preferenze, hobbies, ...)4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...)
4Storia dei contatti del cliente•Uso dei canali•Motivo di contatto•Numero di contatti
DATI SUI LIVELLI DI SERVIZIO DEI CANALI...
L’approccio di crm
4Utilizzo di tecniche e metodologie statistiche di vario tipo e di diverso livello di complessità
4L’approccio è graduale: si parte da soluzioni e metodologie semplici e poi man mano ci si sposta su modelli e strumenti piùsofisticati (KISS = Keep It Simple. Sam!)
4È preferibile non affidarsi a soluzioni automatiche (black box) che propongono “schiaccia il bottone e il computer farà tutto dasolo” (la proposta tipica dei tools in vendita)
4Data mining: Insieme di tecniche statistiche (e non) per lastima di modelli non-lineari per grosse quantità di dati, macaratterizzate da ridotta complessità computazionale.
modelli statistici e data mining
ObiettiviObiettiviIndividuazione dei clienti da trattare con
maggior curaIndividuazione di clienti su cui agire per
aumentare la redditività
StrumentiStrumentiDeterminazione di un indicatore del
valore di ciascun cliente per l’aziendaDefinizione di poche classi di valore
Il valore del cliente
Valore di un Cliente = Costi di
gestioneRevenue mensile
Eventuale fattori di sconto
/crescita (upgrades/
downgrades)
Costi di acquisizione
Vita stimata per quel cliente
- - x x -Costi
mensili dichiamate e
servizi
Eventualesubsidy -
Costi di rete
Costi diretti dei servizi
Costi di customer care
G&A
Advertising /Promozioni
Costi di Commissione
Selling Overhead
Handset subsidies
Lunghezza di vita prevista con H3G
Soddisfazione
Cambi di propensioni
Tassi di sconto per le aziende
Fattura mensile
Costi di attivazione
Upgrades & downgrades previsti
Drivers / Components:
Il valore del cliente è legato all’intero ciclo di vita e non solo al profitto annuale
Funzione di “profittabilità”
25.1%
30.8%
15.7%
quota clienti quota valore totale
4
5.7%
5.47%
14.0%
48.4%
14.5%
18.5%
13.1%
3.8%
81.4%
5
3
12
6.9%
20.7%
6
7
1.0%
0.7%
•Si determina per ogni cliente un indicatore di “valore” con caratteristiche di semplicità, intuitività e stabilità nel tempo
•Si determina la classifica dei clienti ordinata secondo il “valore” che essi portano all’azienda e si cerca un numero limitato di classi per i vari sottogruppi di clienti
Login pay, free, ADSL e hosting per classe a valore
0%
20%
40%
60%
80%
100%
Classe 1 Classe 2 Classe 3 Classe 4 Classe 5 Classe 6 Classe 7Classi a valore
hostingpayfreeADSL
Login per tipo di Abbonamento e classe a valore
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
ADSL Pay Free Hosting
Classe 7Classe 6Classe 5Classe 4Classe 3Classe 2Classe 1
Il valore: le classi
Modellare la disattivazione:Modellare la disattivazione:
costruire, validare, interpretare un modello che descriva il comportamento degli utenti in termini di disattivazione in relazione ad altre variabili note
Perché?Perché?
Per descrivere il fenomeno
Per prevedere i potenziali futuri disattivi
Per predisporre azioni
Per verificare l’efficacia di operazioni di marketing/Customer Operation
customer base: il churn
Le fontiLe fonti
Aziendali: (“DWH”, RADIUS, logs, Remedy,…) •Per tutti i clienti•Informazioni su
trafficoservizi opzionalicomportamento del clientereclami-rapporti con customer careazioni di marketing/customer carefatture/ricarichedati demografico/anagrafici
Altre fonti: Ricerche di mercato
•Per un piccolo campione “casuale” di clienti
•Informazioni su
comportamenti
stili di vita
motivi della disattivazione
tempi della scelta
•ottenuti tramite interviste
customer base: il churn
il churn: gli obiettivi
Determinare un indicatore di propensione alla disattivazione perogni login
Prevedere i potenziali futuri disattivi
Capire i motivi fondamentali che portano alla disattivazione e icomportamenti che la precedono
Individuare possibili azioni volte alla retention del cliente
Verificare l’efficacia di operazioni di Marketing/Customer Operation
il churn: gli obiettivi
Caratteristiche demograficheUsage di internetComportamenti di trafficoContatti con l’azendaInformazioni sul billingCopertura della rete dei pop
Comportamento Comportamento dei clienti sul dei clienti sul churnchurn
Chi è a Chi è a rischio di rischio di disattivazionedisattivazione??
PerchéPerché sonosono a a rischiorischio didi
disattivazionedisattivazione??
QuandoQuando è è maggiore il rischio maggiore il rischio di disattivazionedi disattivazione??
Promozioni della concorrenzaEventi della vita
Offerte della concorrenzaconvenienza dei prezziPrezzo dell’HardwareServizio al clienteProgrammi a premi
Identificazione della popolazione
Determinazione e reperimento delle variabili
Definizione del target
Stima del modello
Verifica dell’accuratezza
Utilizzo del modello
Passi principali
il churn: data mining
il churn: data mining
Regressione Regressione projection pursuitprojection pursuit//
GAMGAM
MARS/MARS/reti neuralireti neurali
Alberi di Alberi di regressionregression
e/e/CARTCART
Regressione Regressione lineare/logisticalineare/logistica
Il modello più semplice (lineare) non è sufficiente a descrivere i dati
bisogna ipotizzare modelli più complessi
lasciarsi guidare dalle osservazioni per costruire le relazioni tra variabili e disattivazione
Modelli per il churn
churn: GAMobiettivo: trovare per ciascun cliente un punteggio di propensione alla disattivazione (churn)
Capire quali variabili hanno effetto sulla decisione di churn e qual è l’effetto di ogni variabile considerata tra le altre
è più importante capire gli effetti che l’accuratezza della precisione
un modello GAM model è stato adattato a un campione casuale di dati (bilanciati)
I risultati sono stati valutati sull’intera customer base
-2.5
-1.0
0.0
N Y
Pro
pens
ione
alla
dis
attiv
azio
ne Internet Mailbox
-1.5
-0.5
0.5
N Y
Pro
pens
ione
alla
dis
attiv
azio
ne Opzione Segreteria
-1.0
0.0
1.0
1 2 3 4
Pro
pens
ione
alla
dis
attiv
azio
ne Zona di Attivazione
Traffico ougoing
Pro
pens
ione
alla
dis
attiv
azio
ne
0 20000 40000 60000 80000
-1.0
0.0
1.0
Traffico incoming Tariffa 'Picco'
Pro
pens
ione
alla
dis
attiv
azio
ne
0 5000 10000 15000
-1.0
0.0
1.0
Traffico incoming Tariffa 'Ordinaria'
Pro
pens
ione
alla
dis
attiv
azio
ne
0 2000 4000 6000 8000
-1.0
0.0
1.0
Altre Sim Attive
Pro
pens
ione
alla
dis
attiv
azio
ne
0 1 2 3 4
-1.0
0.0
1.0
Data di Attivazione
Pro
pens
ione
alla
dis
attiv
azio
ne
-10
12
3
1995 1996 1997 1997 1998 1998
-0.5
0.0
0.5
1.0
15 - Busin
ess Tim
e
20 - Gold
50 - Valore
51 - Valore 50
52 - Valore 25
Prop
ensi
one
alla
dis
attiv
azio
ne
Piano Tariffario
-0.5
0.0
0.5
1.0
Bollettino Posta
le
Carta di C
redito
Domiciliazio
ne Bancaria
Prop
ensi
one
alla
dis
attiv
azio
ne
Metodo di Pagamento
-20
24
Cellular Promoters
Franchise
e
GDO Dealers
Indipendent Dealers
Major Acco
unts
OPI Stores
Office Automatio
n
Special C
hannels
Prop
ensi
one
alla
dis
attiv
azio
ne
Canale di Vendita
-0.5
0.5
1.5
N Y
Pro
pens
ione
alla
dis
attiv
azio
ne Programma Affari
Variabile A Variabile B Variabile C
Variabile D Variabile E
SI NO
Variabile I
a b c d e
Variabile F
a b c d e f g h
Variabile H
a b c
Variabile I
Variabile H Variabile M Variabile N
Pro
pens
ione
alla
dis
attiv
azio
ne
Pro
pens
ione
alla
dis
attiv
azio
ne
Pro
pens
ione
alla
dis
attiv
azio
ne
L’organizzazione del corso
2 filoni + extra
a. Modellazione statistica „classica“
(Luca Monno)
b. Introduzione a R (Luca Monno)
c. Data mining e modellazione statistica
moderna (modelli non-parametrici di
regressione e classificazione)
d. Esercitazioni sui vari temi
a. Laboratorio e analisi di problemi reali
→ Lavori di gruppo
→ Verrà fornito un problema “quantitativo”
aziendale che andrà discusso in gruppo
→ All’occorrenza verranno forniti i dati
richiesti (tra quelli disponibili in una
ipotetica azienda)
→ E’ richiesta, entro tempi stabiliti una
risposta al problema aziendale, con
presentazione finale (ppt o altro)
b. Analisi di dati
→ Gara sull’analisi di un dataset
→ Analisi di dataset diversi e presentazione
risultati
Testimonianze dalle aziende: come si analizzano nella realtà i dati?
Libri: A. Azzalini, B. Scarpa (2004). Analisi dei dati e Data mining. Springer-Verlag, Milano.
Software: R http://www.r-project.orgR packages modreg, mass, sm, splines, kernsmooth
Homepage: http://www.unipv.it/mr/materialedidattico/analisidati
T. Hastie, R. Tibshirani, J. Friedman (2001). The Elements of StatisticalLearning.Data Mining, Inference, and Prediction. Springer-Verlag, New York.
S.M. Iacus, G. Masarotto (2003). Laboratorio di Statistica con R. McGraw-Hill, Milano.
P. Bortot, L. Ventura, A. Salvan (2000). Inferenza Statistica: Applicazioni con S-PLUS e R. CEDAM, Padova
Testi e altre fonti utili
Non sono libri di testo ma questo non vuol dire che non insegnino qualcosa
•William Occam (ca.1280-1349)"Entia non sunt multiplicanda praeter necessitatem" o anche "Pluralitas non est ponenda sine necessitate" (`il rasoio di Occam')
•Sir Harold Jeffreys (1961, Theory of probability, preface to the first edition):"It is sometimes considered a paradox that the answer depends not only on the observations, but on the question; it should be a platitude."
•Ronald Aylmer Fisher: "To consult the statistician after an experiment is finished is often merely to ask him to conduct a post mortem examination. He can perhaps say what the experiment died of.“
•Ronald H. Coase (premio Nobel 1991 per l’Economia): “If you torture the data long enough, Nature will always confess”
•George E. P. Box: “All models are wrong, but some are useful”
•Peter McCullagh and John Nelder (1989, GLM, 2nd edition): "Modelling in science remains, partly at least, an art" (p.8),"One of the few points on which theoretical statisticians of all persuasions are agreed is the importance of the role played by the likelihood function in statistical inference" (p.323).
Bruno [email protected]