STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli [email protected] Sito web del corso...

25
STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli [email protected] Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA Maggiore flessibilità per applicazioni aziendali (Capitoli 4 – 5 del libro)

Transcript of STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli [email protected] Sito web del corso...

Page 1: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

STATISTICA PER LE DECISIONI DI MARKETING

Andrea [email protected]

Sito web del corso

ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE

MULTIPLAMaggiore flessibilità per

applicazioni aziendali(Capitoli 4 – 5 del libro)

Page 2: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Regressione con variabili esplicative qualitative

(categoriali)

• caratteristiche socio-demografiche dei consumatori (sesso, professione, …)

• tipologia e area geografica dei punti vendita

• categoria merceologica dei prodotti• brand• …• in generale: gruppi diversi di

osservazioni

Page 3: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Es.: consumo e reddito USA (miliardi di $): §4.1

Reddito

Consumo

Negli anni 1942-1945 il modello sembra diverso: c’è una variabile importante esclusa dal modello

Page 4: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Aggiunta di una variabile dummy (variabile indicatrice con valori 0-1)

Il modello di regressione diventa multiplo:

Consumo = f(Reddito, dummy)

Page 5: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Risultati del modello di regr. lineare multiplo

�̂�=−𝟏𝟎 .𝟏+𝟎 .𝟗𝟔 𝑿𝟏−𝟓𝟓 .𝟒𝟔 𝑿𝟐

X1 = Reddito

X2 = Dummy

Interpretazione coefficienti?

Page 6: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Ricordando la definizione di X2 (dummy):

a parità di reddito (X1), la stima dell’ammontare dei consumi (y cappello) diminuisce di un ammontare pari a -55.46 (miliardi di $) negli anni in cui dummy=1 (cioè passando da un periodo di pace a uno di guerra)

se X2 = 0 (pace)

se X2 = 1 (guerra)

Page 7: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Rappresentazione grafica dell’effetto della variabile dummy (β2=-55.46): v. p. 113

Reddito

Consumo

L’adattamento migliora sensibilmente con la variabile dummy: v. p. 114

Page 8: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Generalizzazione al caso di variabili qualitative con più

di due modalità

Esempio: destagionalizzazione di una serie storica

Page 9: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Serie storica delle vendite di un bene (§4.2)

v. file: Esempio dati vendite stagionali

Page 10: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Modello:vendite stimate = f(trend + stagionalità + componente

erratica)

In questo esempio è presente solo la serie storica Y: le uniche variabili esplicative sono definite in funzione del tempo (trend, stagionalità e eventualmente ciclo)

Il modello può essere generalizzato includendo anche altre variabili esplicative (variabili esogene) se disponibili

Page 11: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Come possiamo rappresentare X?

• Perché manca la dummy per l’inverno?• formulazione alternativa (4 dummy; no intercetta): p.

117• La scelta della dummy da eliminare (o della

formulazione del modello) non cambia l’adattamento né le previsioni

La prima osservazione fa riferimento al primo trimestre (primavera);

La seconda osservazione fa riferimento al secondo trimestre (estate);

Ecc.

Page 12: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Stima dei parametri

• I coefficienti delle dummy stagionali rappresentano l’effetto della stagione considerata relativo alla stagione esclusa, a parità di trend

• Su tali stime si possono applicare tutte le procedure della regressione multipla (intervalli, test …): v. libro

Page 13: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Destagionalizzazione (p. 119-120)

La serie destagionalizzata non risente più delle ciclicità stagionali

Page 14: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Detrendizzazione (p. 119-120)

La serie detrendizzata non mostra più un andamento di lungo periodo (è stazionaria)

Page 15: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

La serie detrendizzata e destagionalizzata non risente più né delle ciclicità stagionali né dell’andamento di lungo periodo: dovrebbe essere assimilabile alla componente erratica

(in realtà ciò è vero solo in parte: perché?)

Page 16: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esercitazioni con variabili dummy

• Seminar sulla previsione delle vendite per il budgeting

• Previsione del consumo di gas (Esercizio 5.1, pp. 133-141)

Page 17: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Eteroschedasticità

• Assunzione del modello:

Var(i) = Var(yi) = 2 costante (omoschedasticità)

• In pratica, l’ipotesi è spesso violata tipicamente: Var(yi) varia in funzione del livello di una o più esplicative

Page 18: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio: dati trade

La variabilità della spesa aumenta con il numero di visite

Implicazioni di marketing

Page 19: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio: dati trade

visite_tot Tracciato dei residui

-200

0

200

0 50 100 150

visite_tot

Res

idu

i

Anche la variabilità dei residui aumenta con il numero di visite

Page 20: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Trasformazioni di Y

• Trasformare Y può aiutare a rendere Var(yi) approx costante (cioè a eliminare l’eteroschedasticità)

• Trasformazioni più comuni:– log(yi) se i E(yi)

– (yi)1/2 se yi è un conteggio

– Classe generale: Box-Cox (v. Zani-Cerioli, pp. 203-212)

• Le trasformazioni dei dati possono aiutare anche a– rendere migliore l’approx della distribuzione

di Y a una Normale

– rendere migliore l’approx di una funzione lineare

Page 21: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio dati trade – log(Y)

La trasformazione logaritmica non sembra del tutto soddisfacente

Page 22: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio dati trade – sqrt(Y)

Page 23: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio dati trade – normalità Y

Y Sqrt(Y)

log(Y): la trasformazione logaritmica può essere preferibile dal punto di vista dell’approx della distribuzione di Y con una Normale

Page 24: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Esempio dati trade – log(Y) – log(X)

Interpretazione coefficienti

Analisi per esercizio

Page 25: STATISTICA PER LE DECISIONI DI MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.

Autocorrelazione

• Assunzione del modello:

I disturbi i, e quindi le osservazioni yi, sono tra loro incorrelati (indipendenti)

• In pratica, l’ipotesi è spesso violata quando Y è una serie storica tipicamente il valore di Y al tempo t è influenzato dai valori di Y ai tempi precedenti: autocorrelazione (correlazione seriale)

• Dettagli: §4.4