LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia...
-
Upload
riccardo-moro -
Category
Documents
-
view
218 -
download
4
Transcript of LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia...
LA SEGMENTAZIONE DEL MERCATOLA SEGMENTAZIONE DEL MERCATO
Un caso di analisi CHAIDUn caso di analisi CHAID
COOPCOOP
Emilio GagliardiEmilio Gagliardi Debora FacchiniDebora Facchini Giulia BravoGiulia [email protected] [email protected]@libero.it
Strumento di analisi ed obiettivo
Tecniche di segmentazione a priori basate sull’ implementazione dell’ algoritmo CHAIDCHAID (Chi-squared Automatic Chi-squared Automatic
Interaction DetectionInteraction Detection)
valutazione del grado di omogeneità entro i gruppi e di eterogeneità tra gli stessi tramite il test test 22, la cui significatività
statistica viene normalizzata con fattore di Bonferronifattore di Bonferroni
analisi di un collettivo oggetto di studio al fine di suddividere lo stesso in gruppi di consumatori omogenei al loro interno ma
tra loro eterogenei sulla base di variabili maggiormente correlate ad uno specifico target, per poter così predisporre
specifiche politiche di marketing
OBIETTIVO
Analisi preliminare
Dataset iniziale: 7200 osservazioni, ciascuna delle quali riferita ad un’intervista effettuata in un PV Coop a soci Coop o ad individui appartenenti a nuclei familiari che comprendono soci Coop
Variabili: - socio-demografiche ed economiche- punteggi di soddisfazione sul servizio di distribuzione e relative variazioni - variabili coop
tutte le variabili sono state categorizzate per limitare l’ impatto della metrica sui predittori, e presentano le modalità di seguito illustrate:
EtàEtà: meno di 35 anni; da 36 a 50 anni; da 51 a 65 anni; più di 65 anni
ProfessioneProfessione: ‘1’; ‘2’; ‘3’; ‘4’Titolo di studioTitolo di studio: elementare/media inferiore; media
superiore/universitàStato civileStato civile: celibe/nubile; sposato/a; vedovo/aArea di acquistoArea di acquisto: Romagna/Marche; Veneto; BolognaComponenti della famigliaComponenti della famiglia: 1; 2; 3; più di 3Numero minorenniNumero minorenni: 1; più di 1Numero percettori redditoNumero percettori reddito: 1; 2; più di 2Numero occupatiNumero occupati: modalità corrispondentiNumero auto posseduteNumero auto possedute: 1; più di 1
Analisi preliminare
Punteggi soddisfazione relativi al servizio distributivoPunteggi soddisfazione relativi al servizio distributivo: - bassa (da 1 a 7)
- media (8)- alta (9-10)
Giudizi su variazioni del servizio distributivoGiudizi su variazioni del servizio distributivo: - peggiorato/molto peggiorato - più o meno uguale - migliorato
Preferenza su CoopPreferenza su Coop: dicotomica si/noCanale di VenditaCanale di Vendita: iper; non iper(supermercato,discount,tradizionali,mercato,altro)
Numero di soci presenti in famigliaNumero di soci presenti in famiglia: 1; da 2 in poi
I VALORI MISSING VENGONO INCLUSI NELL’ANALISI COME CATEGORIA DISTINTA
Analisi preliminare
Scelta della variabile target
Target: CANALE DI VENDITACANALE DI VENDITA
MISSING
20.45%29.65%
49.90%
Variabili indipendenti:
- tutte insieme- a blocchi
Primo livello di analisi
Target: SOCIOSOCIOper la modalità NON IPERNON IPER di CANALE DI CANALE DI
VENDITAVENDITA
Scelta della variabile target
43.95%56.05
%
Variabili indipendenti:
- tutte insieme- a blocchi
Secondo livello di analisi
Primo livello di analisi
Intero data setIntero data set variabile target CANALE DI CANALE DI
VENDITAVENDITA
SEGMENTAZIONE IN BASE ALLA VARIABILE TARGET CANALECANALE
Variabile target: CANALE con modalità - IPER - NON IPER
Variabili indipendenti:
- Socio-demografiche ed economiche
- Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni
- Variabili “Coop”
Tasso di corretta classificazione
Dimensione dell’albero che ottimizza il tasso di corretta classificazione: 14 nodi terminali
leaves training validation1 0,6113 0,61143 0,6438 0,63484 0,6557 0,66505 0,6887 0,66786 0,7006 0,69807 0,7038 0,69808 0,7119 0,72659 0,7154 0,728210 0,7212 0,728811 0,7245 0,728812 0,7248 0,738513 0,7283 0,740214 0,7341 0,740715 0,7341 0,740716 0,7341 0,740717 0,7341 0,740718 0,7341 0,740719 0,7341 0,740720 0,7341 0,740721 0,7341 0,740722 0,7341 0,740723 0,7374 0,740724 0,7374 0,740725 0,7374 0,7407
Matrice di Confusione
IPER NON IPER
Totale
IPER 42023.93
%
26214.93
%
68238.86
%
NONIPER
19311.00
%
88050.14
%
107361.14
%
Totale
61334.93
%
114265.07
%
1755100%Frequenza valori mancanti=1
Tassi di corretta classificazioneTassi di corretta classificazione
Rappresentazione grafica dell’albero
-2- -5--4--3-
-9-
-1- -2- -5--4--3-
-7- -9--8- -10-
-6-
-14--13--12--11-
Variabile target CANALECANALE
Immagine bitmap
Variabili esplicative maggiormente influenti sulla variabile target
VARIABLE NODES IMPORTANCES_PESCE 1 1,000ZONA 2 0,903S_ASSORTIMENTO 2 0,726S_PREZZI 1 0,514INSEGNA 1 0,450SOCIO 1 0,286ETA 1 0,237
Variabile target CANALECANALE Documento di Microsoft Word
Descrizione nodi terminali
………….continu.continuaa
NODNODOO
DESCRIZIONE NODODESCRIZIONE NODO %IPER%IPER %NON %NON IPERIPER
NumerositNumerosità NODOà NODO
1 Unità che frequentano PV in Romagna-Marche aventi medio-bassa soddisfazione per pesce
36% 64% 488
2 Unità che frequentano PV in Veneto aventi medio-bassa soddisfazione per pesce
26% 74% 214
3 Unità che frequentano PV in Romagna-Marche e Veneto aventi alta soddisfazione per pesce
44% 56% 367
4 Unità che frequentano PV in zona Bologna aventi alta soddisfazione per pesce
69% 31% 454
5 Unità con media soddisfazione per l’assortimento e soddisfazione non nota per pesce
19% 81% 402
6 Unità con bassa soddisfazione per l’assortimento e soddisfazione non nota per pesce
6% 94% 662
7 Unità con alta soddisfazione per l’assortimento che frequentano PV in zona Bologna e hanno una medio-bassa soddisfazione per pesce
78% 22% 243
8 Unità che frequentano PV in Veneto con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce
10% 90% 79
9 Unità che frequentano PV in Romagna_Marche con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce
23% 77% 175
Descrizione nodi terminali
Variabile target CANALECANALE
10 Unità che frequentano PV in Zona Bologna con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce 67% 33% 151
11 Soci Coop con media soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
69% 31% 270
12 Non soci coop con media soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
45% 55% 128
13 Soci Coop con bassa soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
56% 44% 185
14 Non soci coop con bassa soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
27% 73% 146
SEGMENTAZIONE:VARIABILE TARGET CANALECANALEVARIABILI INDIPENDENTI SOCIO-DEMOGRAFICHE ED SOCIO-DEMOGRAFICHE ED
ECONOMICHE ECONOMICHE
Variabile target: CANALE con modalità - IPER - NON IPERVariabili indipendenti:- Sesso- Età - Professione- Titolo di studio- Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute
Tasso di corretta classificazione
leaves training validation1 0,6113 0,61143 0,6428 0,64564 0,6559 0,66385 0,6428 0,66386 0,6559 0,66387 0,6428 0,64568 0,6559 0,6638
Dimensione dell’albero ottimale: 4 nodi terminali
Matrice di confusione
IPER NON IPER
Totale
IPER 46726.61
%
21512.25
%
68238.86
%
NONIPER
37521.37
%
69839.77
%
107361.14
%
Totale
84247.98
%
91352.02
%
1755100%Frequenza valori mancanti=1
Tassi di corretta classificazioneTassi di corretta classificazione
Rappresentazione grafica dell’albero
Variabile target: CANALE CANALE variabili indipendenti: SOCIO-SOCIO-DEMOGRAFICHE DEMOGRAFICHE
ed ECONOMICHE ECONOMICHE
-1-
-2-
-4-
-3-
Variabili esplicative maggiormente influenti sulla variabile target
VARIABLE NODES IMPORTANCEZONA 1 1,000N_AUTO 1 0,371
Variabile target: CANALE CANALE variabili indipendenti: SOCIO-SOCIO-DEMOGRAFICHE DEMOGRAFICHE
ed ECONOMICHE ECONOMICHE
Descrizione nodi terminali
NODNODOO
DESCRIZIONE NODODESCRIZIONE NODO %IPER%IPER %NON IPER%NON IPER
1 Unità frequentanti PV situati in Romagna-Marche
29% 71%
2 Unità frequentanti PV situati in Veneto 16% 84%
3 Unità che possiedono 1 o più auto e la cui zona d’acquisto è Bologna
55% 45%
4 Unità il cui numero di auto possedute non è conosciuto, ma la cui zona d’acquisto è Bologna
35% 65%
Variabile target: CANALE CANALE variabili indipendenti: SOCIO-SOCIO-DEMOGRAFICHE DEMOGRAFICHE
ed ECONOMICHE ECONOMICHE
NODNODOO
DESCRIZIONE NODODESCRIZIONE NODO %IPER%IPER %NON %NON IPERIPER
NumerositNumerosità NODOà NODO
1Unità frequentanti PV situati in Romagna-Marche
29% 71% 1308
2 Unità frequentanti PV situati in Veneto 16% 84% 653
3Unità che possiedono 1 o più auto e la cui zona d’acquisto è Bologna
55% 45% 1831
4Unità il cui numero di auto possedute non è conosciuto, ma la cui zona d’acquisto è Bologna
35% 65% 172
SEGMENTAZIONE:VARIABILE TARGET CANALECANALEVARIABILI INDIPENDENTI PUNTEGGI DI SODDISFAZIONE PUNTEGGI DI SODDISFAZIONE
SERVIZIO DISTRIBUTIVO E RELATIVE VARIAZIONISERVIZIO DISTRIBUTIVO E RELATIVE VARIAZIONI
Variabile target: CANALE con modalità -IPER -NON IPERVariabili indipendenti:- Generale - Prezzi- Promozioni- Assortimento- Personale, servizio- Pulizia, igiene- Qualità prodotti freschi- Reparto ortofrutta- Reparto carne- Reparto pane, pasticceria- Reparto salumi, formaggi, Gastronomia- Reparto pesce fresco- Prodotti non food.
Tasso di corretta classificazioneleaves training validation
1 0,6113 0,61143 0,6438 0,64384 0,6516 0,64675 0,6826 0,66726 0,6905 0,67927 0,6995 0,68158 0,7033 0,68159 0,6930 0,686610 0,7021 0,688911 0,7059 0,688912 0,7046 0,690013 0,7084 0,690013 0,7084 0,690014 0,7084 0,690015 0,7084 0,6900
Dimensione dell’albero ottimale: 12 nodi terminali
Matrice di confusione
IPER NON IPER
Totale
IPER 41723.76
%
26515.10
%
68238.86
%
NONIPER
27915.90
%
79445.24
%
107361.14
%
Totale
69639.66
%
105960.34
%
1755100%
Tassi di corretta classificazioneTassi di corretta classificazioneFrequenza valori mancanti=1
Rappresentazione grafica dell’albero
Immagine bitmap
Variabili esplicative maggiormente influenti sulla variabile target
VARIABLE NODES IMPORTANCES_PESCE 1 1,000S_ASSORTIMENTO 2 0,826S_PROMOZIONI 2 0,464S_PREZZI 1 0,314S_PERSONALE 1 0,265
Variabile target: CANALE CANALE variabili indipendenti: PUNTEGGI PUNTEGGI SODDISF.SODDISF. SERV. DISTRIB.E SERV. DISTRIB.E RELATIVE VARIAZ.RELATIVE VARIAZ.
Descrizione dei nodi terminali
…………continuacontinua
NODNODOO
DESCRIZIONE NODODESCRIZIONE NODO %IPER%IPER %NON %NON IPERIPER
Numerosità Numerosità NODONODO
1 Unità con bassa soddisfazione per assortimento ed una media-bassa soddisfazione per pesce
33% 67% 570
2 Unità con media-alta soddisfazione per le promozioni ed un’alta soddisfazione per pesce
61% 39% 700
3 Unità con bassa soddisfazione per le promozioni ed un’alta soddisfazione per pesce
37% 63% 121
4 Unità con una media soddisfazione per l’assortimento la cui soddisfazione per pesce non è nota
18% 81% 402
5 Unità con bassa soddisfazione per l’assortimento la cui soddisfazione per pesce non è nota
6% 94% 662
6 Unità con alta soddisfazione per i prezzi, per l’assortimento ma medio-bassa per pesce
78% 22% 190
Descrizione dei nodi terminali
Variabile target: CANALE CANALE variabili indipendenti: PUNTEGGI PUNTEGGI SODDISF.SODDISF. SERV. DISTRIB.E SERV. DISTRIB.E RELATIVE VARIAZ.RELATIVE VARIAZ.
7 Unità con una media soddisfazione per i prezzi, alta per l’assortimento e medio-bassa per pesce 68% 32% 162
8 Unità con bassa soddisfazione per i prezzi, alta per l’assortimento e medio-bassa per pesce 44% 56% 82
9 Unità con media soddisfazione per le promozioni e per l’assortimento e medio-bassa per pesce 55% 45% 378
10 Unità con alta/bassa soddisfazione per le promozioni, media per l’assortimento e medio-bassa per pesce
40% 60% 292
11 Unità con alta soddisfazione per il personale, per l’assortimento e con soddisfazione per pesce non nota
28% 71% 277
12 Unita con medio-bassa soddisfazione per il personale, alta per l’assortimento e con soddisfazione per pesce non nota
54% 46% 128
SEGMENTAZIONE:VARIABILE TARGET CANALECANALEVARIABILI INDIPENDENTI COOP COOP
Variabile target: CANALE con modalità -IPER -NON IPER
Variabili indipendenti:
- Canale di vendita- Socio/non socio - Insegna - Numero soci in
famiglia - Preferenza su Coop - Area di acquisto
Tasso di corretta classificazione
Numero di foglie ottimaleNumero di foglie ottimale
leaves training validation1 0,6113 0,61143 0,6428 0,64564 0,6428 0,64565 0,7023 0,69636 0,7056 0,71177 0,7056 0,71178 0,7056 0,71179 0,7056 0,711710 0,7056 0,7117
Matrice di confusione
IPER NON IPER
Totale
IPER 37521.37
%
30717.49
%
68238.86
%
NONIPER
19911.34
%
87449.80
%
107361.14
%
Totale
57432.71
%
118167.29
%
1755100%
Tassi di corretta classificazioneTassi di corretta classificazioneFrequenza valori mancanti=1
Rappresentazione grafica dell’albero
Variabile target: CANALE CANALE variabili indipendenti: COOPCOOP
-1- -2-
-3- -4-
-5- -6-
Variabili esplicative maggiormente influenti sulla variabile target
VARIABLE NODES IMPORTANCEZONA 1 1,000INSEGNA 1 0,557SOCIO_ 1 0,523
Variabile target: CANALE CANALE variabili indipendenti: COOPCOOP
Descrizione nodi terminali
Variabile target: CANALE CANALE variabili indipendenti: COOPCOOP
NODONODO DESCRIZIONE NODODESCRIZIONE NODO %IPER%IPER %NON IPER%NON IPER NumerositNumerosità NODOà NODO
1Unità che frequentano punti vendita in Romagna-Marche
29% 71% 1308
2 Unità che frequentano PV in Veneto 16% 84% 653
3Unità che scelgono altre insegne e che frequentano PV di Bologna
30% 70% 239
4Unità che frequentano PV di Bologna di cui non è nota la preferenza per l’insegna
2% 98% 147
5Unità non soci che frequentano PV Coop a Bologna
49% 51% 435
6Unità soci che frequentano PV Coop a Bologna
66% 34% 1182
Confronto tra modelli
name target
Target event
Root ASE Valid: root ASE
CANALE_TUTTE canale
non iper 0,424182 0,427693
CANALE_COOP canale
non iper 0,444124 0,445294
CANALE_SODDISF
canale
non iper 0,437022 0,445671
CANALE_DEMOG canale
non iper 0,462142 0,460323
il modello canale_demogcanale_demog presenta un errore superiore agli altri modelli considerati
Confronto tra modelli
name target
Target event
Misclassification
Rate
Valid: Misclassification Rate
CANALE_TUTTE canale
non iper 0,265893 0,259259
CANALE_COOP canale
non iper 0,264399 0,288319
CANALE_SODDISF
canale
non iper 0,295409 0,309972
CANALE_DEMOG canale
non iper 0,344097 0,336182
i modelli canale_coop canale_coop e canale_soddisf canale_soddisf presentano un tasso di errata classificazione pressoché simile a quello del modello completo canale_tuttecanale_tutte
Confronto tra modelli
Confrontando le curve, nel primo decile i modelli canale_tuttecanale_tutte e canale_soddisfcanale_soddisf hanno un potere di classificazione migliore rispetto agli altri due modelli.Dal quinto all’ottavo decile il modello canale_coopcanale_coop acquisisce un potere di classificazione superiore rispetto al modello canale_soddisfcanale_soddisf.
Confronto tra modelli
La funzione liftlift evidenzia che i modelli canale_tuttecanale_tutte e canale_soddisfcanale_soddisf consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baselinebaseline).
Secondo livello di analisi
dataset NON IPERNON IPER variabile target SOCIOSOCIO
Segmentazione con tutte le variabili
Variabile target: SOCIOSOCIO modalità - SI
- NO
Variabili indipendenti:
- Variabili Socio-demografiche ed economiche- Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni- Variabili “Coop”
Tasso di corretta classificazione
Leaves Training Validation1 0,5705 0,54722 0,7953 0,77413 0,8300 0,81124 0,8619 0,84845 0,8619 0,84846 0,8619 0,84847 0,8619 0,84848 0,8619 0,84849 0,8619 0,8484
10 0,8619 0,848411 0,8619 0,848412 0,8619 0,8484
la dimensione dell’albero che ottimizza il tasso di corretta la dimensione dell’albero che ottimizza il tasso di corretta classificazione è pari a classificazione è pari a 5 foglie5 foglie
NO SI Totale
NO 32931.36
%
14613.92
%
47545.28
%
SI 131.24%
56153.48
%
57454.72
%
Totale
34232.60
%
70767.40
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1-
-2- -3-
-4-
-5-
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
Variabili esplicative maggiormente influenti sulla variabile target
Variable Nodes ImportanceINSEGNA 1 1.000PRIMO_PV 2 0,611
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
Descrizione nodi terminali
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità di cui non si conosce il valore per la variabile insegna 7% 93% 276
2Unità che frequentano come primo PV Coop 81% 19% 1591
3Unità che non frequentano come primo PV Coop 11% 89% 100
4Unità che frequentano come primo PV altre insegne 0% 100% 395
5Unità che non frequentano come primo PV altre insegne 100% 0% 85
Segmentazione con Segmentazione con variabili socio-demografiche ed variabili socio-demografiche ed
economicheeconomiche
Variabile target: SOCIOSOCIO con modalità - SI
- NOVariabili indipendenti:- Sesso- Età - Professione- Titolo di studio- Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute
Tasso di corretta classificazione
LeavesTrainingValidation1 0,5705 0,54723 0,5783 0,58064 0,5938 0,57965 0,5783 0,58066 0,5938 0,5796
l’albero si arresta a tre nodi terminalil’albero si arresta a tre nodi terminali
NO SI Totale
NO 22321.26
%
25224.02
%
47545.28
%
SI 18817.92
%
38636.80
%
57454.72
%
Totale
41139.18
%
63860.82
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1- -2- -3-
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti SOCIO-DEMOGRAFICHE ED SOCIO-DEMOGRAFICHE ED ECONOMICHEECONOMICHE
Descrizione dei nodi terminali
L’ unica variabile utilizzata nella costruzione dell’albero è L’ unica variabile utilizzata nella costruzione dell’albero è
ZONAZONA
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità che frequentano PV in zona Bologna
49% 51% 959
2Unità che frequentano PV in zona Romagna-Marche
60% 40% 957
3Unità che frequentano PV in zona Veneto
66% 34% 531
Segmentazione con variabili relative Segmentazione con variabili relative alla soddisfazionealla soddisfazione
Variabile target: SOCIOSOCIO con modalità -SI
-NOVariabili indipendenti:- Generale - Prezzi- Promozioni- Assortimento- Personale, servizio- Pulizia, igiene- Qualità prodotti freschi- Reparto ortofrutta- Reparto carne- Reparto pane, pasticceria- Reparto salumi, formaggi, Gastronomia- Reparto pesce fresco- Prodotti non food
LeavesTrainingValidation1 0,5705 0,54723 0,6485 0,67304 0,6485 0,67305 0,6510 0,68166 0,6510 0,68167 0,6653 0,69028 0,6678 0,69029 0,6678 0,6902
10 0,6678 0,690211 0,6678 0,690212 0,6676 0,6864
dimensione ottimale dell’albero: 8 nodi terminalidimensione ottimale dell’albero: 8 nodi terminali
Tasso di corretta classificazione
NO SI Totale
NO 24423.26
%
23122,02
%
47545.28
%
SI 948.96%
48045.76
%
57454.72
%
Totale
33832.22
%
71167.78
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1-
-4-
-3-
-5-
-2-
-6-
-7-
-8-
Variabili esplicative maggiormente influenti sulla variabile target
Variable Nodes ImportanceS_GENERALE 1 1,0000S_PROMOZIONI 1 0,6970V_PESCE 1 0,5290S_CARNE 1 0,3520
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti di SODDISFAZIONESODDISFAZIONE
Descrizione nodi terminali
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità con alta soddisfazione per le promozioni ed una soddisfazione generale medio-alta 76% 24% 544
2Unità con medio-bassa soddisfazione per le promozioni ed una soddisfazione generale medio-alta 64% 36% 946
3Unità con soddisfazione per le promozioni non nota ed una soddisfazione generale medio-alta 40% 60% 30
4Unità per le quali la soddisfazione per pesce è migliorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
38% 62% 93
5Unità per le quali la soddisfazione per pesce è peggiorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
47% 53% 426
6
Unità per le quali la variazione di soddisfazione per pesce non è nota e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
62% 38% 165
7Unità di cui non è nota la soddisfazione per carne, con bassa soddisfazione generale 26% 74% 94
8 Unità con soddisfazione generale non nota 4% 96% 149
Segmentazione con variabili Segmentazione con variabili coopcoop
Variabile target: SOCIOSOCIO con modalità - SI
- NO
Variabili indipendenti:
- Canale di vendita- Insegna - Numero soci in famiglia - Preferenza su Coop - Area di acquisto
LeavesTrainingValidation1 0,5705 0,54723 0,7953 0,77414 0,8300 0,81125 0,8619 0,84846 0,8271 0,81127 0,8619 0,8484
l’albero si arresta a cinque nodi l’albero si arresta a cinque nodi terminaliterminali
Tasso di corretta classificazione
NO SI Totale
NO 32931.36
%
14613.92
%
47545.28
%
SI 131.24%
56153.48
%
57454.72
%
Totale
34232.60
%
70767.40
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1-
-2- -3- -4- -5-
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
Variabili esplicative maggiormente influenti sulla variabile target
Variable Nodes Importance
INSEGNA 1 1,0000
PRIMO_PV 2 0,6110
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
Descrizione nodi terminali
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
NumerositNumerosità NODOà NODO
1 Unità di cui non è nota la preferenza per insegna 7% 93% 276
2 Unità il cui primo PV è Coop 81% 19% 1591
3 Unità il cui primo PV non è Coop 11% 89% 100
4Unità il cui primo PV è rappresentato da altre insegne
0% 100% 395
5Unità il cui primo PV non è rappresentato da altre insegne
100% 0% 85
Confronto tra modelli
name target
Target event
Root ASE
Valid: root ASE
SOCIO_COOP socio si 0.3356 0.3473
SOCIO_SODDIS socio si 0.4591 0.4582
SOCIO_DEMO socio si 0.4903 0.4925
SOCIO_TUTTE socio si 0.3356 0.3473
il modello socio_demogsocio_demog presenta un errore superiore agli altri modelli considerati
name target
Target event
Misclassification Rate
Valid: Misclassification Rate
SOCIO_COOP socio si 0.1381 0.1515
SOCIO_SODDIS socio si 0.3322 0.3098
SOCIO_DEMO socio si 0.4217 0.4194
SOCIO_TUTTE socio si 0.1381 0.1515
Confronto tra modelli
il modello socio_coop socio_coop presenta un tasso di errata classificazione corrispondente a quello del modello completo socio_tuttesocio_tutte, a conferma dei risultati ottenuti nella costruzione degli alberi
Confronto tra modelli
Confrontando le curve, i modelli socio_tuttesocio_tutte e socio_coop socio_coop hanno il medesimo potere di classificazione (le curve sono sovrapposte), superiore rispetto agli altri due modelli.
Confronto tra modelli
La funzione liftlift evidenzia che i modelli socio_tuttesocio_tutte e socio_coopsocio_coop (curve sovrapposte) consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baselinebaseline).