Metodi statistici per le ricerche di mercato · Corso di laurea Magistrale in «Organizzazione e...
Transcript of Metodi statistici per le ricerche di mercato · Corso di laurea Magistrale in «Organizzazione e...
14/03/2018
1
Metodi statistici per le ricerche di mercato
Prof.ssa Isabella MingoA.A. 2017-2018
Facoltà di Scienze Politiche, Sociologia, Comunicazione
Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa»
Strumenti di rilevazione dei caratteri sulle unità statistiche:
Il Questionario
Strumento dell’intervista composto da domandestandardizzate e da risposte prevalentemente chiuse.
La progettazione di un questionario richiede:1. La enumerazione dei concetti principali, dei loro indicatori 2. La formulazione delle domande per ciascun indicatore (il
contenuto e la forma sono in relazione alle modalità di somministrazione ed ai tempi previsti per l’intervista)
3. Previsione degli stati o modalità di risposta per ogni domanda (nel caso di risposte chiuse)
4. Decisioni sulla sequenza delle domande secondo una trama
a.a. 2017-2018
14/03/2018
2
Esempio
Concetto: Soddisfazione del Cliente
– Aspetti economici• Prezzo di acquisto del prodotto• Prezzo dei pezzi di ricambio
– Servizi Post-vendita• Assistenza tecnica• Condizioni di garanzia• Disponibilità dei ricambi
– Rapporti umani e professionali• Disponibilità del personale• Competenza del personale
1 per niente soddisfatto
2 poco soddisfatto
3 abbastanza soddisfatto
4 soddisfatto
5 molto soddisfatto
Il contenuto delle domande
• Fatti– Proprietà sociografiche di base: età. sesso., stato civile,
reddito, titolo di studio, composizione della famiglia …)– Abitudini di consumo: numero di acquisti mensili di un
prodotto, tipo di negozio abituale, tipo di pagamento utilizzato..)
• Conoscenze– Tipo e quantità di informazioni che l’intervistato possiede su
un determinato tema (prodotto, marca, fatti economici e sociali…)
• Opinioni – Pareri su determinatati temi
• Atteggiamenti – Predisposizione dell’intervistato ad agire e reagire di fronte
a fenomeni di mercato • Motivazioni
– Spiegazioni sui comportamenti e sugli atteggiamenti
FATTUALI
MOTIVAZIONALI
14/03/2018
3
La formulazione del questionario: criteri guida
1. Facile comprensione1. Semplicità del linguaggio, adeguato agli intervistati2. Concisione delle domande3. Chiarezza delle definizioni4. Semplicità della sintassi5. Coerenza del registro linguistico
2. Facile somministrazione1. Distinguere domande e istruzioni2. Inserire domande filtro3. Semplicità nella registrazione delle risposte
3. Controllabilità della congruenza delle risposte4. Adeguata lunghezza del questionario
Batterie di domande
•Insiemi di domande poste all’intervistato in blocco.•Sono utilizzate nella tecnica delle scale
Consentono di:•Risparmiare spazio nel questionario e tempo di somministrazione•Facilitare la comprensione del meccanismo di risposta•Facilitare il trattamento dei dati
•Nelle ricerche di mercato le batterie di domande sono spesso scale di valutazione
14/03/2018
4
Esempi di batterie di domande
a.a. 2017-2018
Scale di valutazione
a.a. 2017-2018
Sono usate per rilevare opinioni, atteggiamenti e orientamenti su qualsiasi tema.
Scale di valutazione
Comparative
Confronto a coppie
Ordinamento
Per somma
Assolute
Continue
Ancorate
Likert
Differenziale semantico
Stapel
Agli estremi
14/03/2018
5
Esempi di scale comparative
a.a. 2017-2018
Confronto a coppieImmagini di dover acquistare una birra, che marca preferirebbe tra quelle che le propongo? Per ogni coppia ne indichi una.
Peroni Moretti Heineken Peroni Moretti Heineken
- L’ordinamento a coppie viene poi trasformato in un ordinamento completo sulla base dell’ipotesi di transitività delle preferenze.
- Possibili problemi: violazione dell’ipotesi di transitività:
X Peroni MorettiX Heineken PeroniX Moretti Heineken
Esempi di scale comparative
a.a. 2017-2018
OrdinamentoImmagini di dover acquistare una birra, che marca preferirebbe tra quelle che le propongo? Le ordini in base alla sua preferenza assegnando 1 alla marca preferita . Peroni Moretti Heineken Tuborg Cheres
• Elimina il problema della violazione dell’ipotesi di transitività.• È adatta a una lista non eccessivamente numerosa
3 Peroni5 Moretti4 Heineken2 Tuborg1 Cheres
14/03/2018
6
Esempi di scale assolute
a.a. 2017-2018
Indichi il suo livello di soddisfazione complessiva per il servizio della sua Banca:
Scala grafica continua
Per nulla soddisfatto ________________________________________________________ Completamente soddisfatto0 20 40 60 80 100
Gli intervistati esprimono la loro posizione sul segmento, che viene convertita in punteggio.
Scala ancorata ordinaleScala Likert
1. Per nulla soddisfatto2. Poco soddisfatto3. Né insoddisfatto né soddisfatto4. Abbastanza soddisfatto5. Molto soddisfatto
Scala ancorata agli estremi
Per nulla soddisfatto | 1 | 2 | 3 | 4 | 5 | Completamente soddisfatto
Esempi di scale assolute
a.a. 2017-2018
- Indichi con un segno la posizione che meglio descrive tra i due estremi riportati il servizio della sua Banca:
Differenziale semantico
Economico __ __ __ __ __ __ __ CostosoAffidabile __ __ __ __ __ __ __ InaffidabileVeloce __ __ __ __ __ __ __ Lento
- Indichi quanto accuratamente ogni aggettivo descrive il servizio della sua Banca:
Scala di Stapel
+5 +5 +5 +4 +4 +4 +3 +3 +3 +2 +2 +2 +1 +1 +1
Economicità Affidabilità Lentezza -1 -1 -1 -2 -2 -2 -3 -3 -3 -4 -4 -4 -5 -5 -5
14/03/2018
7
Esempi di scale assolute
a.a. 2017-2018
1. Valuta le seguenti affermazioni riguardo la tua esperienza in ristorante. [Indica il tuo livello di accordo/disaccordo con ogni affermazione riportata di seguito, attribuendo a ciascuno un punteggio da 1 a 10, dove 1 = “per nulla d’accordo” e 10 = “del tutto d’accordo”]
da 1 = “per nulla d’accordo” a 10 = “del tutto d’accordo” Il prezzo per il pranzo è giusto La qualità del cibo servito è ottima La quantità del cibo servito è giusta I piatti serviti corrispondono a quelli prenotati Il personale è sempre gentile e disponibile Il tempo di attesa è eccessivo Il locale è molto rumoroso e si fa fatica a parlare
Scala Cantril
Tecniche di contatto nelle ricerche di mercato
a.a. 2017-2018
Tecniche di contatto
Intervista
Diretta (faccia a faccia)
Postale
Telefonica
Via Fax
Via Internet
Osservazione
Esperimento
14/03/2018
8
Intervista diretta
a.a. 2017-2018
.• Viene gestita da un intervistatore• Pregi
• Consente di adottare questionari lunghi e complessi
• Consente di accertare le condizioni del rispondente e le sue reazioni
• Difetti• Costi elevati• Influenza dell’intervistatore
Intervista postale
a.a. 2017-2018
.• Il questionario viene inviato per posta, accompagnato da una lettera personalizzata.
• Pregi • Costi contenuti• Consente ai rispondenti di riflettere sulle risposte.• È poco intrusivo
• Difetti• Mancanza della mediazione dell’intervistatore• Elevata quota di non rispondenti
14/03/2018
9
Intervista telefonica
a.a. 2017-2018
.• Il questionario viene somministrato telefonicamente.• Pregi
• Costi contenuti• Tempi contenuti.• È poco intrusivo • Consente il controllo centralizzato degli
intervistatori• Difetti
• Elevata quota di rifiuti• Si possono raggiungere solo soggetti con il
telefono• Impossibilità di avere informazioni non verbali
Le rilevazioni via Internet: e-research
a.a. 2017-2018
Rile
vazi
oni v
ia In
tern
et
E-mail survey
Con editor/word processor del computer
del rispondente
Con eseguibile installato sul computer del
rispondente
On-line survey
Single form
Multi-form
14/03/2018
10
Le rilevazioni via Internet: e-research
a.a. 2017-2018
.• Possono presentare problemi di rappresentatività del campione.
• Sono adatte a ricerche di tipo esplorativo.• Sono efficaci dal punto di vista della riduzione dei
tempi e dei costi di realizzazione.
• In Italia il 34,7% di persone da 6 anni in su non usa Internet! (Istat 2017)
Rilevazioni assistite da computer
• Tipi:• CATI : Computer Assisted Telephon Interview• CAPI: Computer Assisted Personal Interview• CAWI: Computer Assisted Web interview• CASI: Computer Assisted Self-interview
Consentono di identificare e correggere alcuni tipi di errore nella fase di rilevazione:• Ammissibilità di una risposta rispetto a quelle previste nel
questionario• Incoerenza di una risposta rispetto ad altre informazioni fornite in
precedenza• Verosimiglianza di una risposta rispetto alla classe di soggetti cui
appartiene l’intervistato
14/03/2018
11
Dal questionario alla matrice dei dati
• La struttura del questionario diventerà quella di una matrice di dati: ciascun individuo intervistato costituirà una riga, mentre ogni domanda costituirà una colonna
• Operativamente, utilizzando adeguati software:– Si inseriranno i metadati.– Si inseriranno i dati.
EsempioIl questionario: aree tematiche (1/2)
Caratteristiche socio-demografiche degli utenti
Esigenze degli utenti
14/03/2018
12
Esempio Il questionario: aree tematiche (2/2)
Valutazioni degli utenti
I. Mingo 2017-2018 Importanza per gli utenti
X =
X1 X2 … Xj … Xp
u1 x11 x12… x1j
… x1p
u2 x21 x22… x2j
… x2p
… … … … … … …
ui xi1 xi2… xij
… xip
… … … … … … …
un xn1 xn2… xnj
… Xnp
Il punto di partenza: la matrice dei dati Matrice di dati: insieme di informazioni organizzate secondo diverse righe
e diverse colonne Matrice “unità x caratteri” (ciascuna riga è associata ad una u.s.)
ciascuna colonna è associata ad un carattere una cella è la realizzazione del carattere (in colonna) su una u.s. (in
riga)
I. Mingo 2017-2018
14/03/2018
13
Matrice dei dati Carattere (variabile o mutabile)
Unità statistica (caso, intervistato)
a.a. 2017-2018
I metadati:struttura della matrice e informazioni sui dati
variabile Etichetta della variabile
Etichette dei valori della variabile
14/03/2018
14
Dal questionario alla matrice: accorgimenti (1/2)Ad ogni variabile può essere associato, per ciascuna unità statistica , soltanto un valore. Le domande che rilevano informazioni differenziate danno luogo a variabili diverse:
Dal questionario alla matrice: accorgimenti (2/2)
14/03/2018
15
Dalla matrice dei dati … alle distribuzioni di frequenza
• La matrice dei dati– è anche detta distribuzione unitaria multipla poiché rappresenta
le modalità di ciascuna variabile rilevate in ciascuna unità.– è una elencazione puntuale di tutti gli aspetti rilevati, ma non
consente di cogliere in modo sintetico le caratteristiche delfenomeno
• La distribuzione di frequenza di ciascuna variabile– È l’elencazione del numero delle volte che una modalità (o un
valore) di quella variabile carattere viene osservata nel collettivo.– Corrisponde alla suddivisione delle unità statistiche in
sottogruppi.– Consente dunque di ottenere delle prime informazioni di sintesi
a.a. 2017-2018
Esempio: Chi sono gli utenti di CIAO?
• Per rispondere a questa domanda è necessario trarre delle informazioni sintetiche dalla matrice dei dati, riguardanti gli utenti ed in particolare:– Il genere – La facoltà– La loro età– Il luogo di residenza
• Operativamente a partire dalla matrice originaria si dovranno ottenere distribuzioni di frequenze assolute e percentuali di utenti in base ad alcune caratteri di interesse.
2017-2018
14/03/2018
16
Dalla distribuzione unitaria a quella di frequenza
Cognome sesso età Livello soddisfazione
Utilità delle informazioni(importanza)
Numero di volte che si è rivolto a CIAO
Bianchi F 28 basso 2 4
Salierno F 46 medio 3 6
More M 19 alto 4 2
Valentini F 23 alto 3 10
Lincoln M 38 medio 1 8
a.a. 2017-2018
Distribuzione di frequenza assoluta
• Elencazione del numero delle volte che una modalità di un carattere viene osservata nel collettivo.
• Corrisponde alla suddivisione delle unità statistiche in sottogruppi.
• Una tabella di frequenza ha tante righe quante sono le modalità della variabile considerata + una riga per il totale.
Sesso frequenza
F 3
M 2
totale 5
Livello soddisfazione
frequenza
basso 1
medio 2
alto 2
Totale 5
Osservazioni:•Evidenzia le caratteristiche del fenomeno
•Implica perdita di informazione
a.a. 2017-2018
14/03/2018
17
Distribuzione di frequenza relativa e percentuale
• Relativa fj= nj/n– rapporto tra la frequenza assoluta e il numero totale delle
unità osservate• Percentuale pj= fj*100
– frequenza relativa moltiplicata per 100– p1 + p2 +…+ pj +…+ pK = 100
Sesso Freq. rel
F (3/5)=0.6
M (2/5)= 0.4
totale 1
Sesso Freq. %
F (3/5*100)=60
M (2/5*100)= 40
totale 100
Es. calcoloa.a. 2017-2018
Sesso Freq. assoluta
F 3
M 2
totale 5
Distribuzione di frequenza percentuale: esempio
Sesso Freq. %
F (3/5*100)= 60
M (2/5*100)= 40
totale 100
Sesso Freq. assol.
F 3
M 2
totale 5
Sesso Freq.%
F (180/300*100)= 60
M (120/300*100)= 40
totale 100
Sesso Freq. assol.
F 180
M 120
totale 300
•Attenzione: le distribuzioni percentuali implicano la perdita dell’informazione sulla numerosità dei collettivi
a.a. 2017-2018
•Possibile il confronto tra due o più collettivi di dimensioni diverse rispetto ad un carattere
14/03/2018
18
Esercizio 1
Che tipo di distribuzione rappresenta la tabella a fianco?
Quanti e quali sono le unità statistiche?
Quali e quanti sono i caratteri osservati?
Di che tipo sono? Calcolare le
distribuzioni di frequenza assolute e % dei due caratteri
a.a
geo\time Export of good and services in % of GDPDiffusione e-commerceAustria 52 altaBelgium 83 bassaCroatia 52 bassaCzech Republic 83 altaDenmark 52 Medio-altaEstonia 78 bassaFinland 32 altaFrance 29 Medio-bassaGermany 44 Medio-bassaGreece 32 bassaHungary 90 bassaItaly 29 bassaLithuania 78 Medio-bassaNetherlands 83 altaPoland 52 bassaPortugal 44 bassaRomania 44 bassaSlovakia 90 bassaSlovenia 78 bassaSpain 32 Medio-altaSweden 44 Medio-altaUnited Kingdom 29 Medio-alta
Uso del software:distribuzioni di frequenza
I. Mingo 2017-2018
14/03/2018
19
I. Mingo 2017-2018
Sesso
632 48,9661 51,1
1293 100,0
1 maschi2 femmineTotal
ValidFrequency Percent
Titolo di studio
10 ,8 ,8 ,8132 10,2 10,2 11,0650 50,3 50,4 61,4146 11,3 11,3 72,7287 22,2 22,2 95,065 5,0 5,0 100,0
1290 99,8 100,03 ,2
1293 100,0
1 fino licenza elem2 medio inferiore3 medio superiore4 laurea triennale5 laurea magistrale6 post laureaTotal
Valid
0MissingTotal
Frequency Percent Valid PercentCumulative
Percent
A proposito di …Frequenze cumulate
• Si calcolano a partire dalle distribuzioni di frequenza (assoluta, relativa o percentuale) ordinate di mutabili ordinali.
• La frequenza per ogni data classe è ottenuta come somma della corrispondente frequenza e di tutte quelle precedenti
fj= f1+ f2+….. fn-1
• Hanno senso solo se il carattere in esame è almeno un carattere qualitativo ordinale
Durata della vacanza Freq. Freq.Cum % % cum
Da 1 a 4 notti 60 25 25
Da 5 a 7 notti 70 130 29.17 (25+29.17)= 54.17
Da 8 a 14 notti 20 150 8.33 (54.17+8.33)= 62.5
Da 15 a 21 notti 60 210 25 (62.5+25)= 87.5
Oltre 21 nottiTotali
30240
240 12.5100
(87.5+12.5)= 100
Osservazioni:Le freq. cumulate consentono di individuare immediatamente il numero di unità che hanno soggiornato meno di un determinato numero di notti.
Es. il 62,5% ha soggiornato meno di 15 notti
a.a. 2017-2018
14/03/2018
20
Esercizio
Nella tabella seguente sono riportati i livelli di soddisfazione di due campioni di consumatori, rilevati in due zone di vendita differenti rispetto a un nuovo prodotto immesso nel mercato.In quale dei due campioni si registra una percentuale più elevata di clienti che esprimono livelli di soddisfazione inferiori al «Medio»?In quale dei due campioni si registra una percentuale più elevata di clienti che esprimono livelli di soddisfazione superiori al «Medio»?
a.a. 2017-2018
Livello Campione Zona NordCampione Zona SudMolto Basso 40 48
Basso 32 28Medio 53 44
Alto 24 20Molto Alto 16 13
Totale 165 153
Tab1. Soddisfazione per il Servizio prevendita
es
2017-2018
A proposito di …Grafici a torta
Caratteristiche: Ogni settore circolare
rappresenta una modalità della variabile
L’angolo al centro di ogni settore circolare corrisponde alla percentuale di ogni modalità |360 *pj /100 |
E’ opportuno rappresentare distribuzioni con un numero di modalità non eccessivamente elevato, per garantire la leggibilità del grafico.
14/03/2018
21
2017-2018
A proposito di …Grafici a barre
Caratteristiche:
•Ogni barra corrisponde ad una modalità delle variabile
•La base di ogni barra è uguale e arbitraria
•L’altezza è proporzionale alla percentuale
•La successione segue l’ordine delle modalità nel caso di caratteri ordinabili.
A proposito di …Grafici a nastro
Condizione lavorativa
Fonte: Indagine Multiscopo Istat 1995
Nostra elaborazione
servizio di leva
inabile
altra condizione
in cerca di prima oc
in cerca di occupazi
studente
casalinga
ritirato dal lavoro
occupato
Percentuale
4035302520151050
Caratteristiche:
•Ogni barra orizzontale corrisponde ad una modalità delle variabile
•Le basi delle barre sono uguali e arbitrarie
•La lunghezza è proporzionale alla percentuale
•La successione segue l’ordine delle frequenze per facilitare l’analisi.
14/03/2018
22
A proposito di …Istogrammi
Caratteristiche:-Adatto a caratteri quantitativi
•Ogni barra corrisponde ad una classe di valori della variabile
•Nell’esempio, le basi delle barre hanno uguale ampiezza come le classi di valori e l’altezza è proporzionale alla frequenza di ogni classe di valori.
•Per classi di ampiezza diversa la base di ciascuna barra dovrebbe essere proporzionale all’ampiezza della classe .
•La somma delle aree di tutti i rettangoli è uguale alla frequenza totale del carattere.
• Anche l’asse delle ascisse è graduato.
•Il poligono di frequenza si ottiene unendo con una linea spezzata i centri dei tetti di ogni rettangolo.
60,055,0
50,045,0
40,035,0
30,025,0
20,015,0
10,0
Copie di quotidiani diffuse
per 1000 abitanti
Fonte ISTAT 1996
Freq
uenz
a
4,0
3,0
2,0
1,0
0,0
A proposito di …Cartogrammi
• Si utilizzano per rappresentare serie territoriali
• Hanno come base una mappa in cui sono memorizzati i confini territoriali di ogni unità di analisi di cui si rappresenta la frequenza o l’intensità del carattere.
• Ogni area può essere colorata o retinata in base alla distribuzione di frequenza.
14/03/2018
23
Sintesi della distribuzione: gli indici medi
Le distribuzioni delle variabili possono essere sintetizzate mediante un solo valore, calcolando un “indice medio” adeguato al tipo di variabile.
Tipo di variabile Esempi Indici medi di sintesi
Qualitativa sconnessa
-Sesso-Nazionalità-Professione
Moda
Qualitativa ordinale
-Titolo studio-Frequenza dell’acquisto
Moda Mediana
quantitativa -Età-n. prodotti acquistati-spese effettuate
Moda MedianaMedia aritmetica
a.a. 2017-2018
a.a. 2017-2018
Le medie La media deve essere un valore omogeneo con i dati osservati compreso tra le modalità della distribuzione,
tra le modalità minima e massima se si è in presenza di una mutabile ordinale o di una variabile secondo il principio di Cauchy
Si distinguono: medie di posizione medie analitiche
14/03/2018
24
a.a. 2017-2018
Medie di Posizione
Moda e Mediana Si possono calcolare sia per caratteri
qualitativi che quantitativi Modalità che occupano particolari posizioni
all’interno della distribuzione del carattere
La moda
• Si può calcolare sia per caratteri qualitativi che quantitativi
• E’ la modalità della distribuzione che si presenta con la massima frequenza
• Può non essere unica
• Nelle rappresentazioni grafiche la moda è facilmente individuabile: rappresenta il picco della distribuzione
a.a. 2017-2018
Giudizio dei clienti sul packaging del prodotto Frequenza Percentuale
per niente gradito
30 2,5
poco gradito 175 14,3 abbastanza gradito
584 47,8
molto gradito 434 35,5 Totale 1223 100,0
• Se la distribuzione del carattere è suddiviso in classi al posto della moda si ottiene la classe a cui corrisponde la maxdensità media di frequenza
14/03/2018
25
a.a. 2017-2018
Esempio: distribuzione multimodale
Distribuzione dei clienti di un punto vendita per Brand preferito
Brand n j f j p jTimberland 120 0,300 30,0Lamberjack 120 0,300 30,0Geox 70 0,175 17,5Altro 90 0,225 22,5Totale 400 1.000 100.0
La distribuzione è bimodaleLe mode sono
“Timberland” e “Lamberjack”
a.a. 2017-2018
Esempio: classe modale
Punteggio ni
[87-98] 18
(98-102] 27
(102-105] 25
(105-109] 35
(109-111] 25
Totale 130
ai
11
4
3
4
2
di=ni/ai
1,64
6,75
8,33
8,75
12,50
Distribuzione dei clienti per punteggio assegnato ad un servizio post-vendita.
La classe modale è quella a cui corrisponde la max densità media di frequenza.
Qual è la classe modale?
La classe modale è “(109-111]”
VotoLaurea ni
[87-98] 18
(98-102] 27
(102-105] 25
(105-109] 35
(109-111] 25
Totale 130
1-Ampiezza della classe:
2-Densità media:ii xxai 1
i
ii a
nd
14/03/2018
26
Esercizio 2
a.a. 2017-2018
Qual è il valore modale del titolo di studio e della soddisfazione per la facilità di accesso al punto vendita?