Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z...

12
21/05/2018 1 Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa» Esercizio a.a. 2017-2018 Si ritiene che in una data città il valore medio dei consumi di un prodotto X per abitante sia di 130 euro al mese con uno scarto quadratico medio di 7,8 euro. Da una indagine campionaria su un campione di n=100 individui risulta invece che il consumo per abitante è di 131,6 euro. Scegliendo un livello di significatività dell’1%, possiamo confermare che il consumo medio della popolazione sia di 130 euro o il valore trovato nel campione è significativamente maggiore di quello ipotizzato? 1) ܪ ߤ= 130 ܪ: ߤ> 130 2) Distribuzione probabilistica: distribuzione normale Test a una coda (si è interessati a verificare se la media è superiore a quella ipotizzatala) 3) Livello di confidenza (1- )=99%; livello di significatività : =0,01. Valore di Z critico in corrispondenza del livello di fiducia prescelto. Z= + 2,33 4) Calcolo del valore della statistica test (Z empirico) = ଵଷଵ,ଵଷ ,భబబ = 2,05 Il valore Z del nostro campione è minore di 2,33, dunque dobbiamo accettare l’ipotesi nulla: il consumo medio della popolazione da cui è estratto il campione non è maggiore di 130 euro con un livello di fiducia del 99%.

Transcript of Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z...

Page 1: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

1

Metodi statistici per le ricerche di mercato

Prof.ssa Isabella MingoA.A. 2017-2018

Facoltà di Scienze Politiche, Sociologia, Comunicazione

Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa»

Esercizio

a.a. 2017-2018

Si ritiene che in una data città il valore medio dei consumi di un prodotto X per abitante sia di130 euro al mese con uno scarto quadratico medio di 7,8 euro. Da una indagine campionariasu un campione di n=100 individui risulta invece che il consumo per abitante è di 131,6 euro.Scegliendo un livello di significatività dell’1%, possiamo confermare che il consumo mediodella popolazione sia di 130 euro o il valore trovato nel campione è significativamentemaggiore di quello ipotizzato?

1) 퐻 ∶ 휇 = 130 퐻 :휇 > 130

2) Distribuzione probabilistica: distribuzione normaleTest a una coda (si è interessati a verificare se la media è superiore a quella ipotizzatala)

3) Livello di confidenza (1- )=99%; livello di significatività : =0,01.Valore di Z critico in corrispondenza del livello di fiducia prescelto.Z= + 2,33

4) Calcolo del valore della statistica test (Z empirico)푍 = ,

, = 2,05

Il valore Z del nostro campione è minore di 2,33,dunque dobbiamo accettare l’ipotesi nulla:il consumo medio della popolazione da cui è estrattoil campione non è maggiore di 130 euro con un livello di fiducia del 99%.

Page 2: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

2

Esercizio

a.a. 2017-2018

Utilizzando la tavola della distribuzione normale stabilire i valori di z per un test unilaterale in corrispondenza dei seguenti livelli di fiducia:0,950,95450,990,9973

a.a. 2017-2018

TAVOLA A

Page 3: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

3

Esercizio: uso del test t

a.a. 2017-2018

Da una indagine nazionale risulta che il consumo medio di sigarette tra gli uomini di etàcompresa tra 18 e 35 anni sia di 9,5 al giorno. Da una ricerca effettuata su 28 uomini di quellafascia di età risulta che le sigarette consumate sono 10,04, con uno scarto quadratico medio di3,5.Scegliendo un livello di significatività del 5%, ed utilizzando un test bilaterale, possiamoaffermare che il valore del campione è significativamente diverso da quello dell’indaginenazionale?1) 퐻 ∶ µ = 9,5 퐻 : µ ≠ 9,5

2) Distribuzione probabilistica: distribuzione t di Student (n<30)Test a due code(si è interessati a verificare se il consumo medio è diverso da quello

ipotizzato)3) Livello di confidenza (1- )=95%; livello di significatività : =0,05.4) Gradi di libertà v=28-1=27Valore di t critico in corrispondenza del livello di significatività prescelto e di vt= ± 2,052

4) Calcolo del valore della statistica test (t empirico)푡 = , ,

, = 0,80

Il valore t del nostro campione cade nell’area di accettazione( è compreso tra -2,05 e + 2,05) pertanto accettiamo l’ipotesi nulla: il consumo medio di sigarette del nostro campione non è significativamente diverso diquello medio nazionale.

Esercizio: uso del test t

a.a. 2017-2018

Se le sigarette consumate dai soggetti del nostro campione fossero state 12, con uno scartoquadratico medio di 3,5, scegliendo un livello di significatività del 5%, ed utilizzando un testad una coda, avremmo potuto affermare che il valore del campione è significativamentemaggiore di quello dell’indagine nazionale?

1) 퐻 ∶ µ = 9,5 퐻 : µ > 9,5

2) Distribuzione probabilistica: distribuzione t di Student (n<30)Test a una coda (si è interessati a verificare se il consumo medio è maggiore di quello

ipotizzato)3) Livello di confidenza (1- )=95%; livello di significatività : =0,05 (una coda v. tavole slide

seguente)4) Gradi di libertà v=28-1=27Valore di t critico in corrispondenza del livello di significatività prescelto e di vt= + 1,703

4) Calcolo del valore della statistica test (t empirico)푡 = ,

, = 3,71

Il valore t del nostro campione cade nell’area di rifiuto( è maggiore di 1,703) pertanto rifiutiamol’ipotesi nulla: il consumo medio di sigarette del nostro campione è significativamente diverso diquello medio nazionale.

Page 4: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

4

a.a. 2017-2018

a.a. 2017-2018

Page 5: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

5

Esercizio : test per proporzioni

a.a. 2017-2018

In una indagine sulle abitudini di acquisto di un servizio di telefonia del gestore X, svolta su uncampione di 100 famiglie di una città si è rilevata una percentuale dell’11%. Il gestore ritieneche la percentuale della popolazione consumatrice in quella città sia del 6%. Scegliendo unlivello di significatività del 5%, possiamo confermare l’affermazione del gestore? Possiamoritenere che la percentuale di consumatori nella popolazione sia del 6% o che il valore trovatonel campione è significativamente maggiore di quello ipotizzato?

1) 퐻 ∶ 푃 = 0,06 퐻 :푃 > 0,06

2) Distribuzione probabilistica: distribuzione normaleTest a una coda (si è interessati a verificare se la proporzione è inferiore a quella

ipotizzatala)3) Livello di confidenza (1- )=95%; livello di significatività : =0,05.Valore di Z critico in corrispondenza del livello di significatività prescelto.Z= 1,65

4) Calcolo del valore della statistica test (Z empirico)푍 = = , ,

, ,= 2,105

Il valore Z del nostro campione è maggiore del valore critico 1,65 dunque dobbiamo respingere l’ipotesi nulla: la percentuale di consumatori nella città è significativamente maggiore del 6%, con un livello di fiducia del 95% e di significatività del 5%.

Esercizio : test per proporzioni

a.a. 2017-2018

Da una indagine di customer satisfaction, condotta su un campione di 150 clienti, risulta che lapercentuale di clienti soddisfatti del prodotto acquistato è del 60%. La divisione marketingdell’azienda si era proposta come obiettivo una percentuale di soddisfazione del 64%.Scegliendo un livello di significatività del 5%, possiamo ritenere, in base ai risultati ottenuti sulcampione, che l’obiettivo sia stato raggiunto? Il valore del campione è significativamentediverso da quello ipotizzato?

1) 퐻 ∶ 푃 = 0,64 퐻 :푃 ≠ 0,64

2) Distribuzione probabilistica: distribuzione normaleTest a due code(si è interessati a verificare se la proporzione è diversa da quella ipotizzata)

3) Livello di confidenza (1- )=95%; livello di significatività : /2=0,025.Valore di Z critico in corrispondenza del livello di significatività prescelto.Z= ±1,96

4) Calcolo del valore della statistica test (Z empirico)푍 = , ,

, ,= -1,02

Il valore Z del nostro campione cade nell’area di accettazione( è maggiore di -1,96 e minore di +1,96) pertanto accettiamo l’ipotesi nulla: la percentuale di clienti soddisfatti non èsignificativamente diversa da quella che ci si era prefissi, con un livello di fiducia del 95%

Page 6: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

6

Esercizio : test per proporzioni

a.a. 2017-2018

Utilizzando i dati dell’esercizio precedente, verificare l’ipotesi scegliendo un livello disignificatività dell’1%, ed utilizzando un test unilaterale.Il valore del campione è significativamente minore di quello ipotizzato?

1) 퐻 ∶ 푃 = 0,64 퐻 :푃 < 0,64

2) Distribuzione probabilistica: distribuzione normaleTest a una coda(si è interessati a verificare se la proporzione è diversa da quella

ipotizzatala)3) Livello di confidenza (1- )=99%; livello di significatività : =0,01.Valore di Z critico in corrispondenza del livello di significatività prescelto.Z= - 2,33

4) Calcolo del valore della statistica test (Z empirico)푍 = , ,

, ,= -1,02

Il valore Z del nostro campione cade nell’area di accettazione( è maggiore di -2,33, pertanto accettiamo l’ipotesi nulla: la percentuale di clienti soddisfatti non èsignificativamente diversa da quella che ci si era prefissi, con un livello di fiducia del 99% e di significatività dell’1%.

I test di significatività sono test statistici che quantificano i dati in senso di probabilità: i livelli del 5% (0.05) e dell' 1% (0.01) sono livelli accettati come limiti del tutto convenzionali per stabilire la significatività di uno scarto dall'ipotesi nulla

Ad esempio, il livello di 5% sta ad indicare che su 100 campioni estratti dalla popolazione 95 di essi produrranno una differenza tra la stima campionaria e il valore del parametro, ipotizzato in H0 , piccola o nulla e solo 5 mostreranno una differenza molto alta.

Accettare o rifiutare l’ipotesi nulla:Alcune considerazioni

39

Page 7: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

7

Errori nei test di ipotesi La procedura del test delle ipotesi è soggetta a due tipi di errore

errore di I specie detto Alfa che consiste nel considerarevalide differenze che in realtà non esistono viene respinta H0 quando è vera Pr (errore I specie)=Le tecniche per ridurre la probabilità dell’errore Alfa consistono nel ridurre il livello di significatività del test

errore di II specie detto Beta che considera non significative differenze realmente presenti nella realtà viene accettata H0 quando è falsa Pr (errore II specie)=βLe tecniche per ridurre la probabilità dell’errore beta consistono nell’aumentare il livello di significatività

Per ridurre simultaneamente i due tipi di errore occorre aumentare l’ampiezza campionaria

Pagina 40

Confronto tra medie campionarie

a.a. 2017-2018

Per stabilire se la differenza tra due valori medi campionari è significativa o èdovuta al caso si deve distinguere tra due situazioni:• I due campioni sono indipendenti (sono tratti da popolazioni diverse)• I due campioni sono dipendenti (sono estratti dalla stessa popolazione)

Si supponga ad esempio di voler confrontare : il consumo medio di prodotti solari tra un campione di uomini e uno di

donne: si tratta di due popolazioni distinte o meglio due segmenti di una popolazione e dunque i due campioni sono indipendenti;

la soddisfazione di un gruppo di clienti prima e dopo l’introduzione di una miglioria nel servizio di assistenza: stessa popolazione e stesso campione, ma in momenti diversi e dunque i due campioni sono dipendenti o appaiati.

Page 8: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

8

Nel caso di campioni indipendenti di grandi dimensioni (n>30), di numerosità n1 e n2 lavariabile differenza tra le due medie campionarie tende a una distribuzione normale conmedia :

휇 = 휇 − 휇

ed Errore standard:

휎 = 휎 + 휎 = 휎푛 +

휎푛

Il test sulle differenze medie , utilizzando la distribuzione Normale standardizzata, sarà:

Z=

dove σ1² e σ2² sono le varianze delle due popolazioni, che possono essere stimate con gli scarti quadratici medi corretti dei rispettivi campioni.

Confronto tra medie campionarie : campioni indipendenti

a.a. 2017-2018

Confronto tra medie campionarie : campioni indipendenti - Esercizio

Il valore Z è inferiore a -1,96, pertanto rifiutiamol’ipotesi nulla: il consumo medio di prodotti solari tra uominie donne è significativamente diverso, con un livellodi significatività del 5%.

Si supponga ad esempio di voler confrontare :- il consumo medio di prodotti solari tra un campione di uomini n1= 200 e uno di donne

n2=200.Nel campione degli uomini risulta un consumo medio di 150 ml con uno scarto quadratico medio di 2,5 ml, mentre nel campione di donne risulta un consumo medio di 153 ml con uno scarto quadratico medio di 1,5 ml.Con un livello di significatività del 5%, si può affermare che esistono differenza significative tra uomini e donne nel consumo dei prodotti solari o le differenza rilevate sono trascurabili?

1) 퐻 ∶ 푋 = 푋 퐻 : 푋 ≠ 푋

2) Distribuzione probabilistica: distribuzione normale Z (n>30)Test a due code(si è interessati a verificare se il consumo medio è diverso

3) Livello di confidenza (1- )=95%; livello di significatività : /2=0,25.4) Valore di Z critico in corrispondenza del livello di significatività prescelto

Z= ± 1,96

4) Calcolo del valore della statistica test

푍 =

=, ,

= -14,52

Page 9: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

9

Confronto tra medie campionarie : campioni indipendenti - Esercizio

a.a. 2017-2018

- Da una ricerca di mercato è risultato che le vendite medie settimanali di quotidiani in un campione casuale di 110 edicole della zona Nord della città è di 2500 euro con uno scarto quadratico medio di 200, mentre su un campione di 88 edicole della zona Sud, le vendite medie ammontano a 2578 euro con uno scarto quadratico medio di 150euro.

Con un livello di significatività dell’1 %, si può affermare che esistono differenze significative tra le due zone?

1) 퐻 ∶ 푋 = 푋 퐻 : 푋 ≠ 푋

2) Distribuzione probabilistica: distribuzione normale Z (n>30)Test a due code

3) Livello di confidenza (1- )=99%; livello di significatività : /2=0,005.Valore di Z critico in corrispondenza del livello di significatività prescelto

Z= ± 2,58

4) Calcolo del valore della statistica test

푍 =

= = -3,13

Il valore Z è inferiore a -2,58, rifiutiamo l’ipotesi nulla: le vendite medie sono significativamente diverse nelle due zone, con un livellodi significatività del 5%.

Differenze tra proporzioni campionarie : campioni indipendenti

a.a. 2017-2018

Nel caso di campioni indipendenti di grandi dimensioni (n>30), di numerosità n1 e n2 lavariabile differenza tra le due proporzioni campionarie tende a una distribuzione normale conmedia :

푃 = |푝 − 푝 |

ed Errore standard stimato:

휎 = 푝 푞푛 +

푝 푞푛

푍 =

Page 10: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

10

Test di verifica di ipotesi sul confronto tra proporzioni campionarie : campioni indipendenti

a.a. 2017-2018

Nel caso di campioni indipendenti di grandi dimensioni (n>30), di numerosità n1 e n2 perconfrontare le proporzioni 푝 푒 푝 il test stabilirà

H0 : 푝 − 푝 = 0 H1 : 푝 − 푝 ≠ 0

Sotto l’assunzione 푝 = 푝 stimiamo il valore comune di 푝 푒 푝 attraverso la proporzionecampionaria per l’intero campione (stima conglobata) :

푃 =푝 푛 + 푝 푛

푛 + 푛

dove 푃 indica la proporzione media calcolata sui due campioni

휎 = 푃 푄푛 +

푃 푄푛

Il test sulle differenze tra proporzioni, utilizzando la distribuzione Normale standardizzata, sarà:

푍 =|푝 − 푝 |

푃 푄푛 + 푃 푄

=

Confronto tra proporzioni campionarie : campioni indipendenti - Esercizio

a.a. 2017-2018

Su un campione di consumatori di n1= 600 consumatori si è rilevato che la marca di Jeans preferita dal 28% è la ABC. Reiterando l’indagine dopo un anno su un altro campione n2 di 600 intervistati , risulta che la marca ABC è preferita dal 25%.Con un livello di significatività del 5%, si può affermare che esistono differenze significative tra le preferenze dei consumatori ?

1) 퐻 ∶ 푝 = 푝 퐻 :푝 ≠ 푝

2) Distribuzione probabilistica: distribuzione normale Z (n>30)Test a due code

3) Livello di confidenza (1- )=95%; livello di significatività : /2=0,025.4) Valore di Z critico in corrispondenza del livello di significatività prescelto : Z= ± 1,96

4) Calcolo del valore della statistica test

푍 = | |

푃 = , , =0,265 푄 = =(1-0,265)=0,735

푍 = | , , |, , , ,

=1,178

Il valore Z è compreso nell’intervallo -1,96 ---- + 1,96 pertanto accettiamo l’ipotesi nulla: la preferenza dei consumatori per la marca ABC non è cambiata nel tempo con un livello di fiducia del 95%.

Page 11: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

11

Esercizio

a.a. 2017-2018

Da una indagine riguardante l’efficacia di un nuovo spot pubblicitario è risultato che, su un campione di 450 giovani da 25 a 35 anni, il 40% ha dichiarato di aver acquistato il prodotto a seguito dello spot. Su un altro campione di 380 adulti da 36 a 45 anni invece la percentuale è risultata del 31%. Con un livello di significatività dell’1%, si può affermare che lo spot ha una diversa efficacia sui due target?

1) 퐻 ∶ 푝 = 푝 퐻 :푝 ≠ 푝

2) Distribuzione probabilistica: distribuzione normale Z (n>30)

Il valore Z dei nostro test è maggiore di 2,58 pertanto rifiutiamo l’ipotesi nulla: l’efficacia dello spot sui due target è significativamente differente con un livello di significatività dell’1%.

Confronto tra proporzioni interdipendenti

a.a. 2017-2018

Nelle ricerche di mercato a volte le proporzioni messe a confronto sono calcolatesullo stesso campione e dunque non sono indipendenti tra loro.

Si voglia ad esempio verificare l’ipotesi che non vi siano differenze significative trale percentuali dei clienti che, in un campione di 480 individui, hanno scelto ilmarchio ALFA per la qualità e per il costo (tabella seguente)

푍 =

In tal caso le modalità di risposta sono state rilevate sullo stesso campione e si escludono tra loro, pertanto nel calcolare l’errore standard, occorre tenerne conto utilizzando la seguente relazione:

휎 = ( 푝 푞 + 푝 푞 + 2푝 푝 )

휎 = (0,28 0,72) + (0,31 0,69) + 2(0,28 0,31) = 0,035

Motivi della scelta del marchio ALFA %Qualità dei prodotti 28Prezzi dei prodotti 31Facilità di reperire i prodotti 18Altri motivi 23Totale 100

Page 12: Metodi statistici per le ricerche di mercato · 4) Calcolo del valore della statistica test (Z empirico)

21/05/2018

12

Confronto tra proporzioni interdipendenti (segue)

a.a. 2017-2018

Il valore del test per il nostro campione di 480 clienti sarà:

푍 = | , , |,

= 0,86

Se scegliamo un livello di significatività di 0,01 , il valore Z critico è 2,58 e il valore del nostro test cade nell’intervallo - 2,58 ---- + 2,58 , pertanto accettiamo l’ipotesi nulla: le differenze tra le percentuali di risposte alle modalità « Qualità» e «Prezzi» non sono significative; le due motivazioni nel campione considerato si equivalgono.

푍 =

Esercizio

a.a. 2017-2018

Con un livello di significatività del 5%, si verifichi l’ipotesi che non vi siano differenzesignificative tra le percentuali dei clienti che, in un campione di 350 individui, hannoscelto il gestore WINDOFON per la trasparenza delle offerte e per la copertura(tabella seguente)=

휎 = 1

350 0,35 0,65 + 0,26 0,74 + 2 0,35 0,26 = 0,042

푍 = | , , |,

= 2,14

Motivazioni scelta gestore %Copertura 26Costi 28Trasparenza offerte 35Servizio assistenza 11Totale 100

1) 퐻 ∶ 푝 = 푝 퐻 :푝 ≠ 푝

2) Distribuzione probabilistica: distribuzione normale Z (n>30); Test a due codeLivello di confidenza (1- )=95%; livello di significatività : /2=0,025.3) Valore di Z critico in corrispondenza del livello di significatività

prescelto : Z= ± 1,964) Calcolo del valore della statistica test

il valore del nostro test è maggiore a 1,96, pertanto cade nella zona di rifiuto dell’ipotesi nulla. Le differenze tra le percentuali di risposte alle modalità Trasparenza delle offerte e Copertura sono significative.