1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano...

12
1 CAMPIONAMENTO CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: “Statistics for Marketing and Consumer Research”, M. Mazzocchi, ed. SAGE, 2008.

Transcript of 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano...

Page 1: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

1

CAMPIONAMENTOCAMPIONAMENTO

LEZIONI IN LABORATORIOCorso di MARKETINGL. BaldiUniversità degli Studi di Milano

Estratto dal Cap. 5 di:“Statistics for Marketing and Consumer Research”, M. Mazzocchi, ed. SAGE, 2008.

Page 2: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

2

Che cosa è un campione

Un sottoinsieme delle unità di una popolazione, che rappresentarappresenta la popolazione stessa

Misurando i dati di un campione: le informazioni sulla popolazione si possono

raccogliere ad un costo inferiore rispetto ai censimenti

deve essere necessariamente accettato un margine di errore

Page 3: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

3

Campionamento probabilisticoprobabilistico e non probabilisticonon probabilistico

Campioni probabilistici: ad ogni unità estratta è associata a una certa probabilità di essere inclusa nel campione; ciò comporta che la probabilità di ogni campione potenziale è nota.

Campionamento non probabilistico: estrazione di unità del campione che non si basa su regole di probabilità.

Page 4: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

4

Campione e popolazione: alcune terminologie

Popolazione target: l'insieme di unità oggetto della ricerca da cui viene estratto il campione.

Lista di campionamento: elenco completo delle unità di popolazione che può essere usato per estrarre il campione.

Dimensione del campione: numero di unità (n) del campione.Statistica campionaria: stima del parametro della popolazione

sulla base delle osservazioni del campione.Distribuzione campionaria: distribuzione di probabilità delle

statistiche campionarie.

Page 5: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

5

Il Campione casuale semplice (CCS)

Nel CCS ogni elemento della popolazione ha la stessa probabilità di essere estratto. Questa probabilità è nota.

Ogni elemento è estratto indipendentemente dagli altri elementi.

La probabilità di estrarre un determinato campione di n elementi è calcolabile (nota).

Page 6: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

6

Precisione delle stime e ampiezza campionaria

Campioni di dimensioni molto grandi nonnon sono necessariamente convenientinecessariamente convenienti, perché il guadagno in precisione è molto piccolo e l'aumento dei costi è molto grande

Page 7: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

7

Errori, ampiezza campionaria e ampiezza della popolazione

Per popolazioni di dimensioni elevate non è necessario aumentare proporzionalmente la dimensione del campione

Una dimensione campionaria pari a 500 garantisce un errore inferiore al 5% per qualsiasi dimensione della popolazione

Invece di optare per campioni di dimensioni superiori a 500, è meglio prendere in considerazione la spesa per la riduzione degli errori non campionari

Sample size 100 1,000 2,000 5,000 100,000 1,000,000 100,000,000

30 11.75% 16.28% 16.53% 16.68% 16.77% 16.78% 16.78%

50 6.39% 12.14% 12.46% 12.65% 12.78% 12.78% 12.78%

100 0.00% 8.04% 8.48% 8.75% 8.92% 8.93% 8.93%

200 5.02% 5.65% 6.02% 6.26% 6.27% 6.27%

500 1.98% 2.97% 3.56% 3.93% 3.95% 3.95%

1000 0.00% 1.40% 2.23% 2.76% 2.79% 2.79%

2000 0.00% 1.18% 1.93% 1.97% 1.97%

Population size

Page 8: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

8

Come si determina l’ampiezza campionaria

Fattori che influenzano la dimensione del campione (n):

Dimensione della popolazione (N) Variabilità della popolazione Livello di precisione desiderato Vincolo di bilancio

Page 9: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

9

Le tecniche di campionamento

Campionamento probabilistico• Campionamento casuale semplice• Campionamento sistematico (step)• Campionamento stratificato• Campionamento cluster• Tecniche complesse di campionamento

Campionamento non probabilistico• Campionamento “di convenienza”• Campionamento “di giudizio”• Campionamento per quote• Campionamento Snowball (a valanga)

Page 10: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

10

Campionamento non probabilistico

Non permette di associare valutazioni sulla precisione e accuratezza delle stime

Non necessariamente è distorto o poco informativo In alcuni casi - per esempio quando non vi è una

lista di campionamento definita - può rappresentare l'unica soluzione possibile

Limite fondamentale - in generale, le tecniche di inferenza statistica non possono essere utilizzate per generalizzare i risultati dal campione alla popolazione

Page 11: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

Tabella-prontuario per stabilire l’ampiezza campionariaTabella-prontuario per stabilire l’ampiezza campionaria(per popolazioni infinite)(per popolazioni infinite)

Valida per livelli di confidenza pari al 95%

p= quota di popolazione che possiedeuna determinata caratteristica

1%,2%....= limiti di errore

Page 12: 1 CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: Statistics for Marketing and.

Come costruire la numerosità di un campione stratificato

DATI ASSOLUTI RIPARTIZIONE PERCENTUALE RIPARTIZIONE CAMPIONE n=300

maschi femmine totale maschi femmine

totale maschi

femmine

totale

Età Età Età

0-9 anni 2845132 2685891 5531023 0-9 anni 4.8% 4.5% 9.3% 0-9 anni 14 14 28

10-19 anni 2919303 2745182 5664485 10-19 anni 4.9% 4.6% 9.5% 10-19 anni 15 14 29

20-29 anni 3197404 3130487 6327891 20-29 anni 5.4% 5.3% 10.6% 20-29 anni 16 16 32

30-39 anni 4155287 4190252 8345539 30-39 anni 7.0% 7.1% 14.0% 30-39 anni 21 21 42

40-49 anni 4734090 4833778 9567868 40-49 anni 8.0% 8.1% 16.1% 40-49 anni 24 24 48

50-59 anni 3834719 4037115 7871834 50-59 anni 6.5% 6.8% 13.2% 50-59 anni 19 20 40

60-69 anni 3286806 3573355 6860161 60-69 anni 5.5% 6.0% 11.5% 60-69 anni 17 18 35

70-79 anni 2510028 3118950 5628978 70-79 anni 4.2% 5.2% 9.5% 70-79 anni 13 16 28

80-89 anni 1130360 1987452 3117812 80-89 anni 1.9% 3.3% 5.2% 80-89 anni 6 10 16

90-99 anni 129918 373156 503074 90-99 anni 0.2% 0.6% 0.8% 90-99 anni 1 2 3

100 anni e più 2460 12619 15079 100 anni e più 0.0% 0.0% 0.0% 100 anni e più 0 0 0

totale 28745507 30688237 59433744 totale 48.4% 51.6% 100.0% totale 145 155 300

totale

Territorio I talia

Anno 2011

Cittadinanza totaleCittadinanza totale

Territorio I talia

Anno 2011

Cittadinanza

Territorio I talia

Tipo dato popolazione residente

Anno 2011