1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie ...

102

Click here to load reader

Transcript of 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie ...

Page 1: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

1/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le indagini campionarieLe indagini campionarie

Le fasi di un’indagine campionaria Il campionamento: schemi e stima dei

parametri Gli errori campionari e non campionari Tipologie di quesiti, scale di valutazione, classificazione dei caratteri statistici

Page 2: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

2/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Indagini censuarie e campionarie

Un’indagine conoscitiva può essere condotta secondo due approcci distinti:

indagine totale o censuaria indagine parziale o campionaria

Il collettivo di unità su cui deve essere effettuata l’indagine è esaminato in maniera completa

È esaminata solo una parte del collettivo - un campione - anziché la sua totalità

Page 3: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

3/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Confronto tra indagine censuariae indagine campionaria

Indaginecensuaria

Indagine campionaria

Risorse economiche molto elevate contenute

Durata delle operazioni molto lunga breve

Errore campionario assente presente

Altri tipi di errore presenti presenti

Page 4: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

4/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento - prime definizioni

Popolazione o universo: insieme di unità che soddisfano in maniera esaustiva uno o più criteri (Es: insieme imprese manifatturiere italiane attive al 31/12/2014)

Indagine campionaria: metodologia per conoscere le caratteristiche della popolazione tramite un campione

InferenzaInferenza statisticastatistica: processo mediante il quale si desumono le caratteristiche di una popolazione attraverso lo studio di una parte di essa detta campione

Il campionamentocampionamento può essere:- probabilistico: scelta delle unità affidata al caso

- non probabilistico: scelta delle unità dipendente dalla soggettività di chi raccoglie le informazioni

Page 5: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

5/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Confronto tra campionamento probabilistico e non probabilistico

Campionamento probabilistico

Campionamento non probabilistico

Risorse economiche

relativamenteelevate contenute

Durata delle operazioni

relativamentelunga breve

Errore campionario valutabile non valutabile

Rappresentatività della popolazione buona non valutabile

Page 6: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

6/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

1. Formulazione degli obiettivi dell’indagine1. Formulazione degli obiettivi dell’indagine

- Si decide quali informazioni rilevare

- informazioni prioritarieprioritarie (relative agli obiettivi principali dell’indagine)

- informazioni complementaricomplementari (relative agli obiettivi secondari)

Page 7: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

7/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

2. Individuazione della popolazione obiettivo2. Individuazione della popolazione obiettivo

- insieme delle unità sulle quali si intende ottenere le informazioni obiettivo dell’indagine

- definito in base ad alcuni criteri (in particolare criteri spazio-temporali) - Lista di campionamento: elenco esaustivo delle

unità appartenenti alla popolazione obiettivo

Page 8: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

8/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

3. Individuazione tecnica di campionamento3. Individuazione tecnica di campionamento

- Metodo di selezione del campione

- prima distinzione: metodi probabilistici e non probabilistici

- Scelta dipendente da:

- livello di attendibilità desiderato

- vincoli sui costi dell’indagine

Diversi schemi di campionamento probabilistico e non probabilistico

Page 9: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

9/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

4. Individuazione modalità di raccolta dati4. Individuazione modalità di raccolta dati

- tramite questionario, diverse modalità:

- postale (autocompilazione)

- intervista telefonica (compilazione assistita)

- intervista diretta (compilazione assistita)

- via internet o email (autocompilazione)

Par. 2.4 per i dettagli sulle tecniche di rilevazione dei dati

(vantaggi e svantaggi delle diverse tecniche)

Scelta modalità: compromesso tra diversi obiettivi spesso contrastanti: partecipazione; qualità dei dati; costi

Rilevazioneassistita dacomputer:

CATI

CAPI

CAWI

Page 10: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

10/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

5. Progettazione del questionario5. Progettazione del questionario

- Strumento per la rilevazione dei dati

- Caratteristiche (lunghezza, complessità dei quesiti, istruzioni)

dipendenti dalla modalità di rilevazione:

- con autocompilazione (breve e semplice; istruzioni per l’intervistato)

- intervista telefonica (meglio breve e semplice; istruzioni per l’intervistatore)

- intervista diretta (anche più complesso)

- Test (indagini pilota) e revisioni

Page 11: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

11/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

6. Rilevazione dei dati6. Rilevazione dei dati

- Determinazione del periodo più appropriato per la raccolta dei dati

- Concentrazione in un breve periodo

7. Codifica e archiviazione dei dati7. Codifica e archiviazione dei dati

- Codifica numerica delle variabili qualitative (in particolare, in caso di domande a risposte aperte)

- Inserimento delle informazioni in un supporto informatico

- Verifiche di coerenza, dati mancanti e relative imputazioni

Page 12: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

12/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le fasi di un’indagine campionaria

8. Analisi dei dati8. Analisi dei dati

- Produzione delle stime campionarie dei valori ignoti relativi alla popolazione

9. Redazione di un rapporto di ricerca9. Redazione di un rapporto di ricerca

- Descrizione delle caratteristiche dell’indagine

- Descrizione dei principali risultati ottenuti

Page 13: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

13/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Caso di studio:le fasi dell’indagine EFIGE

1. Obiettivi dell’indagine 1. Obiettivi dell’indagine

Modalità di internazionalizzazione e analisi delle relazioni con altre caratteristiche delle imprese

- informazioni prioritarie (circa 40 variabili per le quali è richiesta una % di risposte di almeno il 90%)

- informazioni complementari (circa 110 variabili)

2. Popolazione obiettivo2. Popolazione obiettivoImprese manifatturiere con almeno 10 dipendenti(Eurostat: Structural Business Statistics, 2008)

3. Individuazione tecnica di campionamento3. Individuazione tecnica di campionamentoCampionamento probabilistico (stratificato)

Page 14: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

14/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il caso di studio:le fasi dell’indagine EFIGE

4. Individuazione modalità di raccolta dati4. Individuazione modalità di raccolta dati- telefonica (CATI)- via web (CAWI)

5. Progettazione del questionario5. Progettazione del questionarioComplesso (nonostante CATI, CAWI); domande prioritarie, altreIndagine pilota: su 100 imprese per i paesi più grandi; per convalidare modalità di contatto e adeguatezza del questionario (chiarezza, facilità di risposta, filtri)6. Rilevazione dei dati6. Rilevazione dei datiDa gennaio a maggio 2010Dati di bilancio relativi al 2008

Page 15: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

15/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il caso di studio:le fasi dell’indagine EFIGE

7. Codifica e archiviazione dei dati7. Codifica e archiviazione dei datiFile Excel: un foglio per ogni sezione del questionario

8. Analisi dei dati8. Analisi dei dati

- Stima delle variabili e analisi descrittive

- Stima dei parametri di modelli e analisi delle determinanti della internazionalizzazione9. Rapporto di ricerca9. Rapporto di ricerca“The triggers of competitiveness: The EFIGE cross-country report”

Page 16: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

16/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il processo di stima– concetti di base

Processo di stima: procedimento per ricavare, tramite una funzione delle osservazioni campionarie, il valore incognito di una caratteristica della popolazione

Il parametro da stimareparametro da stimare: la caratteristica della popolazione che costituisce l’obiettivo dell’indagine

Lo stimatorestimatore: una formula analitica atta a stimare il valore incognito della caratteristica della popolazione sulla base dei dati campionari

Il valore della stima o stimastima: il risultato dell’applicazione dello stimatore ai dati campionari

Page 17: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

17/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il processo di stima

Esempio. Il parametro da stimareparametro da stimare è la media aritmetica del fatturato delle aziende di un paese, le quali costituiscono la popolazione di riferimento (composta da N unità):

1

1 N

ii

Y YN

1

1 n

jj

y yn

Dalla popolazione si estrae un campionecampione casuale di n unità sulle quali si rileva il fatturato.La stima del parametro della popolazione si ottiene applicando ai dati campionari lo stimatore stimatore media aritmetica:

Page 18: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

18/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il processo di stima

Altri parametri da stimareparametri da stimare (oltre la media):

- Il totale:

- La varianza: 2 2

1

1( )

N

Y ii

S Y YN

1

N

Y ii

t Y

Stima del totale: ˆYt N Y N y

22

1

11

n

y jj

s y yn

Stima della

varianza:

Page 19: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

19/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stimatore corretto

Lo stimatorestimatore di un parametro θ della popolazione: una funzione dei dati campionariper assegnare un valore a θ sulla base del campione

ˆ ( )cf Y

Stimatore correttoStimatore corretto (o non distorto): se nell’insieme dei campioni casuali estraibili il valore medio delle stime è pari al valore del parametro nella popolazione:

ˆ( )E

ˆ ˆ( ) ( )B E

Altrimenti, stimatore non corretto

DistorsioneDistorsione:

Page 20: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

20/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stimatore corretto - Esempio

Campionamento casuale semplice senza ripetizionePopolazione di N = 4 unità; campioni di n = 2 unità

Popolazionen. Y

Possibilicampio

niValori di y

1 1102 1203 804 90

(1; 2)(1; 3)(1; 4)(2; 3)(2; 4)(3; 4)

110; 120110; 80110; 90120; 80120; 9080; 90

11595

10010010585

( ) 100 E y

y

100 Y

Page 21: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

21/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Lo stimatore fondamentale nel campionamento probabilisticoProbabilità di inclusioneProbabilità di inclusione: probabilità che una unità della popolazione appartenga al campione. Non necessariamente uguale per ogni unità (Es. caso di studio: sovra-campionamento grandi imprese)

Nel campionamento probabilistico la probabilità di probabilità di inclusione nel campione è notainclusione nel campione è nota e diversa da zero per ogni unità della popolazione

Esempio: Campionamento casuale semplice senza ripetizionePopolazione di N = 4 unità: 1; 2; 3; 4

Insieme dei possibili campioni di n = 2 unità (1,2); (1,3); (1,4); (2,3); (2,4); (3,4)

Probabilità di inclusione dell’unità 1: 3/6= ½ (= n/N)(idem per 2, 3, 4)

Page 22: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

22/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Lo stimatore fondamentale

Stimatore corretto della media per il campionamento probabilistico senza ripetizione - Notazioni:Probabilità di inclusione: j

1 1

1 1ˆn n

jj j

j jj

yY w y

N N

1/j jw

1 1

ˆˆn n

jY j j

j jj

yt NY w y

Coefficienti di espansione:Stimatore fondamentale (di Horvitz-Thompson) della mediamedia:

e del totaletotale:

Page 23: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

23/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stimatore fondamentale - Esempio

Popolazione di N = 4 unità:

Y1 = 110; Y2 = 120; Y3 = 80; Y4 = 90; 100; 400YY t

1ˆ (2 110 2 80) 954

Y

ˆ 4 95 380Yt

Campione estratto di n = 2 unità: (1,3)

1

1ˆn

j jj

Y w yN

ˆ

Yt NY

1

ˆn

y j jj

t w y

ˆ 2 110 2 80 380Yt

Page 24: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

24/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le tecniche di campionamento probabilistico

Principali tecniche di campionamento probabilistico:

casuale semplice (CCS) e sistematico (CSI) stratificato (CST) a grappoli (CGRA) a più stadi (CSTA)

Page 25: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

25/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento casuale semplice Tecnica di campionamento più elementarepiù elementare tra i metodi probabilistici

Rappresenta il naturale punto di partenzapunto di partenza per lo studio di tutti gli altri metodi di campionamento

La probabilità di inclusioneprobabilità di inclusione nel campione è la stessa per ogni unità della popolazione - pari alla frazione di campionamento - data da:

j

nf

N

Page 26: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

26/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La tecnica di estrazione del CCS- illustrazione

1 2

50 49

3 6

11 12

25 28

31

44

37

46

Dato N=50, le unità della popolazione sono numerate da 1 a 50

Per estrarre un CCS di 10 unità (f = 1/5) si genera una sequenza di numeri casuali {3, 6, 11, 12, 25, 28, 31, 37, 44, 46}

Le unità corrispondenti a tali numeri d’ordine costituiscono il campione

Page 27: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

27/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento sistematico

Tecnica alternativa assimilabile a quella per l’estrazione di un CCS

Consiste nella selezione di una unità ogni k presenti nella lista

k è il passo di campionamento: la parte intera del reciproco della frazione di campionamento k = N/n

Page 28: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

28/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La tecnica di estrazione del CSI- illustrazione

Dato N = 50 e fissata la dimensione campionaria n = 10, si

determina il passo di campionamento, dato da k = N/n = 50/10 = 5

Si estrae un numero casuale compreso tra 1 e k (5) per esempio 2 e si seleziona l’unità corrispondente

Si procede selezionando le unità corrispondenti ai seguenti n. d’ordine: 2+k = 7, 2+2k = 12, 2+3k = 17, … fino ad esaurimento della lista

2 1

50 49

7

12 17

22 27

32 37

42 47

Page 29: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

29/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Pro e contro del CCS

La semplicità semplicità concettuale è il suo principale punto di punto di forzaforza

Il CCS presenta tuttavia anche alcuni possibili svantaggi:svantaggi:

Il campione potrebbe presentarsi sparsosparso sul territorio con conseguenti costi elevaticosti elevati di organizzazione

Poiché tutti i possibili campioni hanno uguale probabilità di essere estratti, è possibile estrarre un ‘‘cattivo’’‘‘cattivo’’ campione campione (poco rappresentativopoco rappresentativo della popolazione)

Page 30: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

30/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le stime con il CCS

Media:Media:

Lo stimatore corretto della media della popolazione è lamedia campionaria

Totale:Totale:

VarianzaVarianza (stima varianza di Y nella popolaz. ):

1 1

1 1n nj

jj j

yy y

N n N n

yt N y

22

1

11

n

y jj

s y yn

1

1ˆn

j

j j

yY

N

2 2

1

1( )

N

Y ii

S Y YN

Page 31: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

31/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stima di una frequenza

Popolazione: Yi = 1 se l’attributo è presente; Yi = 0 se assente

Stimatore fondamentale della frequenza: frequenza:

1

1 N

ii

P YN

1 1

1 1ˆn n

jj

j jj

yP y p

N n

Yt N y N p Stimatore del totale:

Page 32: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

32/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Varianza degli stimatori

Necessario conoscerla per poter costruire gli intervalli di confidenza per le stime tratte dal campioneVarianza teorica: nell’insieme di tutti i possibili campioniEsempio: varianza della media campionariaPopolazionen. Y

Possibilicampion

iValori di y

1 1102 1203 804 90

(1; 2)(1; 3)(1; 4)(2; 3)(2; 4)(3; 4)

110; 120110; 80110; 90120; 80120; 9080; 90

11595

10010010585

y

2 2 2( ) [(115 100) (95 100) ...(85 100) ] / 6 83.3Var y

Y =100

( ) 100 E y

Page 33: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

33/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Varianza della media campionaria

Varianza teorica della media campionaria:Varianza teorica della media campionaria:

2

Var( )1

YN n Sy

N nEsempio

Popolazione: Y1 1102 1203 804 90

2 4 2 250Var( ) 83.3

1 4 1 2YN n S

yN n

Y =100

2S =250Y

Page 34: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

34/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Varianza della media campionaria

Dalla varianza teorica varianza teorica della media campionaria:

Alla stima della varianza stima della varianza della media campionaria:

2

var( ) (1 ) ysy f

n

2

Var( )1

YN n Sy

N n

Page 35: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

35/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Varianza della media campionaria - EsempioPopolazionen. Y

Possibilicampio

ni

1 1102 1203 804 90

(1; 2)(1; 3)(1; 4)(2; 3)(2; 4)(3; 4)

11595

10010010585

12.5112.5

50200

112.512.5

( ) 100 E y

y

(var( )) 83.3 E y

var( ) y

2 4 2 250Var( ) 83.3

1 4 1 2YN n S

yN n

Y =1002S =250Y

2

var( ) (1 ) ysy f

n

(25 25) /1(1 0.5) 12.5

2

Varianza teorica: Stima – campione (1; 2):

Page 36: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

36/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Intervalli di confidenza per le stime

Per n sufficientemente elevato la distribuzione campionaria

della media può essere approssimata con una normale

Intervallo di confidenzaIntervallo di confidenza per laper la media: media:

2 2

2 2[ (1 ) ; (1 ) ]y ys sy z f y z f

n n

2[ var( )]y z y

Page 37: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

37/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Intervalli di confidenza per le stime

Intervallo di confidenzaIntervallo di confidenza per il totale: per il totale:

2 2

2 2[ (1 ) ; (1 ) ]y yy y

s st z N f t z N f

n n

2ˆ ˆ[ var( )]y yt z t

22ˆvar( ) (1 ) y

y

st N f

n

ˆ( )yt N y 2ˆvar( ) var( )yt N yVarianza della stima del totale:

Page 38: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

38/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento stratificato

L’obiettivo è estrarre un campione più efficiente più efficiente rispetto al CCS:

stime più precise con la stessa numerosità campionaria

Esempio: Popolazione di N = 12 imprese

Media ROI popolazione: 3.75

Campioni CS: (4; 6; 9; 10) media ROI: (3+2+3+2)/4 = 2.5 (2; 3; 7; 12) media ROI: (4+6+4+6)/4 = 5

Risultato: stime poco precise e a forte variabilità

N. imp.

1 2 3 4 5 6 7 8 9 10

11

12

ROI 3 4 6 3 2 2 4 6 3 2 4 6

Page 39: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

39/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento stratificato

Disponibilità informazione aggiuntiva: settore di attività

Riorganizzazione informazioni: Popolazione: Campione:

N. imp.

1 2 3 4 5 6 7 8 9 10

11

12

ROI 3 4 6 3 2 2 4 6 3 2 4 6

Settore

A C M A T T C M A T C M

Settore

N. imp.

ROI

A 3 3; 3; 3

T 3 2; 2; 2

M 3 6; 6; 6

C 3 4; 4; 4

N=12 Media 3.75

Settore

n. imp.

ROI

A 1 3

T 1 2

M 1 6

C 1 4

n=4 Media3.75

Page 40: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

40/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento stratificato

a. La popolazione obiettivo è classificata in sottopopolazioni - esaustive e mutuamente esclusive - dette stratistrati

b. Gli strati devono essere possibilmente omogenei al loro interno ed eterogenei tra di loro

c. Da ogni strato si estrae un campione casuale semplice

d. Infine l’aggregazione di tali campioni produce il campione stratificato

Variabili di stratificazione: - disponibili per ogni unità della popolazione - correlate con le principali variabili di interesse (affinché sia realizzata la condizione di cui al punto b, da cui dipende l’obiettivo del CST)

Page 41: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

41/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La tecnica di estrazione del CST

Schema di campionamento stratificato:

In blu le unità campionate in ciascuno dei tre strati

Page 42: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

42/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Campionamento stratificato

Schema di popolazione di dimensione N ripartita in H strati

Strato Unità Dimens. Media Varianza

1

.

h

.

H

Y11 … Y1i … Y1N1

Yh1 … Yhi … YhNh

YH1 … YHi … YHNH

N1

Nh

NH

S12

Sh2

SH2

1

1 hN

h hiih

Y YN

2 2

1

1( )

hN

h hi hih

S Y YN

1

H

hh

N N

Parametri di strato:

1Y

hY

HY

Page 43: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

43/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Campionamento stratificato

Schema di campione di dimensione n estratto dagli H strati

Strato Unità Dimens. Media Varianza

1

.

h

.

H

y11 … y1j … y1n1

yh1 … yhj … yhnh

yH1 … yHj … yHnH

n1

nh

nH

s12

sh2

sH2

1

1 hn

h hjjh

y yn

2 2

1

1( )

1

hn

h hj hjh

s y yn

1

H

hh

n n

Media e varianza campionaria di strato:

1y

hy

Hy

Page 44: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

44/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stime con CST

In caso di CCS negli strati, la probabilità di inclusione

per l’unità i dello strato h è:

Lo stimatore della mediamedia:

hhj h

h

nf

N

hh

NW

N

1 1 1 1 1 1 1

1 1 1ˆh h hn n nH H H H

hj h hST hj hj h h ST

h j h j h j hhj h h

y N NY y y W y y

N N n N n

: peso strato h nella popolazione

Lo stimatore del totaletotale:

,1

H

Y ST ST h hh

t N y N y

Page 45: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

45/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Esempio stima con CST

Popolazione: Campione:

Settore

N. imp.

ROI

A 2 3; 3

T 3 2; 2; 2

M 2 6; 6

C 3 4; 4; 4

N = 10

Media 3.6

Settore

n. imp Pr.incl.

ROI

A 1 1/2 3

T 1 1/3 2

M 1 1/2 6

C 1 1/3 4

n = 4 Media 3.6

1

0.2 3 0.3 2 0.2 6 0.3 4 3.6H

ST h hh

y W y

1 1

1 1ˆn n

jj j

j jj

yY w y

N N

1

(2 3 3 2 2 6 3 4) 3.610

Page 46: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

46/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le stime con il CST

Varianza della media campionaria:Varianza della media campionaria:

Varianza del totale:Varianza del totale:

2

2 2

1 1

var( ) var( ) 1H H

hST h h h h

h h h

sy W y W f

n

2

2 2,

1

ˆvar( ) var( ) 1H

hyST ST h h

h h

st N y N f

n

1

H

ST h hh

y W y

,Y ST STt N y

Page 47: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

47/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le stime con il CST

Intervalli di confidenzaIntervalli di confidenza

media:media:

totale:totale:

2[ var( )]ST STy z y

, 2 ,ˆ ˆ[ var( )]y ST y STt z t

Page 48: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

48/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’allocazione della numerosità campionaria tra gli stratiAllocazioneAllocazione proporzionale:proporzionale: La numerosità campionaria n viene ripartita tra gli strati in proporzione al peso di ogni strato nella popolazione:

Pesi di strato nel campione = pesi di strato nella popolazione:

h hn n W

( = 1,..., )hh

h

n nf f h H

N N

;h hn N

n N

Frazione di campionamento uguale in ogni strato (pari alla frazione di campionamento globale f)

Page 49: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

49/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Campionamento stratificato -Schema con allocazione proporzionale

Dato N=50 e fissata la dimensione campionaria n=10, si determina la frazione di campionamento f = 1/5

Nella popolazione sono stati individuati 3 strati: N1=10; N2=25; N3=15

Applicando f = 1/5 ad ogni strato si ottengono le numerosità campionarie di strato:

1 1 2 2 3 3

1 1 110 2; 25 5; 15 3.

5 5 5n f N n f N n f N

h=1

h=2 h=3

Page 50: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

50/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Stima CST con allocazione proporzionale

Media campionaria:Media campionaria:

,1 1 1 1

1 1hnH H nh

ST PR h h hj jh h j jh

ny W y y y

n n n

22 2

, 21 1

(1 )var( ) (1 )

H Hh

ST PR h h hh hh

s fy W f n s

n n

(campione autoponderante)

Varianza della media campionaria:Varianza della media campionaria:

Page 51: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

51/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’allocazione non proporzionale

Applicazione di frazioni di campionamento differenti nei diversi strati.

Preferibile in caso di maggiore variabilità del fenomeno oggetto di studio in alcuni strati rispetto ad altri

Esempio:

Strati N. impr. ROI

1 5 5.5; 5.7; 6; 6.3; 6.5

2 5 2; 3; 4; 5; 6

Al fine di produrre stime più efficienti, negli strati a maggiore variabilità si applica intenzionalmente una frazione di campionamento maggiore

Page 52: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

52/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’allocazione non proporzionale

AllocazioneAllocazione ottimale di Neyman:ottimale di Neyman:la numerosità campionaria di strato è direttamente proporzionale, oltre che al peso di strato Wh, alla variabilità di strato espressa da Sh:

1

h hh H

h hh

W Sn n

W S

Esempio: Popolazione N = 10; Campione n = 5Strati N. impr. ROI Sh Wh Sh nh

ottimale

1 5 5.5; 5.7; 6; 6.3; 6.5 0.369 0.1845 1

2 5 2; 3; 4; 5; 6 1.414 0.7070 4

Page 53: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

53/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Pro e contro del CST

ProPro: Guadagno in efficienza rispetto al CCS

Possibilità di stimare i parametri in sottopopolazioni di particolare interesse per gli scopi della ricerca

Riduzione della probabilità di estrazione di campioni poco rappresentativi della popolazione obiettivo

ControContro: Se le variabili ausiliarie non sono di buona qualità (sufficientemente correlate con il fenomeno oggetto di studio) ne può derivare una perdita di efficienza

Page 54: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

54/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il Deff

Sulla base della variabilità delle stime è possibile calcolare una misura del guadagno in efficienzamisura del guadagno in efficienza derivante da un disegno di campionamento alternativo al CCS

La misura è denominata effetto di disegno effetto di disegno o DeffDeff

In generale, il Deff è definito come segue (dove ALT sta per disegno di campionamento alternativo al CCS):

( )( )

ALTALT

Var yDeff

Var y

< 1 guadagno in efficienza

> 1 perdita in efficienza

Page 55: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

55/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il Deff

Nel caso di campionamento stratificato in genere si ha:

var( )1

var( )ST

ST

yDeff

y

Più specificamente, in genere si verifica:

, ,var( ) var( ) var( )ST OT ST PRy y y

Page 56: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

56/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento a grappoli

Una popolazione oggetto di indagine può essere talvolta considerata come costituita da sottoinsiemi “naturali” di unità elementari denominati grappoligrappoli

Esempi: - la popolazione delle persone residenti in una città è costituita dalle persone appartenenti alle famiglie residenti;

- gli studenti di una scuola sono costituiti dagli appartenenti alle sue diverse classi

- gli operai dell’industria sono costituiti dagli operai dipendenti dalle diverse imprese

Page 57: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

57/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento a grappoli

Lo schema di campionamento a grappoli prevede: a. l’estrazione casuale di alcuni grappoli (es: famiglie)b. l’analisi completa di tutte le unità in essi contenute

ObiettivoObiettivo diverso da quello della stratificazione: convenienza in termini di costi e di tempo, facilitare il processo di raccolta delle informazioni

Prezzo da pagare: minore efficienzai grappoli tendono ad essere omogenei al loro interno --> duplicazione inutile di informazioni

Page 58: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

58/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La tecnica di estrazione del CGRA - illustrazione

La popolazione di 50 unità è suddivisa in 7 grappoli Vengono estratti casualmente 3 grappoli Per ognuno di essi vengono esaminate tutte le unità Il campione risultante si compone di 20 unità

Page 59: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

59/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La stima della media con il CGRA

1

A

N B

1

a

n B

Grappoli N. unità per grappolo

Unità Totale di grappolo

1

α

A

B1

BA

Y11 … Y1β …Y1B1

Yα1 … Yαβ …YαBα

YA1 … YAβ …YABA

tY1

tYα

tYA

1

A

Y Yt t

1

1 A

YY tN

Campione di a grappoli; probabilità di inclusione: a/AStimatore fondamentale della media:

GRA1 1

1 1 1 1( )

a ay

y y

ty t t

N a A N A a N A

Num. campionaria:

1

B

Yt Y

Page 60: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

60/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La stima della media con il CGRA

GRA1

1 1( )

a

yy tN A a

N/A = n/a :

GRA1 1 1 1

1 1 1B Ba a

y y yn a a n

1

B

yt y

Media delle osservazioni campionarie

Dimensione media dei grappoli nella popolazione

=Dimensione media dei grappoli nel campione

Page 61: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

61/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La stima della varianza con il CGRA

Varianza della media: 2

2var( ) var( )GRA y

Ay t

N

2 2

1

1( )

1y

a

t y ys t ta

Dove: f = a/A: frazione di campionamento

22

1

11

n

y jj

s y yn

NB: (stima varianza del totale) corrisponde alla stima della varianza di Y nel CCS:

GRA

1y y

Ay t t

N A N

NB: var( ) corrisponde alla stima della varianza di nel CCS:

y

22

2var( ) (1 ) yt

GRA

sAy f

N a yt

2

var( ) (1 ) ysy f

n

Stimatore della media:

2

yts

(f = n/N)

Page 62: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

62/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Pro e contro del CGRA

ProPro: Effettuare la rilevazione solo su alcuni grappoli è molto meno dispendioso rispetto al CCS. Soprattutto se: a) si rende necessario un contatto diretto; b) le unità sono caratterizzate da dispersione sul territorio Particolarmente vantaggioso quando per le unità appartenenti ai grappoli non si dispone di una lista

ControContro: E’ in genere meno efficiente: i raggruppamenti naturali di unità tendono ad essere omogenei al loro interno ed eterogenei tra loro (ma la perdita di efficienza si può eventualmente compensare aumentando la dimensione del campione)

Page 63: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

63/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Campionamento a due stadi

Nella popolazione vengono individuati:- raggruppamenti di unità (grappoli) denominati unità di primo stadiounità di primo stadio (es: comuni)- unità elementari appartenenti alle unità di primo stadio denominate unità di secondo stadiounità di secondo stadio (es: famiglie, persone )

Lo schema di campionamento a due stadi consiste:- nel selezionare casualmente un campione di unità di primo stadio- nel selezionare casualmente un campione di unità di secondo stadio da quelle di primo stadio

Può essere visto come un campionamento a grappoli in cui si osserva solo una parte delle unità appartenenti ai grappoli campione (campionamento a grappoli a due stadi)

Page 64: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

64/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Campionamento a due stadi

Esempio:Esempio:Indagine Istat sui consumi delle famiglie italiane.

Invece di estrarre direttamente un CCS di famiglie dal complessodelle famiglie italiane (come nello schema di campionamento a grappoli), si procede in due fasi:1) si estrae un certo numero di comuni campione (476) dall’insieme dei comuni italiani (dopo stratificazione degli stessi: 230

strati)2) da ognuno dei comuni campione si estraggono alcune famiglie (in complesso 28.000)

Vantaggio organizzativo e di costi analogo a quello che si ottiene con il campionamento a grappoli: concentrazione della rilevazione in alcuni comuni, invece che dispersa in tutto il territorio

Page 65: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

65/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La tecnica di estrazione del CSTA -illustrazione

1° stadio sono estratte casualmente 3 UPS 2° stadio da ogni UPS selezionata sono estratte casualmente delle USS (f = 1/2)

Page 66: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

66/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Pro e contro del CSTA

ProPro: nelle indagini con rilevazione diretta tramite intervistatori consente di ridurre tempi e costi, poiché riduce notevolmente la dispersione territoriale della rilevazione

ControContro: di norma si verifica che le UPS sono omogenee al loro interno ed eterogenee tra loro. Di conseguenza il CSTA risulta meno efficiente del CCS

Stessi pro e contro del campionamento a grappoli

Page 67: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

67/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Tecniche di campionamento non probabilisticoNon si applicano criteri di casualità nella selezione delle unità campionarieLa selezione delle unità è lasciata all’arbitrio di chi deve raccogliere i datiTrovano impiego nelle ricerche di mercato e nei sondaggi di opinione (in particolare nei casi in cui non si dispone di una lista)

Esempio:Esempio:

Indagine per rilevare le opinioni dei clienti di un supermercato riguardo le promozioni effettuate su alcuni prodotti tramite interviste fatte all’uscita a clienti scelti liberamente dai rilevatori

Page 68: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

68/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Tecniche di campionamento non probabilisticoVantaggiVantaggi: la semplicità organizzativa i bassi costi di realizzazione la velocità di esecuzione

Limiti:Limiti:

- l’arbitrio di chi raccoglie i dati può comportare una distorsione da selezione del campione

- non è possibile effettuare una stima della precisione dei risultati

Page 69: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

69/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento per quote

Il metodo si basa sulla riproduzione nella composizione del campione di alcune caratteristiche distributive note della popolazione, nonostante che:

• non si dispone di una lista di campionamento

• non si applicano criteri di casualità nella selezione delle unità campionarie

Esempio:Esempio: Indagine per rilevare le opinioni dei clienti di un supermercato riguardo le promozioni effettuate su alcuni prodotti tramite interviste fatte all’uscita a clienti scelti dai rilevatori, ma in modo che il campione rispecchi la composizione dell’insieme dei clienti secondo il genere e l’età

Page 70: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

70/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Il campionamento per quote

Fasi del metodo:Fasi del metodo:

1. Si individuano le caratteristiche rilevanti della popolazione da riprodurre nel campione (esempio: genere e/o età degli individui)

2. Attraverso idonee fonti statistiche si calcola il peso percentuale dei corrispondenti gruppi sul totale della popolazione

3. Stabilita la numerosità campionaria, essa è ripartita tra i gruppi individuati in modo che il campione rispecchi la composizione della popolazione

4. Ai rilevatori sono assegnate le quote, ovvero il numero di interviste da effettuare liberamente in ognuno dei gruppi

Page 71: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

71/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Profilo dell’errore

Errore statistico:Errore statistico: differenza tra il valore vero - relativo ad una certa caratteristica della popolazione - ed il valore osservato sui dati campionari

Scomposizione dell’errore statistico in:

1. errore campionario:1. errore campionario: derivante dal fatto che si esamina solo un campione della popolazione, anziché la sua totalità

2. errore non campionario:2. errore non campionario: derivante da imprecisioni presenti nelle diverse fasi dell’indagine Classificabile in diversi tipi di errore a seconda delle fonti

Page 72: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

72/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’errore campionario

La stima dell’errore campionario definisce l’intervallointervallo didi confidenza. confidenza. Nel cNel campionamento casuale semplice:

ErroreErrore campionariocampionario:

Errore standardErrore standard:

2

2 2ˆ(1 ) ( )ys

e z f z ES yn

2 2

2 2[ (1 ) ; (1 ) ]y ys sy z f y z f

n n

2

ˆ( ) var( ) (1 ) ysES y y f

n

Page 73: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

73/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’errore campionario

Sulla base della sua espressione si deduce che l’ errore l’ errore campionario è tanto più grandecampionario è tanto più grande:

quanto maggiore è il livello di fiduciamaggiore è il livello di fiducia che si vuole avere nella stima i valori dei coefficienti zα/2 crescono al crescere del livello di fiducia

quanto più elevata è la variabilità della caratteristicapiù elevata è la variabilità della caratteristica studiata nella popolazione tale variabilità si riflette in quella osservata sul campione (e quindi sulla varianza e sull’errore standard della media campionaria)

quanto minore è la dimensione del campioneminore è la dimensione del campione legata alla varianza della media campionaria secondo una proporzione inversa

Page 74: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

74/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’errore campionario - Esempio

- Popolazione di 10.000 imprese (N = 10000); - Estratte 400 unità (n = 400) mediante CCS- Stima della media del fatturato: 495 (migliaia di euro);- Stima della varianza: 2500 (migliaia di euro).

La stima dell’errore campionario, in corrispondenza di un livello di fiducia del 95%:

Conclusione: nella stima della media del fatturato delle aziende - per un livello di fiducia del 95% - si può commettere un errore pari a 4,8 migliaia di euro, per difetto o per eccesso

Ovvero, al 95% di probabilità, il valore vero incognito si trova nell’intervallo di confidenza [495 - 4,8; 495 + 4,8]

400 25001,96 (1 ) 4,8

10000 400e

Page 75: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

75/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

L’errore campionario - Esempio

Per una diversa numerosità campionaria: n = 300(e a parità di livello di fiducia e stima della varianza nella popolazione)

Errore campionario:

Intervallo di confidenza: [495 – 5,6; 495 + 5,6]

300 25001,96 (1 ) 5,6

10000 300e

Page 76: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

76/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria

Stabilita prima di estrarre il campione in base all’errore in base all’errore campionario massimocampionario massimo (e) che si è disposti ad accettare

Come si fissa l’errore massimo e ?

A partire dalla varianza teorica della media campionariavarianza teorica della media campionaria nel CCS:

2

Var( )1

YN n Sy

N n

Page 77: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

77/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria

Da cui deriva il valore teorico dell’errore standard:

e il valore teorico dell’errore campionario:

da cui si ottiene n in funzione di e (e di altri parametri):

2

1YSN n

ESN n

2 222 2

22 1

Y

Y

S zn

S zNe

N N

2

2 1YSN n

e zN n

Page 78: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

78/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria

Poiché la varianza della caratteristica nella popolazione S2

Y è ignota, in genere si ricorre a:

una misura della variabilità derivante da eventuali indagini precedenti

una stima proveniente da un’indagine pilota

Page 79: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

79/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria

Caso di stima di una frequenza stima di una frequenza

Variabile dicotomica: Y = 1 (presenza attributo); Y = 0 (assenza)

22

222

0.25

0.251

zn

zNe

N N

La numerosità campionaria può essere determinata assumendo il valore massimo della varianza, che si ha per P=0.5, e sostituendolo nella formula generale, ottenendo:

La varianza di Y nella popolazione:

S2Y = (1 – P)2 P + (0 – P)2 (1 – P) = P (1 - P)

Page 80: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

80/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria - EsempioPopolazione di N = 10000 imprese Calcolo della numerosità campionaria per la stima della proporzione di imprese che hanno fatto investimenti nel triennio precedente, con - un errore massimo del 3% in più o in meno (e = 0.03)

- un livello di fiducia del 95% (α = 0.05; zα/2 = 1.96)

2

22

0.25 1.96964

0.25 1.9699990.03

10000 10000

n

Per N = 100.000 ?

Per N = 1.000.000 ? n = 1066

n = 1056

Page 81: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

81/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Calcolo numerosità campionaria - Esempio

Per P = 0.2 ? (e N = 10000)

2

22

0.16 1.96640

0.16 1.9699990.03

10000 10000

n

2

(1 ) 0.2(1 0.2)(1 ) =1.96 (1 0.0964) 0.024

1 963p p

e z fn

Bastava un campione più piccolo:

Oppure (per n = 964) avremo un errore campionario minore:

e quindi un intervallo di confidenza meno ampio

Page 82: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

82/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Errore non campionario

• Casuale

• Sistematico

è attribuibile unicamente al caso e i suoi effetti tendono ad annullarsi all’aumentare della numerosità campionaria 1. di copertura

2. di non risposta

3. di misura

4. di codifica e archiviazione dei dati

a. totale

b. parziale

imputabile a insufficienze metodologiche o

organizzative che possono originare in ogni fase di una

indagine

Page 83: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

83/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Errore di copertura

Legato al grado di corrispondenza tra le unità elencate nella lista di campionamento e quelle effettive della popolazione

Due tipi di errore:1. SovracoperturaSovracopertura - la lista include unità non appartenenti alla popolazione (es: imprese non più attive presenti nell’archivio delle imprese)

2. SottocoperturaSottocopertura - la lista esclude unità appartenenti alla popolazione (es. elenchi telefonici)

• si diagnostica con un quesito iniziale per verificare l’appartenenza• si risolve eliminando le unità e con un campione di riserva per la loro sostituzione

• si diagnostica analizzando le caratteristiche della lista • si risolve con riponderazione o post-stratificazione (più avanti)

Page 84: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

84/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Errore di non risposta

Deriva dalla mancata osservazione sulla unità di rilevazione di alcune o di tutte le caratteristiche oggetto di studio Si distingue in:

a.a. non risposta totalenon risposta totale - se riguarda tutte le caratteristiche

b.b. non risposta parzialenon risposta parziale - se riguarda un numero contenuto di caratteristiche oggetto di indagine

• si previene con: motivazione unità selezionate; semplicità del questionario; solleciti; incentivi• si risolve con: sostituzione unità; sovracampionamento; riponderazione, post-stratificazione

• si previene con: chiarezza domande; attenzione alla riservatezza • si risolve con: imputazione dati mancanti (Cap. 3)

Page 85: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

85/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Errori di non risposta o di copertura

EsempioEsempio (mancate risposte): M F TOTPopolazione: 8000 12000 20000 (40%) (60%) (100%)

Campione: 160 240 400 (40%) (60%) (100%)

Rispondenti 90 210 300 (30%) (70%) (100%)N. R. 70 30 100Tassi di risposta: 56.2% 87.5% 75%

Effetto sul campione delle non risposte totali o della sotto-copertura: alcune componenti della popolazione sottorappresentate altre sovrarappresentate

composizione del campione diversa da quella della popolazione

Page 86: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

86/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Errori di non risposta o di copertura

EsempioEsempio (sottocopertura): M F TOTPopolazione: 8000 12000 20000 (40%) (60%) (100%)Campione selezionato: 120 280 400 (30%) (70%) (100%)Rispondenti: 90 210 300 (30%) (70%) (100%)Tassi di risposta: 75% 75% 75%

Page 87: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

87/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Riponderazione

Nota la composizione della popolazione secondo una o più caratteristiche, la riponderazioneriponderazione consiste: - nell’aumentare il peso delle unità campionarie sotto- rappresentate - e nel diminuire il peso di quelle sovra-rappresentate (fino a riportare i pesi a quelli noti nella popolazione)

Informazioni necessarie:Informazioni necessarie:Composizione della popolazione (oltre che del campione) secondo le k modalità della caratteristica (o delle caratteristiche) utilizzata/e per la riponderazioneEsempio: % di M e di F nella popolazione e nel campioneCaso di studio: % di imprese di ogni settore e classe dimensionale nella popolazione e nel campione

Page 88: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

88/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Riponderazione

Composizione della popolazione e del campione secondo le k modalità della caratteristica: Popolazione: Campione:

Pesi di riponderazione: (per ogni unità j appartenente al sottocampione i):

iPi

NP

N ( 1,..., )i ki

Ci

nP

n

Pi iij

Ci i

P N Nw

P n n ( 1,..., )i k

unità sottorappresentate: peso aumentato

1ijw

1ijw unità sovrarappresentate: peso diminuito

Somma dei pesi:

1 1 1

( )ink k

iij i

i j i i

Nnw n

N n

1 1

ink

iji j

w n

Page 89: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

89/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Riponderazione

Stima della mediaStima della media:

1 1 1 1

1 1

=

i i

i

n nk k

ij ij ij iji j i j

nk

iji j

w y w y

yn

w

EsempioEsempio (mancate risposte): M F TOTPopolazione: 8000 12000 20000 (40%) (60%) (100%)Campione: 160 240 400 (40%) (60%) (100%)Rispondenti 90 210 300 (30%) (70%) (100%)Pesi riponderazione: 1.333 0.857

Page 90: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

90/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Riponderazione -Caso di studio

Popolazione Campione

Numero imprese settore k, dim. s Pfirmsks Sfirmsks

Numero imprese totali Pfirms Sfirms

( )ks

ks jks

Pfirms Pfirmsrw

Sfirms Sfirms

Pesi relativi (per ogni impresa j appartenente al sottocampione dello strato ks):

Composizioni della popolazione e del campione in base alla loro articolazione in strati:

Pesi assoluti:

( )ks

ks jks

Pfirms Pfirms Pfirmsaw

Sfirms Sfirms Sfirms ( )

ksks j

ks

Pfirmsaw

Sfirms

( )( )ks jrw Sfirms

( )( )ks jaw Pfirms

Page 91: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

91/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Post-stratificazione

Primo passo:classificazione del campione secondo le k modalità di una caratteristica classificazione a posteriori del campione in k strati (post-stratificazione)Secondo passo:calcolo delle medie nei k strati costruiti a posteriori e applicazione della formula del campionamento stratificato per la stima della media nella popolazione

1

ki

ii

Ny y

N

Page 92: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

92/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Post-stratificazione - Esempio

EsempioEsempio (mancate risposte): M F TOTPopolazione 8000 12000 20000 (40%) (60%) (100%)Rispondenti 90 210 300 (30%) (70%) (100%)N. R. 70 30 100

Post-stratificazione:

Pesi (Ni / N) 0.4 0.6

Medie 30 20

1

0.4 30 0.6 20 24k

ii

i

Ny y

N

Senza tenere conto della diversa incidenza delle mancate risposte ?

1

0.3 30 0.7 20 23k

ii

i

ny y

n

Page 93: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

93/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Post-stratificazione

1 1 1 1

1

1

= =

i in nk ki

ij ij ij ki j i ji i

ii

Nw y n y

N n Ny y

n n N

Post-stratificazione = Riponderazione

Page 94: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

94/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le tipologie di quesiti

Classificati in base alle modalità di rispostamodalità di risposta- domande a risposta apertadomande a risposta aperta (o domande aperte): - non sono fornite le categorie di risposta; - l’intervistato deve fornire un valore numerico esatto oppure rispondere con parole proprie

domande a risposta chiusadomande a risposta chiusa (o domande chiuse): - sono elencate le possibili categorie di risposta tra cui il rispondente deve indicarne una o più di una

Page 95: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

95/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Domande aperte vs domande chiuse

Pro aperte:Pro aperte: consentono l’espressione libera del rispondente consentono l’acquisizione di dati numerici esatti

nelle fasi di test del questionario consentono di individuare le categorie di risposta per le domande chiuse della versione finale

Contro aperte:Contro aperte: interpretazione soggettiva della domanda

carico di lavoro più elevato con maggiori probabilità di errore e/o abbandono

Page 96: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

96/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le scale di valutazione

Utilizzate nella rilevazione di opinioni o atteggiamenti

Esempio: accordo/disaccordo molto, abbastanza, … Oppure: soddisfazione/insoddisfazione Trovano impiego nei sondaggi di opinione e nelle ricerche di mercato

Page 97: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

97/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Le scale di valutazione

Scala continua: opzioni di risposta un insieme continuo di valori

Scala ancorata: possibilità di selezionare valori interi all’interno di un certo intervallo 1 2 3 4 5Totalmente Abbastanza Né d’accordo Abbastanza Totalmente in disaccordo in disaccordo né in disaccordo d’accordo d’accordo

Page 98: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

98/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

Classificazione dei caratteri statisticiPrincipale distinzione Caratteri quantitativi:Caratteri quantitativi: che derivano da misurazioni o operazioni di conteggio (es: reddito, n. di addetti) Caratteri qualitativi:Caratteri qualitativi: in cui è assente il concetto di quantità (es: condizione occupazionale)

Classificazione più fine, fondata sulla scala di scala di misurazionemisurazione:da essa dipendono le operazioni che si possono compiere e i confronti ammissibili tra unità statistiche

Page 99: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

99/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La scala di misurazione

Caratteri qualitativiCaratteri qualitativi

Scala nominale:Scala nominale: le modalità non possono essere messe in ordine secondo una sequenza logica (es: nazionalità; forma giuridica)

Confronto ammissibile tra due unità statistiche: se sono uguali o diverse rispetto a quel carattere

Scala ordinale: Scala ordinale: le modalità possono essere messe in ordine secondo una sequenza logica (es: titolo di studio, aspettative produzione)

Confronto ammissibile tra due unità statistiche: se l’una ha modalità maggiore o minore dell’altra secondo quel carattere

Page 100: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

100/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La scala di misurazione

Caratteri quantitativiCaratteri quantitativi

Scala di intervalli:Scala di intervalli: le modalità non possiedono uno “zero assoluto” e quindi non possono essere misurate partendo da un’origine che indichi assenza della quantità

Esempio: temperatura; zero convenzionale, diverso a seconda della scala adottata

Confronto ammissibile: per differenza tra i valori assunti dal carattere sulle unità

Esempio: l’aumento di calore che si verifica tra 0° e 20° della scala Celsius è lo stesso che si verifica tra 20° e 40°. Ma non si può affermare che il caldo a 40° è doppio che a 20°

Page 101: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

101/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La scala di misurazione

Caratteri quantitativiCaratteri quantitativi

Scala di rapporti: Scala di rapporti: le modalità possono essere misurate partendo da un’origine che rappresenta l’assenza della quantità (Esempio: fatturato)

Confronto ammissibile: rapporto tra i valori assunti dal carattere in due diverse unità

(Esempio: se il rapporto è 2 il fatturato è doppio)

Page 102: 1/89 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill Le indagini campionarie  Le fasi di un’indagine campionaria  Il campionamento:

102/89Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill

La classificazione dei caratteri statistici

Esame del carattere statistico: le modalità sono ordinabili?

Esame del carattere statistico: si individua zero assoluto?

Scala nominale

Sì No

Scala ordinale

Scala di intervalli

Sì No

Scala di rapporti

Sì No

Esame del carattere statistico: si denota concetto di quantità?

Carattere quantitativo Carattere qualitativo