RILEVAZIONI CAMPIONARIE E TECNICHE DI ......a) Campionamento casuale semplice con ripetizione •...

Post on 18-Jan-2020

5 views 0 download

Transcript of RILEVAZIONI CAMPIONARIE E TECNICHE DI ......a) Campionamento casuale semplice con ripetizione •...

RILEVAZIONI CAMPIONARIE E

TECNICHE DI CAMPIONAMENTO

Prof.ssa Maria Carella

maria.carella1@uniba.it

Fase in cui si predispone il piano di rilevazione

Si procede alla:

1. DEFINIZIONE DELLE UNITÀ DI RILEVAZIONE

Collettivo statistico, unità e caratteri

2. SCELTA DELLE TECNICHE DI RILEVAZIONE DELLE UNITÀ STATISTICHE

– rilevazione totale o campionaria

FASE 1 PROGRAMMAZIONE

LE RILEVAZIONI

Rilevazione Totale:

la rilevazione delle informazioni è eseguita su tutte le unità che compongono la popolazione oggetto di studio

Rilevazioni Campionarie:

la rilevazione delle informazioni è eseguita solo su una parte delle unità che compongono la popolazione

LE RILEVAZIONI CAMPIONARIE

Rilevazioni campionarie

-Vantaggi rispetto alla rilevazioni totali:

riduzione costi,

riduzione dei tempi,

riduzione del carico organizzativo,

vantaggi di approfondimento e di accuratezza

-Svantaggi:

la base di campionamento non è sempre disponibile o facile da conoscere

LE RILEVAZIONI CAMPIONARIE • La rilevazione campionaria può essere

compiuta per scelta obbligata – Casi in cui la popolazione di riferimento è

parzialmente sconosciuta in termini di composizione o numerosità

• La rilevazione campionaria non sempre può

sostituire l’indagine completa – Es. caso delle rilevazioni riguardanti il

movimento di stato civile (nascite, decessi): occorre conoscere tutti i casi individuali

I termini tecnici Intendiamo per:

Popolazione (universo) l’insieme N di unità statistiche che costituiscono l’oggetto di studio

Insieme N= ampiezza della popolazione

Campione l’insieme delle n unità campionarie (casi) selezionate tra le N unità che compongono la popolazione

Insieme n= ampiezza del campione

Campionamento il procedimento attraverso il quale si si estraggono le n unità campionarie dalla popolazione

Valore esatto e stima Il campione essendo una porzione della popolazione deve essere considerato come un’approssimazione

dell’insieme.

CONSEGUENZA

La rilevazione campionaria fornisce solo la stima di un valore caratteristico che si vuole conoscere

La rilevazione totale ne fornisce, invece, il valore esatto

Metodi di campionamento • Campionamento Probabilistico: per il

quale la probabilità che ogni unità della popolazione ha di essere estratta è nota .

• Campionamento Non Probabilistico: per il quale la probabilità che ogni unità della popolazione ha di essere estratta non è nota

Esempio campione Se costruiamo un campione di studenti universitari estraendo a sorte un certo numero di studenti fra quelli presenti un qualsiasi giorno in università, non otteniamo un campione probabilistico per 3 motivi:

a) i non frequentanti hanno probabilità nulla di entrare;

b) le matricole, che frequentano di più, hanno maggiore probabilità di essere estratte rispetto agli studenti degli anni superiori;

c) questi ultimi hanno maggiore probabilità di essere estratti rispetto agli studenti fuori corso

Formazione dei campioni

1. SCELTA CASUALE (campionamento probabilistico)

le unità della popolazione avranno tutti la stessa probabilità di essere inclusi nel campione

N.B. scelta del campione avviene con metodo rigoroso

perché si assicura l’imparzialità dell’inclusione di ogni unità del collettivo nel campione

Formazione dei campioni

2. SCELTA RAGIONATA (c. non probabilistico)

le unità campionarie vengono individuate con procedimento razionale ma non del tutto casuale

– I campioni di questo tipo sono formati da elementi

tipici che si ritiene possano rappresentare bene le caratteristiche della popolazione

Campioni probabilistici

Campione casuale semplice

Campione sistematico

Campione stratificato

Campione a due o più stadi

Campione a grappoli

Campione per aree (o areale)

Campionamento casuale

Ciascuna unità della popolazione ha la stessa probabilità, nota e costante, di far parte del

campione.

CAMPIONE CASUALE SEMPLICE (BERNOULLIANO) CON RIPETIZIONE

CAMPIONE CASUALE SENZA RIPETIZIONE

a) Campionamento casuale semplice con ripetizione

• Per formare il campione basta numerare tutti gli N elementi dell’universo ed estrarre da un’urna n elementi con l’accortezza di rimettere di volta in volta il numero estratto nell’urna

Nel CAMPIONE CASUALE SEMPLICE (BERNOULLIANO) CON RIPETIZIONE

• La popolazione d’origine resta invariata in quanto la

scelta presuppone che ogni elemento estratto venga rimesso nell’urna in modo da mantenere costante e uguale a 1/N la probabilità di estrazione del n successivo

b) Campionamento casuale senza ripetizione

L’unità che entra a far parte del campione viene esclusa dalle successive estrazioni

quindi la probabilità di estrazione dei numeri successivi cambia perché cambia la composizione

dell’urna

Nel CAMPIONE SENZA RIPETIZIONE

La popolazione d’origine si riduce di un’unità per cui

la probabilità di scelta del 1° elemento, 2° elemento ecc. saranno: 1/N; 1/N-1; 1/N-2

Campionamento casuale in blocco

• Gli n elementi si estraggono in blocco dall’urna, cioè in un’unica volta – In questo caso non esiste l’ordine di

estrazione

Vantaggi e limiti Campionamento casuale

PREGI

Il campione è statisticamente rappresentativo

nessuna unità o gruppo di unità è favorito

presenta una notevole semplicità nel metodo

ha un basso costo operativo

DIFETTI

• è necessaria una lista completa delle unità della popolazione

• la selezione è completamente affidata al caso

La correttezza di un Campione casuale

È necessario conoscere la base (frame), cioè la documentazione (schedari, elenchi) delle unità statistiche che compongono la popolazione totale

Le basi devono essere precise, complete, riferite a dati recenti e senza duplicazioni (es. nel caso di indagini sulle famiglie la base può essere fornita dall’elenco delle famiglie iscritte nel registro della popolazione dei comuni)

La correttezza del campionamento dipende dalla

correttezza della lista di campionamento

Campionamento sistematico

Variante del campionamento casuale semplice da cui differisce solo per la tecnica di estrazione

Le unità campionarie non vengono più estratte con sorteggio ma selezionate sistematicamente

CAMPIONAMENTO SISTEMATICO

Ciascuna unità della popolazione è numerata da 1 a N: si sceglie un’unità ogni k = N/n cominciando con un numero estratto a caso tra 1 e K

la prima unità è scelta casualmente, le altre secondo il criterio prefissato che è definito passo di campionamento

Esempio Campionamento sistematico

• Da una popolazione di N=8235 unità si desidera estrarre un campione di n=500, si sceglierà una unità ogni 16 (K=8235/500=16,7) cominciando con un numero estratto a caso tra 1 e 16. Se questo è 12, allora i soggetti scelti saranno il 12°, il 28°, il 44°, 60°, 76 ecc.

Campionamento stratificato

Quando la numerosità della popolazione è molto elevata, per cui è difficile

numerare tutti gli elementi e si corre il rischio di non inserire nel campione

elementi d’interesse, si ricorre

Campione stratificato

Campionamento stratificato Il metodo si articola in 3 fasi : 1. si procede alla suddivisione delle unità della

popolazione in gruppi (denominati STRATI);

• il raggruppamento deve essere fatto in modo che ciascun elemento compaia in un solo strato;

• gli elementi appartenenti allo stesso strato devono essere simili tra loro (strati/classi omogenee);

• per raggruppare la popolazione in strati omogenei si utilizza come criterio di stratificazione una variabile correlata al fenomeno studiato

Campionamento stratificato 2. Si estrae un campione da ogni strato con la procedura

del campionamento casuale semplice

3. Si uniscono i campioni provenienti dai singoli strati per ottenere il campione complessivo

Due tipologie di campioni stratificati

proporzionale Non proporzionale o uniforme

Esempio Campionamento stratificato

Se si intende stimare il reddito di una popolazione tramite un campione di individui, i soggetti della popolazione di riferimento possono essere suddivisi in strati sulla base della variabile occupazione. Supponendo di costruire 4 strati : operai, impiegati, autonomi, liberi professionisti, -da ognuno di questi strati estraiamo un campione -quindi uniamo i 4 campioni parziali in un campione complessivo

Campioni stratificati a) Campione stratificato proporzionale riproduce la stessa composizione degli strati della popolazione

-Supposto che N1, N2,…. Ns siano il numero delle unità contenute in ciascuno degli s strati -supposto che f=n/N sia la frazione di campionamento (cioè la frazione di popolazione che deve far parte del campione) -le unità da campionare sono date da n1=f N1, n2=f N2……., ns=f Ns,

Esempi Campioni stratificati

Campione stratificato proporzionale Se gli operai, gli impiegati, gli autonomi, i liberi professionisti sono rispettivamente il 40%, il 40%, il 15% e il 5% della popolazione dobbiamo riprodurre nel campione la stesse proporzioni. Quindi se costruiamo un campione di 1000 casi formato da 400 operai, 400 impiegati, 150 lavoratori autonomi e 50 liberi professionisti avremo un campione proporzionale

Campioni stratificati b) Campione stratificato uniforme: tutti gli strati sono ugualmente rappresentati -Con questo procedimento, se s è il numero degli strati, ogni strato avrà ampiezza pari a n/s -Questo metodo si usa ogni qualvolta la popolazione di uno strato è molto piccola rispetto alla popolazione degli altri strati (non si vuole togliere significatività agli strati esigui) non proporzionale non riproduce la stessa composizione degli strati della popolazione

Esempi Campioni stratificati

Vogliamo sapere se in una città di 400 mila abitanti (N) le funzioni religiose sono frequentate più dai cattolici o dai protestanti. Dati: N1,=396.000 cattolici ; N2=4000 protestanti n=100 -se usassimo il campionamento proporzionale dovremmo intervistare n1=f N1 =100/400000*396000=99 cattolici (n/N* N1) n2=f N2 =100/400000*4000=1 protestante (n/N* N2) -se usiamo il campionamento uniforme n/s= 100/2= 50 cattolici e 50 protestanti Dove f=n/N è la frazione di campionamento

Vantaggi e limiti Campionamento stratificato

PREGI

• raggruppando la popolazione in strati omogenei si migliora la precisione con cui si stima la grandezza che si vuol rilevare

DIFETTI

• necessita di una lista completa delle unità della popolazione

• richiede un considerevole lavoro affinché gli strati siano al loro interno il più possibile omogenei

Campionamento a stadi

Nel caso in cui la popolazione dovesse risultare molto elevata, per semplificare la procedura di estrazione, si

usano i campioni a più stadi.

La popolazione viene suddivisa in livelli

gerarchicamente ordinati Si ricorre ad uno schema che comporta

l’individuazione di unità primarie, secondarie e di ordine superiore di rilevazione

Esempio Campione a stadi

Esempio 1: dovendo costruire un campione nazionale di maestri elementari, il campionamento si può effettuare in 2 stadi: - Al 1° stadio si estrae un campione di unità primarie

rappresentate dai circoli didattici - Al 2° stadio si estrae un campione di unità secondarie, ovvero

i maestri, da ognuna delle unità primarie selezionate alla prima estrazione

Esempio 2: Se volessimo indagare su un campione di famiglie italiane sarebbe conveniente estrarre: -prima un campione di province (1° stadio- unità primarie), -poi nell’ambito di ciascuna provincia selezionata campioneremo un numero di comuni (2° stadio- unità secondarie) -infine nell’ambito di ciascun comune selezionato sceglieremo un numero di famiglie (3° stadio- unità finali)

Campionamento a grappoli • Caso particolare/variante di campionamento a stadi: • Tipo di campionamento che si realizza quando si

estraggono contemporaneamente non gli elementi di una popolazione ma l’insieme di unità spazialmente contigue (insieme è detto grappolo: classi scolastiche, reparti di lavoro, famiglie)

• Esempio: supponiamo di dividere la città in 100

quartieri, se, invece, di scegliere a caso le unità statistiche da ogni quartiere, scegliamo un gruppo di 10 quartieri per poi campionare tutti gli abitanti di questi quartieri, si ha un campionamento a grappolo.

Il campione a grappolo è costituito da tutte le unità

appartenenti ai grappoli estratti

Campionamento per aree Caso particolare/variante di campione a stadi:

• Il campione di area è l’insieme delle unità territoriali scelto in maniera casuale

• Si usa per rilevare le unità statistiche in grandi

città: utilizzando mappe molto precise, si divide la città in quartieri, in isolati e nell’ambito di questi si scelgono a caso le famiglie/persone da intervistare

Campioni non probabilistici

Campione a scelta ragionata

Campione accidentale

Campione per quote

Campione a valanga

1. Campionamento a scelta ragionata

Le unità campionarie si ottengono non in base a criteri di casualità, ma su una selezione soggettivamente impostata.

La scelta del campione si fonda sul giudizio del ricercatore il quale conosce il fenomeno e con criteri, più o meno personali, cerca di estrarre un campione della popolazione

2.Campionamento accidentale

Il ricercatore sceglie le prime persone che capitano come soggetti su cui indagare.

In questo caso è sufficiente l’adesione volontaria dei rispondenti

• Es. campioni formati dai lettori di un giornale che rispondono spontaneamente a determinate indagini

Vantaggi: risparmio di tempo e denaro

Limiti: si perde l’accuratezza del campionamento

3. Campionamento per quote Procedimento:

1) si suddivide la popolazione oggetto di studio in raggruppamenti (strati) secondo alcune variabili (sesso, età ,titolo di studio..);

2) ciascuno strato deve essere rappresentato nel campione da una quota proporzionale alla sua consistenza all’interno della popolazione complessiva (si calcola il peso percentuale di ciascuno strato sull’intera popolazione);

3) stabilite le quote (cioè il numero di interviste da effettuare), il rilevatore è libero di scegliere a sua discrezione i soggetti da intervistare purché si attenga alle quote

Aspetti Campionamento per quote

Il Campionamento per quote è un campionamento stratificato: l’elemento di diversità sta nel fatto che la scelta delle unità da intervistare è rimessa al rilevatore, fermo restando il vincolo delle quote

Disegno di campionamento molto diffuso specie nelle ricerche di mercato e nei sondaggi di opinione

Vantaggi: risparmio di tempo e denaro

Limiti: la selezione è distorta a favore degli individui di più facile reperimento per gli intervistatori