Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza...

56
Strategie di campionamento Prof. Sergio Mauceri Metodologia della ricerca sociale 2018-2019

Transcript of Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza...

Page 1: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Strategie di campionamento

Prof. Sergio Mauceri

Metodologia della ricerca sociale 2018-2019

Page 2: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Popolazione vs. Campione • Per popolazione intendiamo un insieme N (ampiezza della

popolazione) di unità (dette anche unità statistiche o unità di analisi) che costituiscono l’oggetto del nostro studio;

• Può essere costituita da individui o da unità aggregate (comuni, abitazioni, aziende, ecc.).

• Per campione si intende un insieme più ridotto di casi selezionato dalla popolazione, generalmente con lo scopo di ottenere risultati statistici che siano generalizzabili dal campione all’intera popolazione di indagine.

• Il campionamento è il procedimento mediante il quale, seguendo determinate regole, si estrae da un insieme di unità (popolazione) un numero ridotto di casi.

• Teoria dei campioni: branca della statistica che studia le formulazioni matematiche alla base dell’inferenza statistica.

Page 3: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Censimenti vs. rilevazioni campionarie

• Rilevazioni esaustive o totali: Analizzano un insieme di proprietà sull’intera popolazione

interessata allo studio. 9 Censimento ISTAT della popolazione (ogni 10 anni). Censimento dei ricoveri ospedalieri Censimento dei decessi Censimento delle nascite • Rilevazioni campionarie (parziali): Limitano l’analisi ad una sezione limitata della popolazione

statistica, selezionata mediante una specifica tecnica di campionamento

Se il campione è probabilistico mirano a generalizzare i risultati classificatori ottenuti sul campione a tutta la popolazione

Page 4: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Vantaggi delle rilevazioni campionarie

• Riduzione dei costi di rilevazione;

• Riduzione dei tempi di rilevazione e di elaborazione dei dati;

• Riduzione del carico organizzativo;

• Maggiore possibilità di approfondimento.

Page 5: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Tipi di campionamento

Probabilistico

Casuale semplice

Sistematico

Stratificato

A grappolo

Non probabilistico

A valanga o a palla di neve

A scelta ragionata

Tipologico-fattoriale per quote fisse

Accidentale o di convenienza

Page 6: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campione probabilistico vs. non probabilistico

• Un campione è probabilistico quando ogni unità è estratta con una probabilità nota, diversa da zero.

• Nel campione non probabilistico non è nota in partenza la probabilità che ogni unità della popolazione ha di essere estratta nel campione e per alcune unità essa può essere pari a zero.

Page 7: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campione casuale semplice

• Nel campione casuale semplice tutte le unità della popolazione hanno la stessa probabilità di essere incluse nel campione.

• Requisito: disponibilità di una lista di campionamento che includa tutte le unità della popolazione. Ad ogni unità viene associato convenzionalmente un numero.

• Criterio di campionamento: estrazione dei casi del campione mediante tavole di numeri casuali fino al raggiungimento di n (numerosità campionaria).

Page 8: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Come stabilire l’ampiezza campionaria con variabili stimate cardinali o quasi

cardinali?

Page 9: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Ampiezza campionaria con variabile stimata categoriale

Page 10: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Esempio

Page 11: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Esempio

• Immaginiamo di fare uno studio sulle posizioni professionali dei 1.000 diplomati degli istituti tecnici di una regione e si voglia stimare la percentuale di questi che si è iscritta all’università. Si richiede di determinare l’ampiezza necessaria per un campione atto a effettuare tale stima con un errore del 5%.

• P non è noto ma dai dati Istat sappiamo che negli anni precedenti i diplomati iscritti all’università erano attorno al 40%.

Page 12: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Esempio (2)

Page 13: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Errore campionario

• V (parametro della popolazione incognito)=

= v (stima del campione) ± e (errore di campionamento)

Page 14: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Errore campionario per variabile stimata cardinale

Page 15: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Errore campionario per variabile stimata categoriale

Page 16: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare
Page 17: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Intervallo di confidenza

• È la probabilità che un determinato parametro dell’universo rientri in una gamma di valori della corrispondente statistica calcolata sul campione.

• Ad esempio c’è il 95%di probabilità (intervallo di confidenza) che il 25% ± 5% (errore) degli elettori abbia una preferenza elettorale per il partito X

Page 18: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

La deviazione standard

• La deviazione standard fornisce una buona misura sintetica della deviazione dalla media. Quanto maggiore è l’eterogeneità, tanto più ampio dovrà essere il campione affinché la sua media sia una stima accurata della media della popolazione. Al crescere della deviazione standard cresce infatti l’errore campionario.

Page 19: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campione sistematico

• Estrazione non mediante sorteggio casuale, ma si scorre la lista di campionamento selezionandone uno ogni dato intervallo k, laddove k=N/n (intervallo di campionamento).

• Requisito: la lista di campionamento non deve presentare periodicità coincidenti con l’intervallo di campionamento.

• Vantaggio: può non essere disponibile la lista di campionamento (es. si intervista un individuo ogni k all’uscita dai seggi elettorali o all’uscita da un supermercato).

Page 20: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campione stratificato • Si suddivide la popolazione in sottopopolazioni (strati) il più

possibile omogenee rispetto alla variabile da stimare, utilizzando una o più variabili ad essa associate.

• Se per esempio la variabile da stimare è il reddito, si stratifica la popolazione rispetto alla variabile professione nota in partenza è si estraggono tanti campioni quante sono le classi di professioni individuate.

• Stratificato proporzionale: ciascun strato presenta nel campione una numerosità che è proporzionale alla numerosità dello strato nella popolazione.

• Stratificato non proporzionale: si potrebbero sovrarappresentare gli strati meno numerosi.

• A parità di ampiezza campionaria presenta un errore campionario inferiore perché diminuisce la variabilità della variabile studiata.

Page 21: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Esempio di campione stratificato proporzionale

Tavola di contingenza Età in classi * SESSO

SESSO

Totale F M Età in classi 1,00 fino a 24 Conteggio 111 32 143

% del totale 22,4% 6,5% 28,8%

2,00 25-26 Conteggio 145 44 189

% del totale 29,2% 8,9% 38,1%

3,00 oltre 26 Conteggio 107 57 164

% del totale 21,6% 11,5% 33,1%

Totale Conteggio 363 133 496

% del totale 73,2% 26,8% 100,0%

Page 22: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

L’indagine campionaria

• Quando si parla di survey generalmente si intende sample survey (indagine campionaria). Questo elemento, introdotto nella definizione di survey, pone immediatamente in luce che questo approccio di ricerca si avvale dell’estrazione di un sottogruppo di individui da una popolazione più estesa. Se il carattere estensivo è sicuramente un tratto definitorio della survey, altrettanto non può dirsi per il carattere di rappresentatività statistica del campione, spesso invocato automaticamente nella letteratura metodologica come requisito necessario che i campioni della survey devono rispettare

Page 23: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Una conquista della statistica

• Il concetto di rappresentatività si è consolidato verso la metà degli anni ’30 ad opera dello statistico polacco Jerzy Neyman e la teoria dell’inferenza, che ne deriva, è stato più volte descritta come il più importante contributo che la statistica abbia consegnato alle scienze sociali.

Page 24: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

L’ambiguità del termine • Kruskal and Mosteller (1979a; 1979b; 1979c), dopo aver

fatto un’accurata rassegna dei diversi significati con cui il termine rappresentativo è stato utilizzato nei diversi domini (di senso comune, scientifico in generale e statistico), arrivano alla seguente conclusione: “espressioni come “campionamento rappresentativo” e simili appaiono spesso, con funzioni meramente retoriche, per ottenere autorevolezza adottando un linguaggio statistico apparentemente rassicurante che però potrebbe essere vuoto di contenuto (…) Questo uso è normalmente vago e indica che il campione soddisfa gli scopi e le conclusioni dell’autore” (1979a, pp. 13-4).

Page 25: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Cosa significa rappresentatività?

• Al di là dell’ambiguità del termine rappresentativo, in generale, esso indica la possibilità che il sotto-gruppo/campione selezionato rappresenti fedelmente le caratteristiche proprie della popolazione d’indagine (Kirsh 1965: 26; 1995: 20), che il ricercatore avrà specificato in modo univoco al momento di definire il problema d’indagine. In altri termini, per essere considerato rappresentativo, il campione deve costituire una “miniatura” fedele della popolazione più estesa da cui viene estratto.

Page 26: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Obiettivo: La validità esterna

• Il rispetto di questo vincolo richiede la selezione di un campione probabilistico, in cui ogni individuo appartenente alla popolazione di indagine ha la stessa probabilità di essere incluso nel campione (requisito: disponibilità di una lista di campionamento). Come affermato da Campbell (1957, 963), l’esigenza è quella di conferire ai risultati di ricerca una “validità esterna” (generalizzabilità dei risultati all’intera popolazione), distinta dalla “validità interna” che invece fa riferimento al processo di “misurazione”, ossia all’accertamento delle distorsioni nel processo di costruzione del dato (errori non campionari).

Page 27: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Il vincolo della disponibilità della lista di campionamento: popolazione nascoste

• Una prima ragione del carattere limitativo del vincolo della rappresentatività statistica per la ricerca sociale è che attenersi ad esso significherebbe rinunciare a tutti i problemi d’indagine in relazione ai quali non è disponibile la lista di campionamento. Uno dei tanti effetti perversi che il vincolo della rappresentatività statistica ha avuto per la survey research è che ha portato a trascurare automaticamente problemi di indagine relativi a popolazioni nascoste (hidden populations), come tossicodipendenti, ex-detenuti, gay e lesbiche, Rom, migranti irregolari, artisti, homeless (Salganik, Heckathorn, 2003), consegnandoli direttamente ad altri approcci alla ricerca sociale che hanno fatto dello studio della marginalità sociale e della devianza il loro ambito privilegiato di studio.

Page 28: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Problemi della rappresentatività Rappresentativo rispetto a cosa? Come sostiene Marbach “qualsiasi generica affermazione di

rappresentatività – non qualificata né opportunamente precisata – appare priva di significato” (1996: 64).

I campioni probabilistici possono essere considerati rappresentativi solo ed esclusivamente in relazione a singole variabili o a gruppi di variabili, introdotte per stratificare il campione (il campione stratificato fu introdotto dallo stesso Neyman). A partire da questo rilievo dovremmo considerare che la rappresentatività è un concetto relativo e che è opportuno chiedersi sempre: rappresentativo rispetto a cosa? (Marradi, 1997).

Da quest’ultimo rilievo ne discende subito un altro: la vera rappresentatività statistica da garantire dovrebbe essere quella in relazione al carattere che è oggetto della nostra indagine (pregiudizio etnico, orientamento di voto,…). Ma sfortunatamente non avremo mai a disposizione una lista di campionamento che ci indichi per ciascun soggetto appartenente ad una data popolazione, qual è il suo livello di pregiudizio etnico, il suo orientamento di voto, ecc.

Si prospetta dunque il rischio di un uso sempre inappropriato del termine rappresentativo, al punto che c’è chi si chiede se non sia un mito (ad es. Pitrone, 2009).

Page 29: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Quando andrebbe stimata la rappresentatività statistica?

• Kendall and Buckland (1960) lamentavano la confusione tra dimensione prescrittiva (ricercare la rappresentatività come obiettivo metodologicamente necessario) ed empirica (denominare rappresentativi campioni non sottoposti a criteri di controllo e valutazione). Tale confusione, tuttora esistente, si riversa poi nel linguaggio e nella comunicazione scientifica, definendo rappresentativi campioni che non lo sono affatto sulla base del timore che definire non rappresentativo il campione utilizzato significhi uscire dal dominio scientifico (Campbell and Stanley, 1979: 19).

• La proposta di Kendall e Buckland è di confinare “il termine “rappresentativo” a quei campioni che, “indipendentemente dalle modalità di formazione, si dimostrassero effettivamente tali, e non (acriticamente e indistintamente) a quelli costruiti con l’intenzione di essere rappresentativi (senza sapere se poi lo fossero effettivamente)” (1960: 249). Ciò significa che la rappresentatività statistica – se richiesta - non dovrebbe essere valutata in base alla procedura che è stata utilizzata per estrarre il campione (probabilistico/non probabilistico), ma valutandola e accertandola dopo che la raccolta dei dati sia stata completata e tenendo conto di una serie di parametri (non semplicemente il tasso di rifiuti, ma in generale tutti i problemi di incompletezza della base empirica, segnalando anche come si distribuiscono in base alle caratteristiche più rilevanti della popolazione). In questo senso, errori campionari e non campionari interagiscono, con il rischio che un piano di campionamento casuale potrebbe dar luogo ad un campione finale non casuale (Marradi, 1997).

Page 30: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

La rappresentatività statistica è sempre necessaria?

• Come osservano Kendall and Brosnwick: “c’è confusione nel decidere se “rappresentatività” debba essere intesa come procedura di selezione basata sull’equiprobabilità di estrazione di ogni possibile campione oppure se debba essere intesa come campione tipico rispetto a certe caratteristiche, comunque scelte” (1960: 249).

• Per uscire da questa confusione, tuttora presente, è possibile argomentare che il primo tipo di campione (probabilistico) risponde ad un’esigenza di rappresentatività statistica e il secondo tipo risponde ad un’esigenza di rappresentatività tipologica.

• Più precisamente, è possibile affermare che il primo di tipo di rappresentatività sia più importante per il sondaggio che non per la survey research. Immaginiamo, infatti, quali effetti avrebbe un exit poll progettato sulla base di un campione non probabilistico. Se il suo scopo è quello di stimare la distribuzione delle intenzioni di voto della popolazione per prevedere i comportamenti effettivi di voto, il vincolo della generalizzabilità dei risultati ottenuti nel campione all’intera popolazione è irrinunciabile.

• Al contrario, in considerazione del suo obiettivo, nella survey research – in talune circostanze – potrebbe essere preferibile procedere attraverso procedure di campionamento non probabilistico che, ad esempio, permettano di porre a confronto gruppi (tipi sociali) di numerosità equivalente, identificati mediante il riferimento combinato a variabili considerate rilevanti e indipendentemente dalla loro consistenza numerica nella popolazione generale (campione tipologico per quote fisse).

Page 31: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

La rappresentatività statistica è sempre necessaria?

• La tesi che intendiamo argomentare, per quanto minoritaria, è che il requisito della rappresentatività statistica o comunque della generalizzabilità dei risultati all’intera popolazione, non sia sempre richiesto nella survey e che, in aggiunta, in alcuni casi proprio il rispetto di tale vincolo impedisca di produrre risultati teoricamente rilevanti.

• La nostra idea pragmatista richiama quella ben espressa da Galtung: “la scelta di un campione deve essere fatta sulla base degli scopi della ricerca; questa prescrizione, che potrebbe sembrare banale, lo è di meno se si tengono presenti i molti casi in cui viene fatto ricorso a procedure standard solo perché esistono e sono facili da seguire” (Galtung 1967: 49). Il campione, in altri termine, va pianificato in funzione degli obiettivi della ricerca e il ricorso automatico a forme di campionamento probabilistico– per ottemperare alla richiesta di rappresentatività statistica – può di fatto rivelarsi inadeguata a rispondere agli obiettivi di una survey. Standardizzare le procedure di campionamento, in nome di esigenze dettate dalla statistica, può di fatto impoverire la portata esplicativa (e previsionale) delle nostre ricerche sociali e confinarle all’ambito descrittivo.

Page 32: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Le strategie di campionamento nel Bureau of Applied Social Research

• Survey che, in diversi settori di studio, hanno costituito uno spartiacque all’interno di determinati settori di studio, si sono avvalse di campioni non statisticamente rappresentativi per esplorare l’influenza esercitata dai contesti e dalle reti di relazione sulle azioni individuali. Questo rilievo insinua il dubbio profondo che i vincoli imposti dal campionamento probabilistico precludano la possibilità di intraprendere percorsi di ricerca teoricamente rilevanti.

• Nell’ambito della Columbia School, basti pensare a survey divenute classiche, dirette da Lazarsfeld, allora Presidente del Bureau of Applied Science: Personal Influence (Katz and Lazarsfeld, 1955), Voting (Berelson, Lazarsfeld, and McPhee, 1954), The People’s Choice (Lazarsfeld, Berelson and Guadet, 1948), The Academic Mind (Lazarsfeld and Tielens, 1958). In tutte e quattro le survey la procedura di campionamento è non probabilistica o comunque si concentra su campioni estratti su base locale.

Page 33: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

L’atomismo della survey: Il campione probabilistico come tritacarne sociologico

• Barton, direttore del Bureau negli ultimi quindici anni, ad esordio di un articolo, significativamente intitolato Bringing Society Back, spiega efficacemente le motivazioni alla base della presa di distanza del Bureau dal punto di vista convenzionale:

• “Negli ultimi trent’anni, la ricerca sociale empirica è stata dominata dall’indagine campionaria (sample survey). Ma come di solito viene praticata, usando campioni casuali di individui, la survey e un tritacarne sociologico, dal momento che strappa l’individuo dal suo contesto sociale e garantisce che nessuno degli individui selezionati interagisca con gli altri inseriti nello studio. E’ come se un biologo inserisse i suoi animali da esperimento in una macchina per fare hamburger e guardasse ad ognuna delle centinaia di cellule attraverso un microscopio; anatomia e fisiologia si perderebbero; struttura e funzione sparirebbero; e si rimarrebbe soli con la biologia cellulare"(Barton 1968: 1).

Page 34: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Da campioni atomistici a campioni molecolari

• Estrarre casualmente i casi del campione significa concepirle come unità (da qui il termine unità di campionamento), dotate di autonomia e al di fuori delle reti di relazioni e dei collettivi di cui essi fanno parte.

• Il risultato netto, come decretato da Coleman (1956) è psicologia aggregata.

• La ricerca che ha decretato il passaggio da una prospettiva atomista ad una relazionale nel Bureau è stata Personal Influence di Katz e Lazarsfeld.

Page 35: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Personal Influence

• Si noti intanto che si tratta di una survey condotta tenendo sotto controllo gli effetti del contesto territoriale: fu realizzata infatti in una cittadina del Middle West americano (Decatur), scelta sulla base di criteri di tipicità, esattamente come i coniugi Lynd scelsero Middle Town per le loro ricerche etnografiche. In Personal Influence, i ricercatori posero tre domande a ciascun individuo campionato nella comunità di Decatur per individuare quale fosse stata la persona più influente sulle sue decisioni e quali fossero state le persone sui cui loro stessi avevano avuto una maggiore influenza. Procedevano poi con un’intervista di follow-up alle persone così identificate per identificare opinion leaders.

Page 36: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campioni molecolari • Nonostante la procedura di campionamento su base relazionale sia descritta

in Personal Influence in poche righe, in una presentazione degli studi della Columbia School ai quali egli aveva dato un contributo significativo, Katz concluse che “il problema metodologico centrale in ciascuno di questi studi […] è stato come tenere conto delle relazioni interpersonali a continuare a preservare l’economia e la rappresentatività garantita dai campioni casuali, (…) Il principio guida sembrerebbe essere costruire attorno ad ogni atomo individuale nel campione molecole più o meno estese”.

• Riflettendo retrospettivamente sull’esperienza di ricerca condotta a Decatur insieme a Lazarsfeld, Katz si rende conto di come l’analisi delle relazioni interpersonali diadiche fosse limitativo e che fosse necessario sviluppare un piano di campionamento che tenesse conto delle reti di relazione (molecole): “iniziò ad essere desiderabile tenere conto di catene di influenza più estese di quelle implicate dalla diade; e da qui vedere la diade consigliere-consigliato (adviser-advisee) come una componente di un gruppo sociale più elaborato dal punto di vista strutturale” (Katz, 1957:67).

Page 37: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Medical Innovation

• Certamente, il fatto che in Personal Influence si facesse riferimento a relazioni diadiche di influenza (e quindi non a vere reti di relazioni) fa sì che “la concezione delle relazioni interpersonali come costituive di network è rimasta nella migliore delle ipotesi una metafora interpretativa in tutti gli studi di Columbia, almeno fino al “drug study”, Medical Innovation (Coleman, Katz and Menzel, 1957).

• I dati della ricerca Medical Innovation, resa interessante ai nostri fini dall’incorporazione nella survey di un questionario sociometrico ed altre fonti di dati (ad es., ottenuti presso le farmacie), permisero a Coleman e ai suoi colleghi di “ricostruire come avviene la diffusione di un nuovo farmaco a seconda che i medici avessero rapporti stretti con altri medici e fossero più integrati nella comunità oppure fossero più isolati” (Capecchi, 2008).

Page 38: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campione su base relazionale • Il campione, composto da circa 200 medici, fu

estratto, come in Personal Influence e in molte altre survey condotte dal Bureau, attraverso a snowball sampling, che costituisce una procedura su base relazionale, oggi utilizzata in modo molto approssimativo anche nella ricerca qualitativa. Coleman, in effetti, fu il membro del Bureau che più di ogni altro sviluppò la riflessione di Lazarsfeld sulla analisi relazionale attraverso la survey, divenendo un riferimento importante per gli sviluppi della network analysis (in particolare, molto citato in ambito sociometrico è il saggio di Coleman del 1959).

Page 39: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campionamento su base relazionale

• Quando all’interno della concettualizzazione del problema, un ruolo di primo piano è rivestito dalle proprietà relazionali e, quindi, dai sistemi di influenza (inter)personali, è consigliabile utilizzare un piano di campionamento in cui i casi siano scelti sulla base della loro appartenenza a catene di relazioni. Il caso più difficile è rappresentato dai casi in cui vogliamo ricostruire l’influenza personale esercitata all’interno di catene informali di relazione (come quelle interne a gruppi di amici). In tutte le procedure di campionamento che privilegino il riferimento questo tipo di network aperto, la numerosità del campionamento non è determinata a priori ma si stabilisce sulla base della densità delle reti di relazioni individuate.

Page 40: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campionamento sociometrico a valanga o a palla di neve

Il campionamento “a palla di neve a s stadi e k nomi” (Goodman) è articolato in diversi steps procedurali: 1) Scelta dei nodi iniziali; 2) Primo stadio: Identificazione di k individui relazionati con i nodi iniziali

mediante la somministrazione a questi ultimi di un test sociometrico (integrato al questionario);

3) Stadi successivi fino al livello s: preso contatto con i nuovi “nodi” della rete individuati, si procederà, nuovamente, attraverso l’intervista con questionario, che ancora una volta includerà il test sociometrico con la richiesta di nominare k individui appartenenti alla rete. Si andranno ad intervistare, con lo stesso sistema, le nuove persone indicate fino a che: a) avremo raggiunto il sth stadio di campionamento, laddove s è un parametro che il ricercatore potrà stabilire in anticipo o in progress (in funzione dei risultati provvisori dell’analisi sociometrica); b) ciascun nuovo nodo indicherà tutte persone già incluse nel campione.

Page 41: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Medical innovation: campionamento sociometrico

• Come menzionato, un campionamento sociometrico fu applicato nel “drug study”, Medical Innovation:

• “(a) A ogni dottore intervistato fu chiesto di rispondere a tre domande sociometriche: A chi si è rivolto più spesso per consigli e informazioni? Con chi ha parlato più spesso dei suoi casi nel corso di una settimana ordinaria? Quali sono gli amici, tra i suoi colleghi, che ha visto più spesso nel tempo libero? In risposta a ciascuna di queste domande, sono stati richiesti tre nomi di medici. Ciò ha permesso di tracciare i legami attraverso i quali ogni medico era collegato con il resto della comunità medica. (b) È stato deciso di includere nel campione, per quanto possibile, tutti i medici locali nelle cui specialità il nuovo farmaco era potenzialmente molto rilevante. Questo ha assicurato che gli "altri" nominati da ogni medico in risposta alle domande sociometriche fossero inclusi nel campione, in modo che è stato possibile caratterizzare coppie o catene di medici socialmente collegati. Di conseguenza, 125 medici di medicina generale, internisti e pediatri sono stati intervistati; essi costituivano l'85 per cento dei medici che esercitavano in questi campi nelle quattro città del Midwest” (Coleman, Katz e Menzel, 1957, p. 254).

Page 42: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Risultati: Medical Innovation

• Un esempio dei risultati originali, ottenuti coniugando livelli di analisi diversi, è che generalmente “il grado di integrazione di un dottore nella sua comunità di colleghi era fortemente e positivamente correlato con la data in cui aveva utilizzato il nuovo farmaco per la prima volta” (ibidem, pp. 256-7). Più in generale, i risultati della ricerca mettono in rilievo “che diversi aspetti della posizione di un individuo nella struttura sociale influenzano, ognuna a proprio modo, le sue reazioni alle innovazioni” (Menzel, 1960, p. 713).

• I ricercatori lo descrivono come un risultato “in qualche misura inatteso” perché precedenti studi mettevano in relazione la propensione ad accogliere le innovazioni con una posizione di marginalità sociale (come è nel caso degli stranieri).

Page 43: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Problemi

• Stabilire “s” in anticipo significa rischiare di comporre molte reti di relazione incomplete;

• Cosa garantisce che gli individui nominati collaboreranno alla ricerca?

Page 44: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Vantaggi

• Inserendo i dati sociometrici in matrice, è possibile derivare proprietà relazionali e strutturali altrimenti inaccessibili.

Page 45: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Integrazione tra survey e sociometria

• L’avvertenza importante in questa proposta è che il snowball sampling deve essere sempre accompagnato da un’analisi sociometrica incorporata nella survey per ricostruire, l’influenza, generalmente sottovalutata, esercitata dalle proprietà relazionali sugli atteggiamenti/comportamenti che intendiamo spiegare o interpretare. In realtà questa idea era già presente quando questa procedura di campionamento è stata utilizzata per la prima volta in Personal Influence e nelle codificazioni successive (Katz, 1957; Coleman, 1958; Goodman, 1961), tant’è che Barton (1968), nella sua ricostruzione delle procedure di campionamento nel Bureau, parla di sociometric sampling. E’ andata però persa negli anni successivi (questo tipo di campionamento è generalmente utilizzato in modo approssimativo per comprimere tempi e costi senza includere i dati sociometrici nella base empirica), fatta eccezione per la ricerca sociometrica, che continua ad utilizzarla avendo consapevolezza delle sue potenzialità.

Page 46: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Dal micro al macro: campionamento contestuale

• Il riferimento a network chiusi di relazione è possibile, laddove si introduca il riferimento a contesti di (inter)azione spazialmente delimitati, cioè a collettivi (ad es. scuole, università, uffici, associazioni di volontariato, ecc). In molte delle ricerche condotte dal Bureau è stata seguita la procedura, definita cluster sampling (campionamento a grappolo), con la quale campioniamo dei collettivi (scuole, colleges, uffici, sedi sindacali, famiglie, ecc.) per poi intervistare tutti i membri di ciascun collettivo selezionato.

• In alternativa, come è avvenuto nella ricerca The Academic Mind, si possono slezionare i collettivi per poi selezionare casualmente gli individui appartenenti ad esso.

Page 47: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Integrazione tra livello contestuale e relazionale

L’adozione del campionamento a grappolo consente di ricostruire in modo completo la rete di relazione tra i membri di ciascuno dei collettivi campionati.

E’ possibile inserire questa procedura all’interno di una procedura più articolata come quella del campionamento multistadio, in cui ad ogni stadio cambia l’unità di campionamento,fino ad arrivare, nell’ultimo stadio, ad estrarre unità individuali.

Page 48: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campionamento multistadio con estrazione a grappolo degli individui

• Es. Pregiudizo omofobico in ambito scolastico

• Stadi di campionamento: 1° stadio: selezione di 5 distretti scolastici su base tipologica; 2° stadio: selezione di due istituiti scolastici in ogni distretto campionato al primo stadio (uno tecnico-professionale e uno liceale), per un totale di 10 istituiti; 3° stadio: selezione di 5 classi in ciascuno degli istituti (una sezione di un intero ciclo scolastico per ciascun istituto) per un totale di 50 classi; 4° stadio: inclusione nel campione di tutti gli studenti appartenenti alle 50 classi selezionate nello stadio precedente (come nel cluster sampling), per un totale di circa 1.000 studenti. Ad ogni stadio si procede ad una selezione delle unità (aggregate) secondo i criteri che di volta in volta vengono reputati più adeguati (scelta ragionata) e in alcuni casi si può mantenere il riferimento alla randomizzazione (come nel caso della scelta delle classi di ciascun istituto).

Page 49: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campionamento multistadio call center

• 1° stadio: collocazione territoriale(Nord, Centro, Sud, Isole)

• 2° stadio: province (Milano, Roma, Cosenza, Catania)

• 3° stadio: 6 call center per ogni provincia con estrazione tipologico-fattoriale (dimensione call center * missioncenter).

• 4° stadio: estrazione operatori con disegno tipologico-fattoriale (sesso, tipo di servizio, forma contrattuale): 50 operatori per call center di medie dimensioni, 100 operatori per call center di grandi dimensioni

Page 50: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Selezione call center in ogni provincia: Dimensioni x Mission (24 call center –

raggiunti: 21)

Generalisti Dedicati commericiali

Dedicati di pubblica utilità

Totale

Medi (tra 50 e 200 operatori)

1 1 1 3

Grandi (>200 operatori)

1 1 1 3

Totale 2 2 2 6

Page 51: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Vantaggi • Avendo collettivi delimitati come le classi scolastiche è senz’altro

possibile utilizzare in modo più agevole la proposta di integrazione tra survey e analisi sociometrica, approfondendo, ad esempio, per ciascun studente di ciascuna classe la struttura e l’intensità delle relazioni stabilite con i suoi compagni (proprietà relazionali). E’ anche possibile incorporare l’analisi contestuale, raccogliendo informazioni sui collettivi selezionati nei diversi stadi (distretti, scuole, classi), relativamente a proprietà globali in ipotesi connesse alla formazione degli atteggiamenti/comportamenti oggetto di interesse. Attraverso l’uso del campionamento multistadio si accoglie una prospettiva analitica che guarda ai comportamenti/atteggiamenti individuali come l’esito di un inestricabile intreccio tra proprietà che si collocano su tre livelli di analisi che generalmente nella ricerca sociale rimangono distinti ed isolati: macro (analisi contestuale), meso ( analisi relazionale); micro (analisi individuale).

Page 52: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Integrazione degli strumenti di rilevazione

• Per perseguire l’idea di una survey multilivello, è necessario precisare che la rilevazione delle proprietà contestuali e relazionali potrebbe richiedere la progettazione di strumenti raccolta delle informazioni, normalmente utilizzati in altre strategie di ricerca, da affiancare all’uso del questionario.

• In particolare, questa integrazione consentirebbe di rilevare quelle informazioni che non sono rilevabili direttamente sugli individui, tramite il questionario; perché relative a:

- caratteristiche dei collettivi di appartenenza delle quali l’intervistato potrebbe avere una conoscenza molto provvisoria (potrebbe ad es. non sapere quanti dipendenti precari ha l’azienda presso la quale lavora; quali parametri ergonomici vengono regolarmente controllati dal management della propria azienda, quanti migranti stranieri risiedono nel proprio quartiere, ecc.);

- proprietà relazionali di cui il soggetto potrebbe non avere consapevolezza (ad esempio, come potremmo chiedere tramite questionario qual è la posizione di centralità/marginalità che uno studente riveste all’interno della propria classe, senza il rischio di incorrere in risposte molto aleatorie? Oppure come rilevare se una certa preferenza espressa per certi compagni di scuola è ricambiata con la stessa intensità?).

Page 53: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Strumenti utilizzabili e integrazione dei dati in matrice

• Per le proprietà contestuali: interviste a soggetti che detengono una visione complessiva e accurata della organizzazione complessiva del collettivo (anche attraverso interviste in profondità); dati secondari.

• Un esempio classico di questa strategia nel Columbia Bureau è costituito da The Academic Mind (Lazarsfeld e Thielens, 1958), in cui i colleges furono classificati, sia in fase di campionamento sia in sede di analisi, in modo più accurato, sulla base di tre caratteristiche - tipo di controllo, numerosità delle iscrizioni universitarie e qualità accademica-, avvalendosi di un numero significativo di indicatori contestuali rilevati esternamente al questionario, facendo perlopiù riferimento a fonti secondarie di tipo amministrativo. In sede di analisi, i ricercatori controllarono quanto queste caratteristiche dei collettivi influenzassero proprietà individuali, come l’apprensione nei confronti del maccartismo.

• Per le proprietà relazionali e strutturali: test sociometrico; osservazione diretta delle pratiche relazionali.

• Il requisito richiesto è che i dati raccolti in relazione a differenti collettivi e network di relazione siano tra loro comparabili e organizzabili nella stessa matrice dei dati costruiti mediante questionario.

• In corrispondenza di ogni riga della matrice inserirò i dati relativi alle proprietà rilevate tramite questionario (per lo più proprietà assolute), le proprietà contestuali relative al collettivo di appartenenza di quel caso (rilevate esternamente al questionario) e le proprietà relazionali (ad es., preferenze espresse nel test sociometrico).

Page 54: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Altri tipi di campionamento non probabilistico

• Campione a scelta ragionata: Questo tipo di campionamento è usato nel caso in cui i fenomeno da studiare sia fortemente caratterizzato o circoscritto a determinate aree o individui. I soggetti vengono selezionati in base ad alcune caratteristiche ritenute teoricamente rilevanti (sia ex ante, sia in itinere, con possibili riaggiustamenti del campione).

Page 55: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Campionamento tipologico-fattoriale per quote fisse o proporzionali

si ottiene dalla combinazione di due (o più) caratteri ritenuti discriminanti rispetto al fenomeno oggetto di studio; la consistenza di ciascun tipo deve poi essere quantificata, stabilendo quante persone corrispondenti a ciascun profilo devono essere intervistate.

L’estrazione dei casi, piuttosto che avvenire mediante procedure di campionamento casuale, avviene a discrezione degli intervistatori.

Page 56: Strategie di campionamento · 2019-05-10 · statisti a e il se ondo tipo risponde ad un’esigenza di rappresentatiità tipologi a. • Più precisamente, è possibile affermare

Esempio di costruzione di campione tipologico per quote fisse

Maschi Femmine

Fino al diploma

Oltre il diploma

Fino al diploma

Oltre il diploma

Totale

Famiglia mono reddito

10 10 10 10 40

Famiglia doppio reddito

10 10 10 10 40

Totale 20 20 20 20 80

Obiettivo cognitivo: esplorare i fattori e i meccanismi generativi della tendenza dei giovani-adulti delle grandi metropoli italiane al ritardo rispetto all’assunzione del ruolo genitoriale registrato a livello intergenerazionale e intereuropeo.

Unità di analisi: genitori residenti nella città di Roma che abbiano avuto il primo figlio dopo una certa soglia di età che segnali la presenza di ritardo [da determinare accuratamente] e che siano divenuti genitori da non più di 4 anni.

Variabili di stratificazione del campione: sesso, titolo di studio e l’appartenenza ad una famiglia monoreddito o a doppio reddito.