Statistica sociale Modulo A A.A. 2012-2013 Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo...

Post on 01-May-2015

214 views 2 download

Transcript of Statistica sociale Modulo A A.A. 2012-2013 Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo...

Statistica sociale Modulo Statistica sociale Modulo AA

A.A. 2012-2013Prof.ssa Barbara Baldazzi Dottore Mario MastrangeloFacoltà di Lettere e FilosofiaUniversità di Tor Vergata

Barbara.Baldazzi@uniroma2.itMario.mastrangelo@uniroma2.it

Statistica sociale Modulo Statistica sociale Modulo AA

Orario lezioni:Lunedì ore 11-13 aula T12AGiovedì ore 14-16 aula T12AVenerdì ore 11-13 aula T12A

Orario ricevimento:Lunedì ore 13-14Studio 26, Edificio B, Primo Piano (presso la stanza della Prof.ssa D.F. Iezzi)

Temi del corsoTemi del corsoOBIETTIVI: La statistica riveste un ruolo rilevante in tutti i

settori, anche nell’ambito della comunicazione, del turismo, dei servizi educativi e sociali. La sintesi di un fenomeno collettivo attraverso opportuni strumenti permette, infatti, di aiutare la conoscenza, di fornire strumenti per la valutazione e di prendere decisioni in condizioni di incertezza. Il corso ha lo scopo di fornire allo studente metodi e strumenti per la rilevazione, la classificazione e l’interpretazione dei dati riguardanti fenomeni sociali, ponendo particolare attenzione alle logiche sottostanti la loro creazione, ai presupposti per la loro applicazione ai dati reali e all’interpretazione dei risultati.  

PROPEDEUTICITA': Non sono necessari prerequisiti particolari se non le conoscenze di base acquisite nel corso di studi della scuola secondaria di secondo grado di qualsiasi indirizzo. 

Temi del corsoTemi del corsoArgomenti del corso:

- Alcune definizioni generali: la statistica ed i suoi obiettivi, il collettivo e l’unità statistica.- Statistica descrittiva e statistica inferenziale.-  Le fonti statistiche.-  La distribuzione di un carattere e la sua rappresentazione grafica.-  La sintesi di una distribuzione di un carattere: medie e variabilità.-  Confronti fra grandezze.- La costruzione degli indicatori compositi.- Associazione tra due caratteri: contingenza, correlazione e regressione

LABORATORIO: Analisi dei dati con l’utilizzo del foglio elettronico Excel. Dove possibile la didattica sarà "per esempi", si cercherà cioè di partire da casi concreti per presentare teorie e approcci.  

Testi e modalità di esameTesti e modalità di esame

Iezzi D.F. (2009). Statistica per le Scienze Sociali, Carocci, Roma.

Durante il corso saranno messi a disposizione degli studenti ulteriori materiali didattici.

L’esame consiste in una prova scritta e eventuale oraleProbabilmente ci svolgerà una prova di esonero a metà dicembre

La statisticaLa statisticaLa statistica per le scienze sociali è un insieme di

metodologie per la raccolta e l’analisi dei dati, il cui utilizzo consente di descrivere, valutare e prevedere i fenomeni sociali

La statistica analizza, in termini quantitativi, i fenomeni collettivi, ossia studia i fenomeni per i quali bisogna fare delle osservazione su un insieme di comportamenti individuali.

La statistica Progetta: la raccolta dei dati necessari per indagare

un fenomenoAnalizza: i fenomeni collettivi con opportuni metodiPrevede: riesce a formulare delle previsioni

Il fenomeno socialeIl fenomeno socialeSiamo in presenza di un fenomeno sociale se:Coinvolge una molteplicità di soggettiHa ripercussioni sulla collettivitàÈ di tipo statistico, cioè analizza i fatti in termini

quantitativiIl fenomeno statistico è tutto ciò che può essere

direttamente o indirettamente osservato e riguarda una molteplicità di unità statistiche

Le caratteristiche che determinano di analizzare e descrivere un fenomeno vengono denominate caratteri o variabili statistiche

Il fenomeno socialeIl fenomeno socialeL’unità elementare su cui vengono osservati i caratteri

si chiama unità statistica. Un insieme di unità statistiche omogenee a una o più caratteristiche costituisce un collettivo statistico o popolazione.

Un carattere può assumere differenti modalità in corrispondenza delle diverse unità del collettivo

Le modalità devono essere Esaustive, cioè in grado di interpretare qualunque

manifestazione del carattere (eventualmente inseriamo “altro”)

Mutuamente esclusive, ogni elemento della popolazione deve possedere una sola modalità del carattere

Es. condizione Es. condizione occupazionaleoccupazionale

Possibili modalità:

1. Occupato2. Occupato a tempo determinato3. Casalinga4. Pensionato5. Disoccupato6. Inabile al lavoro

Es. condizione occupazionaleEs. condizione occupazionalemodalità completemodalità complete

1. Occupato a tempo indeterminato2. Occupato a tempo determinato3. Casalinga4. Pensionato5. Disoccupato6. Inabile al lavoro7. Studente8. Altro

CARATTERI

QUANTITATIVI Variabili statistiche

QUALITATIVIMutabili statistiche

discreti continui Normali o sconnessi ordinali

rettilinei ciclici

CaratteriCaratteriI caratteri qualitativi presentano modalità di tipo

verbale (aggettivi, nomi, ecc) Qualitativi sconnessi (sesso, luogo di nascita,

colore degli occhi, luogo di destinazione di un viaggio,…) se hanno per modalità denominazioni tra le quali non esiste e non è possibile stabilire un ordinamento

Chiamiamo Xj la modalità della variabile X per l’unità j e

Xi la modalità della variabile X per l’unità i

Abbiamo le proprietà di Simmetria Xj = Xi Xi = Xj

Transatività Xj = Xi e Xj = Xk Xi = Xk

CaratteriCaratteriQualitativi ordinali : se hanno per modalità

denominazioni qualitative per le quali è possibile stabilire un ordinamento naturale (titolo di studio, grado di soddisfazione, posizione in graduatoria, mese …)

Le relazioni ammesse tra le modalità sono quelle di: maggiore (>)minore (<)uguale (=)I qualitativi ordinali CICLICI: le modalità si ripetono in

maniera ciclica e la scelta della prima modalità è frutto di una convenzione (i giorni della settimana, i mesi dell’anno)

CaratteriCaratteriQuantitativi esprimono una misura o una quantità(numero di figli, km percorsi, voto ad un esame,

numero di posti letto…)Discreti: se le modalità costituiscono un insieme

discreto, ossia sono numeri interi 0,1,2Continui: se le modalità costituiscono un insieme

continuo, quindi sono tutti i numeri reali compresi in un determinato intervallo

I caratteri quantitativi possono essere classificati in TRASFERIBILI e NON TRASFERIBILI, a seconda che si possa pensare di trasferire una parte del carattere tra le unità

Caratteri (o variabili)Caratteri (o variabili)Tipo di carattere Operazioni che posso

fare

Qualitativi sconnessi = ≠

Qualitativi ordinati =, >, <

Quantitativi =, >, <, +, -posso misurare di

quanto è minore o maggiore

Matrice di datiMatrice di datiX1 X2 X3 X4 X5 … … Xp

1 X11 X12 X13 X14 X15 … … X1p

2 X21 X22 X23 X24 X25 … … X2p

3 X31 X32 X33 X34 X35 … … X3p

4 X41 X42 X43 X44 X45 … … X4p

5 X51 X52 X53 X54 X55 … … X5p

6 X61 X62 X63 X64 X65 … … X6p

… … … … … … … … …… … … … … … … … …… … … … … … … … …n-1 Xn-11 Xn-12 Xn-13 Xn-14 Xn-15 … … Xn-1p

n Xn1 Xn2 Xn3 Xn4 Xn5 … … Xnp

Statistica descrittiva e Statistica descrittiva e inferenzainferenza

La statistica descrittiva si occupa della descrizione e sintesi dei dati usando:

Tabulazione e distribuzioni di frequenzaGraficiStatistiche riassuntiveLe conclusioni che si traggono dall’analisi dei dati

riguardano solamente l’insieme dei dati analizzati

Tipi di rilevazioniTipi di rilevazioniLa conoscenza statistica di un fenomeno può avvenire

tramite: Rilevazione completa o censuaria – ottengo le

informazioni da tutte le unità statistiche del collettivo – il censimento è condotto su tutte le unità di una popolazione, è una rilevazione diretta e individuale, cioè ogni unità è enumerata con le caratteristiche; e trasversale, cioè riferita a un preciso istante di tempo

Rilevazione campionaria – ottengo le informazioni su un sottocollettivo (campione) del collettivo – per essere rappresentativa di tutti il collettivo deve poter ricostruire con una sufficiente approssimazione le caratteristiche del collettivo oggetto di studio

Rilevazioni campionarieRilevazioni campionariePerché si fanno:Ridurre i costi eccessivi; Organizzare una ricerca più snella;Cogliere l’evoluzione di fenomeni che mutano

velocementeVantaggi:Riduzione dei tempi e dei costiControllo dell’attendibilità del processoIl campione è l’insieme di n unità campionarie

selezionate tra le N unità della popolazione o collettivo di riferimento, affinché le n unità possano rappresentare nel modo migliore questa popolazione

Famiglie e soggetti sociali 2008Famiglie e soggetti sociali 2008Conoscere l’intreccio dei percorsi di vita individuali

attraverso la ricostruzione delle diverse fasi del ciclo di vita familiare e lo studio dei rapporti interni alla famiglia

Conoscere le reti di parentela e le reti di supporto formale e informale

Conoscere le biografie lavorative degli individui per studiare la mobilità sociale

Argomenti Struttura della famiglia Pendolari della famiglia Permanenza dei giovani in famiglia Reti di parentela e di aiuto informale Vita di coppia Usanze e tradizioni familiari

Popolazione di interesse: ossia l’insieme delle unità statistiche sulle quali si intende investigare, è costituita dalle famiglie residenti in Italia e dagli individui ad esse appartenenti, al netto dei membri permanenti delle convivenze.

L’unità di rilevazione è la famiglia di fatto, ossia l’insieme di persone coabitanti e legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o affettivi

Periodo di riferimento: è prevalentemente costituito dai 12 mesi precedenti l’intervista

Intervista diretta (faccia a faccia con questionario cartaceo) di tutti gli individui appartenenti alle famiglie del campione

Periodo di svolgimento: giugno 2008

Disegno della ricerca

gli ambiti rispetto ai quali sono riferiti i parametri di popolazione oggetto di stima sono:

L’intero territorio nazionale

Le 5 ripartizioni geografiche

Le 19 + 2 regioni geografiche

La tipologia comunale

Domini di studio

Per una indagine ad obiettivi plurimi è poco realistico pensare ad una strategia campionaria che assicuri prefissati livelli di precisione di tutte le stime prodotte

Le stime vanno fornite per livelli territoriali differenti

Es 1. se l’unico ambito di stima fosse l’intero territorio nazionale, la soluzione ottimale sarebbe quella di determinare la numerosità nazionale e ripartirla tra le regioni in modo proporzionale alla loro dimensione demografica

Es 2. viceversa, per produrre stime con uguale attendibilità a livello regionale la soluzione ottimale sarebbe quella di selezionare un campione uguale in tutte le regioni

Strategia di campionamento

In base alle considerazioni precedenti si è adottata una soluzione mista basata su criteri di costo ed organizzativi e su considerazioni degli errori campionari delle principali stime a livello nazionale e riferite ai domini territoriali di interesse

La dimensione del campione teorico è pari a 24.000 famiglie

Il numero di comuni campione non deve superare i 900 comuni

L’allocazione del campione di famiglie e di comuni nelle varie regioni adotta un criterio di compromesso tale da garantire sia l’affidabilità delle stime a livello nazionale che delle stime a livello di ciascun dettaglio territoriale visto in precedenza

Numerosità campionaria

Popolazione di riferimento 8.101 Comuni 22.360.539 famiglie 57.272.931 individui

Campione 787 Comuni 19.227 famiglie 49.541 individui

Numerosità campionaria

La selezione delle famiglie da intervistare in ogni comune campione viene effettuata dalla lista anagrafica di ciascun comune senza reimmissione e con probabilità uguali.

La tecnica di selezione è di tipo sistematico

1) Vengono messi in sequenza i fogli delle famiglie dell’anagrafe del comune

2) Si calcola il passo di campionamento numero famiglie

residenti Passo di campionamento ------------------------------

numero di famiglie campione

Le famiglie

3) Si selezionano le famiglie secondo il passo di campionamento

Esempio: Comune con 300.000 famiglieNumero di famiglie da estrarre = 2.000

Passo di campionamento = 150 Famiglie estratte: 3; 3+150=153; 153+150=303; 303+150=453; ……

Le famiglie

Calcolo delle stimeCalcolo delle stime

Le unità appartenenti al campione rappresentano anche le unità della popolazione che non sono incluse nel campione

Ad ogni unità campionaria viene attribuito un peso che denota il numero di unità della popolazione rappresentate dall’unità medesima

Es: peso attribuito = 30 l’unità rappresenta se stessa e altre 29 unità della popolazione

Calcolo delle stimeCalcolo delle stime

Procedura complessa che: corregge l’effetto distorsivo della mancata

risposta totale (il numero teorico di famiglie non sempre viene realizzato, per l’impossibilità di reperire tutte le famiglie o perché alcune famiglie si rifiutano di concedere l’intervista)

tiene conto di alcuni totali noti sulla popolazione in modo da far coincidere le stime campionarie con i totali noti (i totali noti sono: distribuzione regionale della popolazione residente per sesso e classi d’età, distribuzione regionale della popolazione residente per tipo di comune)

Rilevazioni campionarieRilevazioni campionarieLista di campionamento: è l’archivio aggiornato di tutte

le unità della popolazione di riferimento (le famiglie iscritte all’anagrafe)

Parametro: è una sintesi numerica che descrive una caratteristica della popolazione

Statistica: è un sintesi numerica che descrive una caratteristica di un campione

Stimatore: è un funzione di un campione di dati estratti casualmente da una popolazione. Il valore assunto dallo stimatore, in corrispondenza di un campione, è detto stima

Statistica inferenziale è l’insieme dei metodi che consentono di stimare una caratteristica di una popolazione sulla base di un campione estratto con modalità casuale

Evento, dato e informazione

In generale il termine “dato” è definito come una descrizione originaria non interpretata degli eventi.

Il “dato statistico”, invece, è un evento (soggetto, entità, accadimento o caratteristica) osservato e registrato che si differenzia dall’evento stesso perché depurato delle caratteristiche non ritenute essenziali secondo gli obiettivi di conoscenza.

Dal dato iniziale spesso si passa al dato sintetico, ottenuto attraverso alcune elaborazioni, con lo scopo di ricomporre e descrivere il fenomeno o l’evento reale che ci interessa studiare. Conseguentemente dal dato iniziale si ottiene un OUTPUT (dato costruito e elaborato) e dall’output si ottiene un OUTCOME (output interpretato in funzione di un progetto).

Il dato diventa informazione quando viene:

Memorizzato;Organizzato;Classificato;Messo in relazione;Interpretato.

Il dato statistico è il risultato dell’operazione di rilevazione di una data caratteristica su un individuo di un collettivo

I dati per acquisire un significato devono diventare informazione, cioè essere organizzati sulla base di obiettivi specifici

COMPLETI - cioè capaci di descrivere un fenomeno o una situazione nel modo più esaustivo possibile;

OMOGENEI - per cui i sistemi di rilevazione e classificazione devono garantirne la comparabilità;

FASATI – nel senso che i dati devono riferirsi ad un preciso arco temporale.

Evento, dato e informazione

Microdati: dati elementari, relativi cioè alla singola unità su cui sono stati rilevati. L’insieme dei dati rilevati sulla singola unità ne costituiscono il profilo.

Macrodati: il risultato di un qualsiasi calcolo (somma, differenza, rapporto …) effettuato sui microdati secondo criteri definiti. Unità aggregate su cui non è possibile rilevare direttamente l’informazione si servono di macrodati (il reddito prodotto da una regione è dato da un aggregato di singoli redditi prodotti o percepiti)

Metadati: le informazioni di carattere qualitativo e/o quantitativo riguardanti le modalità di produzione dei microdati e dei macrodati.

Evento, dato e informazione

Materiali della lezioneMateriali della lezioneD. F. Iezzi, Statistica per le

scienze sociali Carocci, 2009 - Capitolo 1