A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

19
DiSIA DIPARTIMENTO DI STATISTICA, INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI" Alessandra Petrucci Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) «G.Parenti» Università degli Studi di Firenze «I dati socio - demografici e le integrazioni delle fonti» LA SCIENZA DEI DATI PER I PROCESSI DI MODERNIZZAZIONE Università degli Studi di Bari 14 novembre 2016

Transcript of A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

Page 1: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

Alessandra PetrucciDipartimento di Statistica, Informatica, Applicazioni (DiSIA) «G.Parenti»

Università degli Studi di Firenze

«I dati socio-demografici e le integrazioni delle fonti»

LA SCIENZA DEI DATI PER I PROCESSI DI MODERNIZZAZIONE

Università degli Studi di Bari14 novembre 2016

Page 2: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

Sommario

• Le fonti statistiche fra continuità e innovazione• Le richieste informative e le conseguenze in termini di

dati• Integrazione fra fonti• Conclusioni

Page 3: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• L’utilizzo delle fonti amministrative in passato

- Obiettivi di conteggio

- Fonti disgiunte

- Analisi aggregata

• Il censimento nel passato

- Obiettivi di conteggio e di valutazione strutturale

(a diversi livelli territoriali)

- I dati «ritardati»

- Fonte isolata

- Analisi trasversale

• Le indagini

- Ogni indagine «un’isola»

Le fonti statistiche tra continuità e innovazione: ieri…

Page 4: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• L’utilizzo attuale delle fonti amministrative- Linkage fra fonti

(amministrative fra loro, amministrative con censimento e indagini)

- Analisi aggregata e individuale

• Il censimento del 2011 con le sue innovazioni

- Obiettivi di conteggio a livello disaggregato territoriale

- Più veloce rilascio dei dati

- Link censimento-registri

- Link censimento-indagini

- Analisi trasversale e longitudinale• Le indagini

- Collegamento fra indagini, analisi longitudinale retrospettiva e analisi delle biografie retrospettive

Le fonti statistiche tra continuità e innovazione: oggi…

Page 5: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• L’utilizzo futuro delle fonti amministrative- Linkage fra fonti (amministrative fra loro,

amministrative con censimento e indagini)- Analisi individuale e aggregata

• Il censimento permanente- Link censimento-registri- Link censimento-indagini

• Le indagini future- Indagini panel fatte per l’analisi longitudinale

• Il futuro delle statistiche demografiche- I registri - I micro-dati- I big data

Le fonti statistiche tra continuità e innovazione: …e domani

LINK CENSIMENTO INDAGINI

Page 6: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• Scopo dell’integrazione dei dati è quello di combinare dati contenuti in più fonti ma che fanno riferimento a:

• (1) Una stessa unità statistica Record linkage• (2) Unità statistiche con profili simili Matching Statistico

• Vantaggio: possibilità di studiare relazioni altrimenti non indagabili con i dati a disposizione.

• Rispetto alla conduzione di una nuova indagine l’integrazione dei dati consente:

• La riduzione dei costi;• La riduzione dei tempi;• La riduzione del “respondent burden”.

• Una coppia di record contenuta in dataset differenti viene classificata come appartenente ad una stessa unità statistica a seconda delle realizzazioni registrate nella/e variabile/i chiave

• Requisito minimo: almeno una variabile in comune nei due dataset

Una digressione: il record linkage

Page 7: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

Le fasi del record linkage

Page 8: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• Demografia come base informativa per il disegno delle politiche sociali [previdenziali, assistenziali, familiari...]

• Forte incremento della domanda di informazione da parte dei policy maker.

• Il micro-dato [dato elementare riferito al singolo individuo] diventa strumento essenziale per la valutazione dell’impatto delle politiche.

Cambio di paradigma

• Dalla demografia descrittiva (demographic analysis) a una demografia che interpreta i fenomeni e ricerca le causalità (population studies).

• Dall’approccio macro/trasversale all’approccio micro/longitudinale.

• Dagli individui al corso di vita per studiare il mutamento e le sue determinanti.

Le richieste informative attuali per ISTAT e SISTAN

Page 9: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• Le indagini campionarie sono divenute sempre più costose. I tassi di risposta sono in diminuzione ed è necessario contenere il fastidio statistico sui rispondenti.

• La digitalizzazione dei dati amministrativi e il miglioramento delle tecniche di matching fra i dati permettono di fare maggiore ricorso alle fonti amministrative.

• Le nuove tecnologie hanno aumentato la capacità di archiviare, processare e analizzare quantità sempre maggiori di dati

• Studio dei cambiamenti sociali attraverso l’analisi delle biografie.

• Studio dei fattori che influiscono sulle biografie.

• L’analisi dinamica dei comportamenti e dei contesti

Le conseguenze in termini di raccolta e uso di dati

Page 10: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

La capacità di estrare informazioni dai dati è legata alla integrazione di fonti diverse. La statistica e le statistiche devono fornire informazioni, che portano alla conoscenza dei fenomeni e che aiutano gli operatori a prendere decisioni

Integrazione delle fonti

Survey Fonti amministrative

Questo è un processo intrapreso da molti Istituti di statistica dei paesi avanzati

Page 11: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• Il sistema dei Registri deriva dall’utilizzo di fonti amministrative, magari arricchite con indagini

• Il Registro Base degli Individui e delle Famiglie (RBI) dovrà rappresentare

1)il riferimento per tutte le statistiche ufficiali sullapopolazione, censimento permanente e statistiche demografiche;

2) l’assicurazione della coerenza fra i conteggi di stock al tempo t e al tempo t+n e i flussi delle dinamica demografica del periodo t-(t+n)

3) la garanzia delle informazioni per la policy

4) il contributo al miglioramento della qualità delle fonti anagrafiche

Il sistema dei Registri

Page 12: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

FASE I:

• RBI sarà alimentato dai dati anagrafici, che si inseriscono nell’Anagrafe Virtuale Statistica che consentirà di ricostruire le storie individuali in termini di occorrenze, calendario, durata e transizioni.

• Possibilità di realizzare una lettura micro-longitudinale di tutti i comportamenti e le relazioni e delle loro rispettive mutazioni

FASE II:

• L’integrazione con altri fonti amministrative consentirà l’arricchimento anche in ottica longitudinale delle informazioni disponibili sulle unità rilevate (individui e famiglie) ad un dettaglio territoriale molto più fine. Queste informazioni confluendo nel registro di base potranno essere messe in connessione con gli eventi del percorso vita.

Il registro degli individui

Page 13: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

E’ in corso di approvazione il Regolamento Europeo sulle indagini sociali che definisce le dimensioni sociali che ogni Istituto è tenuto a rilevare su:

1) Istruzione

2) Reddito e standard di vita

3) Salute

4) Mercato del lavoro

5) Uso ICT

6) Uso del tempo

7) Consumi

Il sistema integrato censimento permanente e indagini sociali

Page 14: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• Creazione di basi di dati dei campioni per integrare la qualità del RBI

• Sfruttamento di tutti i Registri amministrativi

• Miglioramento della qualità anche in termini di tempestività

2017: Disegno e realizzazione dell’indagine pilota per il Master Sample con l’obiettivo di verificare la strategia di rilevazione

2018: (i) Realizzazione del primo impianto del sistema integrato e produzione delle informazioni multi-dimensionali del Censimento permanente

(ii) Creazione del database dei micro-dati delle indagini sociali integrate con l’RBI

Il Censimento permanente

Page 15: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

È opportuno continuare a investire:

• sui dati amministrativi e la loro integrazione al fine di aumentare il dettaglio di analisi e la qualità delle informazioni

• per mettere in connessione a livello micro i fenomeni economici e sociali

• per continuare a fare indagini per il completamento del quadro informativo e per analizzare fenomeni specifici

• per scrivere le storie individuali per analisi di tipo causale tramite le tecniche di event history analysis

In conclusione…

Page 16: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

…una riflessione sui big data

Esempio:• II dati di telefonia mobile aiutano

a rilevare i movimenti delle persone, il pendolarismo, il turismo e l’immigrazione

• Il progetto «Persons&Places» utilizza dati di telefonia mobile per:

- Stimare la popolazione urbana- Stimare la mobilità all’interno

delle città- Pianificare interventi di

emergenza- Valutare i flussi turistici

Page 17: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

Dynamic population mapping using mobile phone data

Deville et al. (2014). Dynamic population mapping using mobile phone data. Proceedings of the National Academy of Sciences, 111(45), 15888-15893. doi: 10.1073/pnas.1408439111

Page 18: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

• http://www.flowminder.org/case-studies/dynamic-population-mapping-using-mobile-phone-data

Dynamic population mapping using mobile phone dataPierre Devillea,b,c,1, Catherine Linardc,d,1,2, Samuel Martine, Marius Gilbertc,d, Forrest R.

Stevensf, Andrea E. Gaughanf, Vincent D. Blondela, and Andrew J. TatemgPNAS - 2014

Page 19: A. Petrucci, I dati socio-demografici e le integrazioni delle fonti

DiSIADIPARTIMENTO DI STATISTICA,INFORMATICA, APPLICAZIONI "GIUSEPPE PARENTI"

[email protected]