Le rilevazioni amministrative a supporto della produzione ... · della produzione statistica...

42
Le rilevazioni amministrative a supporto della produzione statistica ufficiale A.P. Mirto (Istat – ISTAT Ufficio territoriale Sicilia) Università degli Studi di Enna «Kore» – 3 marzo 2016 dati.istat.it

Transcript of Le rilevazioni amministrative a supporto della produzione ... · della produzione statistica...

Le rilevazioni amministrative a supporto della produzione statistica ufficiale A.P. Mirto (Istat – ISTAT Ufficio territoriale Sicilia)

Università degli Studi di Enna «Kore» – 3 marzo 2016

dati.istat.it

Indice

q  Tipi di indagine: le rilevazioni statistiche e amministrative

q  Utilizzo degli archivi amministrativi

q  Trattamento dei dati amministrativi

q  Integrazione

q  Alcuni progetti in Istat

q  Bibliografia e sitografia

Con tecnica di indagine si intende l’insieme delle modalità di contatto delle unità statistiche e di raccolta delle informazioni.

Tipologie principali

indagini dirette indagini indirette

- Intervista diretta (faccia a faccia) - Intervista telefonica - Questionario postale auto-compilato - Questionario web (auto-compilato) - Diario - Tecniche miste (mix delle precedenti)

Utilizzo di dati amministrativi con finalità statistiche

Tipi di indagine

Intervista diretta (o faccia a faccia) L’intervista viene condotta da un rilevatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario riportandovi quindi le risposte così come sono fornite dal rispondente. Modalità di somministrazione del questionario PAPI -> paper and pencil interview CAPI -> computer assisted personal interview Vantaggi: - identifica esattamente il rispondente - l’intervistatore può chiarire il significato delle domande - più adatta per censimenti e campionamenti areali - maggiore possibilità di convincere l’intervistato a fornire le risposte

Svantaggi:- costosa - richiede un apparato organizzativo importante - tempi lunghi - rischi di condizionamento

Indagini dirette

Intervista telefonica – CATI (Computer Assisted Telephone Interview) L’intervistatore contatta il rispondente telefonicamente L’intervista è condotta con il supporto di un computer L’intervistatore legge le domande e registra contestualmente le risposte Vantaggi: - costi minori rispetto intervista faccia a faccia - tempestività nella raccolta dati (data entry contestuale) - non richiede organizzazione sul territorio - possibilità di controllo dell’operato dei rilevatori - bassi rischi di condizionamento Svantaggi:- impossibilità di contattare chi è senza telefono - il rispondente non è identificato con certezza - il questionario non può essere eccessivamente lungo - l’ausilio che l’intervistatore può dare è contenuto

Indagini dirette

Questionario postale auto-compilato (o web autocompilato) Tradizionalmente il rispondente riceve il questionario a mezzo posta o corriere e provvede a compilarlo nelle parti ad esso spettanti restituendolo via posta o tramite un incaricato. Nel caso web il rispondente riceve un link per la compilazione via internet. Vantaggi: - bassi costi di realizzazione - livello di organizzazione contenuto - bassi rischi di condizionamento - il rispondente ha il tempo di reperire le informazioni utili - adatta per i quesiti delicati Svantaggi:- tempi lunghi di raccolta (salvo le risposte web) - impossibilità di identificare il rispondente - autoselezione dei rispondenti - minore capacità di ottenere la partecipazione dei rispondenti

Indagini dirette

Vengono utilizzate quando una sola tecnica di rilevazione è ritenuta non sufficiente alla raccolta dei dati. Esempi di tecniche miste: §  Indagine postale + indagine diretta sui non rispondenti all’indagine

postale §  Indagine telefonica + indagine diretta su coloro che non possiedono il

telefono §  Indagine diretta + questionario individuale §  Diario + intervista finale §  Prima intervista diretta e successive con modalità telefonica §  Dati amministrativi + controllo campionario con questionario postale

autocompilato

Tecniche miste

Si definisce indagine indiretta (o indagine statistica basata su dati di fonte amministrativa) l’indagine che utilizza dati amministrativi con finalità di tipo statistico. Vantaggi: - relativamente economiche da utilizzare a fini statistici - nessun disturbo ai rispondenti - spesso riguardano la totalità della popolazione e sono utili per costruire archivi Svantaggi: - possibili distorsioni dovute alla non coincidenza fra le definizioni usate per i dati amministrativi e quelli interessanti ai fini statistici - le leggi che regolano la raccolta possono cambiare pregiudicando la confrontabilità dei dati nel tempo - lo statistico non è in grado di controllare la qualità della raccolta dei dati

Indagini indirette

Le fonti amministrative

Si definiscono fonti amministrative le informazioni raccolte e conservate da istituzioni pubbliche: •  principalmente non per fini statistici, •  riguardanti persone fisiche o giuridiche nell’ambito del

territorio di competenza •  Per finalità fiscali, pensionistiche, giuridiche o anagrafiche.

Unità amministrative Con riferimento all’utilizzo dei dati amministrativi a fini statistici, sono definite le unità per le quali i dati amministrativi sono registrati Le unità amministrative possono non coincidere con quelle richieste per la raccolta, la produzione o la diffusione di dati statistici.

[Brackstone (1987)]: •la popolazione alla quale interessa riferire l'informazione può non coincidere con quella riguardata dalla raccolta dei dati amministrativi; •i concetti, le definizioni e le classificazioni adottate nella raccolta dei dati amministrativi possono non coincidere con quelli della ricerca statistica; •la qualità delle informazioni contenute nei dati amministrativi può non essere sufficiente per gli obiettivi della ricerca; •la disponibilità dei dati in tempi utili alle necessità di informazione statistica può non essere garantita.

Alcuni limiti dei dati amministrativi

L’uso dei Dati Ammnistrativi (DA) per fini statistici è andato crescendo nell’ultimo decennio per la maggior parte degli Istituti Nazionali di Statistica (INS). In Istat i data set di fonte amministrativa acquisiti per finalità statistiche sono cresciuti da 90 nel 2009 a 230 nel 2014 La strategia dell’Istat: creazione di un ufficio dedicato alla acquisizione e integrazione dei dati ammnistrativi stotto la Direzione degli Archivi e Registri Statistici

Uso dei dati amministrativi in Istat

Servizio di acquisizione e integrazione dei dati amministrativi (ADA), Ha il compito di: •  acquisire, trattare, valorizzare e fornire a fini statistici gli archivi

amministrativi relativi ad aziende agricole, imprese, istituzioni pubbliche, istituzioni non profit, famiglie e individui;

•  coordinare e gestire l’interscambio di dati con gli enti titolari di fonti amministrative;

•  progettare, realizzare e gestire il Sistema Integrato di Microdati (SIM) relativi a famiglie, individui e unità economiche,

•  sviluppare e mantenere la documentazione sulle fonti e sui metodi di integrazione utilizzati.

Uso dei dati amministrativi in Istat

•  I sistemi di integrazione sono sviluppati su l la base del la t ipologia d i dat i amministrativi disponibili

•  Individuare la presenza della stessa unità

elementare (persona fisica, persona giuridica, luogo, relazione) nelle diverse f o n t i a t t r i b u e n d o u n a c h i a v e d i identificazione univoca e stabile nel tempo

•  In alcuni dei sottosistemi sono stati definiti collegamenti diretti tra le fonti creando una struttura di relazioni a ‘tela di ragno’ in cui ogni archivio è collegato con tutti gli altri entrati a far parte del sistema e tutti sono collegati con la base per l’integrazione

Integrazione dei dati amministrativi in Istat

Nuovo schema organizzativo in Istat

ASIA

Censimento imprese

Censimento istituzioni non profit

Censimento istituzioni pubbliche

Censimenti economici

Asia imprese

Asia Unità locali

Registri statistici: fonti statistiche e amministrative

I principali archivi amministrativi che forniscono informazioni sugli indirizzi nei quali l’impresa svolge le proprie attività sono: -  Gli archivi gestiti dall’Agenzia delle entrate per

conto del Ministero dell’Economia e delle finanze, quali l’Anagrafe tributaria, le Dichiarazioni annuali delle imposte indirette, le Dichiarazioni dell’imposta regionale sulle attività produttive (Irap);

-  Gli archivi gestiti dalle Camere di commercio, industria, artigianato e agricoltura, quali il Registro delle imprese e il Modello unico di dichiarazione ambientale (Mud);

-  L’Archivio delle dichiarazioni retributive (Emens) gestito dall’Istituto nazionale di previdenza sociale;

-  L’Archivio delle utenze telefoniche gestito dalla Consodata s.p.a. (gruppo Seat-Pagine gialle);

-  L’Archivio degli istituti di credito gestito dalla Banca d’Italia;

-  L’Archivio della grande distribuzione gestito dalla società Ac-Nielsen.

Asia Occupazione

Farm register

Dati strutturali Metodi di produzione

Sostenibilità e caratteri

economici

Censimento agricoltura

AGEA

Registri statistici: fonti statistiche e amministrative Anagrafi

zootecniche

“Depositi” di dati che servono a integrare le informazioni contenute nei diversi Data Base amministrativi e relativi a uno specifico insieme di unità di analisi. La loro strutturazione fisica, pur seguendo una logica comune, dipende dal particolare sottosistema di integrazione a cui si riferiscono. In generale, le Basi per l’integrazione contengono: •  Il codice dell’archivio; •  Il codice identificativo dell’unita di analisi nel sottosistema di •  integrazione; •  Il progressivo dell’unità di analisi all’interno di ciascun archivio di •  provenienza del quale esso costituisce un’istanza; •  Il valore della variabile d’integrazione1 presente nell’archivio per •  quell’elemento; •  Il valore della variabile d’integrazioneN presente nell’archivio per •  quell’elemento; •  La data di primo inserimento; •  La data di ultimo aggiornamento.

Basi per l’integrazione

Identificare ogni entità (famiglia; individuo; unità; loro relazioni) in fonti diverse con un numero ID univoco e stabile (nel tempo). Definire, per ogni entità, le relazioni logiche e fisiche (nel tempo e nello spazio) tra le informazioni disponibili da fonti diverse. Realizzare strutture dati con unità elementari appartenenti a popolazioni statistiche specifiche (famiglie, studenti, lavoratori, luogo di lavoro, ...) utili a: •  Realizzare registri statistici (persone, residenti abituali, unità •  economiche, …) •  Realizzare sottosistemi di informazioni statistiche (lavoro, mobilità, •  istruzione, reddito, …) •  Sostenere le indagini statistiche.

SIM: Sistema Integrato di Microdati

Sottosistemi SIM

Obiettivo: ampliamento dell’offerta informativa dell’ISTAT mediante produzione di collezioni di dati elementari di tipo longitudinale (ad es. percorsi sociali ed economici) e crossection, da rendere disponibili all’utenza Utili alla ricerca sociale ed economica, alla programmazione territoriale e settoriale, alla valutazione delle politiche pubbliche a livello nazionale, regionale e locale. Valorizzazione dei contenuti informativi di fonti amministrative «integrate» presenti in SIM. Inversione del flusso delle informazioni elementari (esclusivamente per finalità statistiche) dall’Istat ad altri enti pubblici. Riutilizzazione di metodi, modelli e «sintassi» già sviluppati dentro e all’esterno dell’ISTAT.

Da SIM ad ARCHIMEDE

•  Popolazione Insistente (Mobilità sul territorio; Realizzazione Sis. Inf. Persons&Places; Identificazione delle tipologie di «city users»: residenti, temporaneamente dimoranti, pendolari; •  Precarietà Lavorativa (analizzare caratteristiche economico

lavorative e aspetti socioanagrafici di un universo di individui definiti «lavoratori precari» osservandone le trasformazioni nel tempo)

•  Precarietà Socioeconomica delle famiglie (classificazione socioeconomica delle famiglie secondo le dimensioni: tipologia della famiglia; reddito; condizione lavorativa; disagio (disabilità, pensioni al minimo, cittadinanza, istruzione)

Progetti di ARCHIMEDE

Surveydata

Registerdata

Input

DataTreatment(transforma8on

func8on)

Administra8vedata

Usersta(s(csoriented

Producersta(s(csoriented DataTreatment

(transforma8onfunc8on)

Sta8s8cal Output

Quality Report Card for Administrative Data

Valutazione della qualità di AD

HYPERDIMENSION DIMENSION

SOURCE F1. Information on ADSs

information needed to manage the AD acquisition process with the aim of evaluating and improving the quality of the acquired data

F2. AD source relevance

F3. Privacy e security in using AD

F4. Arrangements for the data delivery

F5. Relationships and feedback with administrative source holder

METADATA M1. Clarity and interpretabilityInformation for the quality assessment at the conceptual level and description of the acquisition procedures

M2. Comparability

M3. Data acquisition/treatment (by AD source holder)

DATA D1. Technical checks

Quality evaluation indicators for AD supplied

D2. Integrability

D3. Accuracy

D4. Completeness

D5. Time-related dimension

AD quality framework for AD

•  Il sistema di controllo della qualità dei dati dovrebbe essere quanto

più possibile automatizzato ma esistono alcune differenze:

•  Rilevanza: uno specifico report per ogni fonte deve essere stilato sulla base di un questionario somministrato agli utilizzatori

•  Chiarezza: riguarda l’acquisizione oltre che dei dati anche dell’aparato dei metadati da parte del tenutario degli AD

•  Comparabilità: deve essere assicurata creando un sistema ponte per le principali definizioni e classificazioni attraverso quelle disponibili su I.stat

Il sistema di controllo della qualità

L'utilizzo a scopo statistico degli archivi amministrativi da parte di una platea di soggetti sempre più estesa richiede la predisposizione delle condizioni affinché ciò possa avvenire in modo agevole ed efficiente a partire dall'accesso alla necessaria informazione sulle caratteristiche strutturali degli archivi e sulla loro qualità, intesa in senso multidimensionale. Un primo aspetto è la disponibilità di documentazione completa e articolata dei contenuti dell'archivio, vale a dire la possibilità di acquisire conoscenza puntuale dei collettivi di tipo popolazione o evento ai quali sono riferite le informazioni in esso gestite, delle variabili osservate per ciascun elemento di ogni collettivo con le relative classificazioni, degli identificativi utilizzati per gli elementi di ogni collettivo, delle relazioni che legano gli elementi dei collettivi, e di disporre di definizioni quanto più accurate possibile dei collettivi stessi e delle variabili. Ulteriori dimensioni della qualità rilevanti per gli archivi amministrativi quando sono utilizzati a scopo statistico sono: la copertura dei collettivi osservati, la tempestività della raccolta dei dati, la presenza e la natura degli errori di misura e la possibilità di correggerli.

Il framework per la qualità degli archivi amministrativi

DARCAP - DOCUMENTAZIONE DEGLI ARCHIVI DELLE AMMINISTRAZIONI PUBBLICHE La strategia dell’Istat per il coordinamento della modulistica amministrativa si impernia sulle seguenti attività: -  conduzione di istruttorie su ciascun archivio amministrativo,

consistenti nell'analisi dei relativi contenuti secondo un modello concettuale standard, nello studio della qualità per finalità statistiche, nella formulazione di raccomandazioni;

- realizzazione di rilevazioni sugli archivi gestiti dagli enti territoriali; - rilascio di valutazioni tecnico-metodologiche sui progetti di innovazione relativi agli archivi amministrativi e ai moduli che li alimentano, comunicati all'Istat dall'ente titolare.

Inoltre l'Istat è impegnato a fornire ai soggetti del Sistema una serie di strumenti di supporto alla standardizzazione dei contenuti e, in generale, all'armonizzazione delle fonti statistiche e amministrative. I l p r i m o d i q u e s t i s t r u m e n t i è i l Sistema per la diffusione delle classificazioni ufficiali.

Progetto sperimentale di costruzione di SITU •  Collaborazione tra Istat, Servizio Statistica e Analisi economica e

Osservatorio turistico della Regione Siciliana, stipulata in base alla lettera di intenti Turismo (prot. Istat n. 49 del 3 febbraio 2015) finalizzata alla realizzazione di un Sistema Informativo Trasversale sul Turismo (SITU)

•  WP fonti locali avrà cura di selezionare le fonti provenienti dai diversi Assessorati della Regione Siciliana (o di altri enti regionali) che detengono archivi statistici e/o amministrativi su dati riguardanti il turismo e i settori e i fenomeni a esso collegati. L’identificazione delle fonti a carattere locale sarà guidata dallo strumento di intervista tramite peer review, il trattamento sarà invece gestito in base alla compilazione di un template qualità.

•  WP fonti nazionali si occuperà di selezionare quelle fonti di carattere nazionale (cioè provenienti da Ministeri o altri enti a carattere nazionale quali Banca d’Italia, Unioncamere, ISPRA, Legambiente,…) che riguardano anch’esse il tema turismo e quelli a esso collegati. Anche in questo caso sarà importante la fase di trattamento attraverso la scheda di template qualità.

•  Per la diffusione dei dati sul turismo, si ipotizza di sfruttare il nodo Sicilia Sistan Hub. Il Sistan Hub è un sistema per la pubblicazione di macrodati di diffusione prodotti dagli enti Sistan che aderiscono al progetto, con l’obiettivo di creare un unico punto di accesso e una vista univoca sulla produzione dati del Sistan, consentendo all’utente finale di navigare il catalogo dei dataset pubblicati e scaricare in modo agevole dataset o porzioni di dataset sui vari nodi.

•  Il SITU sfrutta lo standard SDMX attualmente prodotto da 7 organizzazioni internazionali (Eurostat, Fondo Monetario Internazionale, Banca Mondiale, Nazioni Unite, OECD, Bank of European Settlements, European Central Bank). SDMX è oggi lo standard più affermato per lo scambio e la condivisione di dati statistici nella comunità statistica globale e su di esso sono basati molti progetti Stat2015 in Istat.

Nodo Sicilia di Sistan Hub attraverso SDMX

Peer Review

Intervista alla pari con gli Enti detentori di archivi amministrativi

Documentazione dei processi amministrativi per fini statistici in accordo al Template Qualità

Template qualità

SPERIMENTAZIONE NELL’AMBITO DEL PROGETTO “PERSONS AND PLACES – POPOLAZIONE INSISTENTE E CITY USERS”.

Nel contesto degli studi dedicati all’utilizzo dei Big Data per le finalità della statistica ufficiale verrà sviluppato un progetto teso a sperimentare l’uso integrato di dati anonimizzati di telefonia mobile e di dati amministrativi per migliorare la qualità delle stime dei flussi di popolazione intercomunale. Il test sarà condotto dall’Istat nell’ambito del progetto Persons and Places - Popolazione insistente e city users, utilizzando congiuntamente dati da sistema informativo statistico e dati che saranno forniti dalla compagnia telefonica Wind.

I dati di telefonia mobile, da acquisire presso Wind, sono i Call Detail Records (CDR), relativi alle chiamate effettuate dagli utenti in un territorio predefinito e in un arco di tempo stabilito. I dati saranno relativi al seguente insieme di variabili: progressivo (anonimizzato) corrispondente all’utente che effettua le chiamate; codice del Comune all’interno del quale si trova la cella da cui proviene la chiamata; data e ora della chiamata.

Progetto bes

Rapporto Bes

Dashboard

Pubblicazione on line Noi Italia

Le pubblicazioni: le “edizioni chiave” Principali pubblicazioni di carattere generale, che presentano una sintesi su

tutta la produzione dell'Istituto (formato pdf con tavole su foglio elettronico):

Annuario statistico italiano offre un ritratto completo del Paese sui principali temi di interesse; i dati sono accompagnati da un confronto con i quattro anni precedenti e da una descrizione di sintesi, per accompagnare l’utente nell’approfondimento dei fenomeni.

Rapporto annuale focalizza l’attenzione sulla situazione più attuale, facendo riferimento ai dati più recenti. Contiene un'analisi documentata sulla situazione del Paese, in termini di dinamiche macroeconomiche e sociali, sulle trasformazioni e i problemi emergenti.

Noi Italia attraverso 120 indicatori distribuiti su 19 settori di interesse, offre un quadro d’insieme del Paese, degli aspetti economici, sociali, demografici e ambientali, del suo posizionamento nel contesto europeo, delle differenze regionali e delle dinamiche nel tempo.

Italia in cifre presenta un profilo sintetico dell'Italia e dei suoi aspetti economici, demografici, sociali e territoriali. Completo di glossari e note metodologiche, consente la fruibilità del patrimonio informativo anche a un pubblico di non addetti ai lavori, per il suo carattere divulgativo.

Daas et al. (2009) Checklist for the Quality evaluation of AD Sources. Discussion paper 09042, Statistics Netherlands.

Daas et al. (2011) Reports on methods preferred for the quality

indicators of administrative data sources, Deliverable 4.2 of Workpackage 4 of the BLUE-ETS project. CBS, Netherlands, SSB, Norway, Istat, Italy, SCB, Sweden.

United Nations (2007), Register-based statistics in Nordic countries.

www.unece.org/index.php?id=17470 Bo Sundgren: Towards a system of official statistics based on a coherent combination of data sources, including surveys and administrative data. http://www.divaportal. org/smash/get/diva2:469622/FULLTEXT01.pdf G. Di Bella, S. Ambroselli: Towards a more efficient system of administrative data management and quality evaluation to support s t a t i s t i c s p r o d u c t i o n i n I s t a t . http://www.q2014.at/papers-presentations.html

Bibliografia

Grazie per l’attenzione [email protected]