Le rilevazioni amministrative a supporto della produzione ... · della produzione statistica...
-
Upload
hoangthuan -
Category
Documents
-
view
216 -
download
0
Transcript of Le rilevazioni amministrative a supporto della produzione ... · della produzione statistica...
Le rilevazioni amministrative a supporto della produzione statistica ufficiale A.P. Mirto (Istat – ISTAT Ufficio territoriale Sicilia)
Università degli Studi di Enna «Kore» – 3 marzo 2016
dati.istat.it
Indice
q Tipi di indagine: le rilevazioni statistiche e amministrative
q Utilizzo degli archivi amministrativi
q Trattamento dei dati amministrativi
q Integrazione
q Alcuni progetti in Istat
q Bibliografia e sitografia
Con tecnica di indagine si intende l’insieme delle modalità di contatto delle unità statistiche e di raccolta delle informazioni.
Tipologie principali
indagini dirette indagini indirette
- Intervista diretta (faccia a faccia) - Intervista telefonica - Questionario postale auto-compilato - Questionario web (auto-compilato) - Diario - Tecniche miste (mix delle precedenti)
Utilizzo di dati amministrativi con finalità statistiche
Tipi di indagine
Intervista diretta (o faccia a faccia) L’intervista viene condotta da un rilevatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario riportandovi quindi le risposte così come sono fornite dal rispondente. Modalità di somministrazione del questionario PAPI -> paper and pencil interview CAPI -> computer assisted personal interview Vantaggi: - identifica esattamente il rispondente - l’intervistatore può chiarire il significato delle domande - più adatta per censimenti e campionamenti areali - maggiore possibilità di convincere l’intervistato a fornire le risposte
Svantaggi:- costosa - richiede un apparato organizzativo importante - tempi lunghi - rischi di condizionamento
Indagini dirette
Intervista telefonica – CATI (Computer Assisted Telephone Interview) L’intervistatore contatta il rispondente telefonicamente L’intervista è condotta con il supporto di un computer L’intervistatore legge le domande e registra contestualmente le risposte Vantaggi: - costi minori rispetto intervista faccia a faccia - tempestività nella raccolta dati (data entry contestuale) - non richiede organizzazione sul territorio - possibilità di controllo dell’operato dei rilevatori - bassi rischi di condizionamento Svantaggi:- impossibilità di contattare chi è senza telefono - il rispondente non è identificato con certezza - il questionario non può essere eccessivamente lungo - l’ausilio che l’intervistatore può dare è contenuto
Indagini dirette
Questionario postale auto-compilato (o web autocompilato) Tradizionalmente il rispondente riceve il questionario a mezzo posta o corriere e provvede a compilarlo nelle parti ad esso spettanti restituendolo via posta o tramite un incaricato. Nel caso web il rispondente riceve un link per la compilazione via internet. Vantaggi: - bassi costi di realizzazione - livello di organizzazione contenuto - bassi rischi di condizionamento - il rispondente ha il tempo di reperire le informazioni utili - adatta per i quesiti delicati Svantaggi:- tempi lunghi di raccolta (salvo le risposte web) - impossibilità di identificare il rispondente - autoselezione dei rispondenti - minore capacità di ottenere la partecipazione dei rispondenti
Indagini dirette
Vengono utilizzate quando una sola tecnica di rilevazione è ritenuta non sufficiente alla raccolta dei dati. Esempi di tecniche miste: § Indagine postale + indagine diretta sui non rispondenti all’indagine
postale § Indagine telefonica + indagine diretta su coloro che non possiedono il
telefono § Indagine diretta + questionario individuale § Diario + intervista finale § Prima intervista diretta e successive con modalità telefonica § Dati amministrativi + controllo campionario con questionario postale
autocompilato
Tecniche miste
Si definisce indagine indiretta (o indagine statistica basata su dati di fonte amministrativa) l’indagine che utilizza dati amministrativi con finalità di tipo statistico. Vantaggi: - relativamente economiche da utilizzare a fini statistici - nessun disturbo ai rispondenti - spesso riguardano la totalità della popolazione e sono utili per costruire archivi Svantaggi: - possibili distorsioni dovute alla non coincidenza fra le definizioni usate per i dati amministrativi e quelli interessanti ai fini statistici - le leggi che regolano la raccolta possono cambiare pregiudicando la confrontabilità dei dati nel tempo - lo statistico non è in grado di controllare la qualità della raccolta dei dati
Indagini indirette
Le fonti amministrative
Si definiscono fonti amministrative le informazioni raccolte e conservate da istituzioni pubbliche: • principalmente non per fini statistici, • riguardanti persone fisiche o giuridiche nell’ambito del
territorio di competenza • Per finalità fiscali, pensionistiche, giuridiche o anagrafiche.
Unità amministrative Con riferimento all’utilizzo dei dati amministrativi a fini statistici, sono definite le unità per le quali i dati amministrativi sono registrati Le unità amministrative possono non coincidere con quelle richieste per la raccolta, la produzione o la diffusione di dati statistici.
[Brackstone (1987)]: •la popolazione alla quale interessa riferire l'informazione può non coincidere con quella riguardata dalla raccolta dei dati amministrativi; •i concetti, le definizioni e le classificazioni adottate nella raccolta dei dati amministrativi possono non coincidere con quelli della ricerca statistica; •la qualità delle informazioni contenute nei dati amministrativi può non essere sufficiente per gli obiettivi della ricerca; •la disponibilità dei dati in tempi utili alle necessità di informazione statistica può non essere garantita.
Alcuni limiti dei dati amministrativi
L’uso dei Dati Ammnistrativi (DA) per fini statistici è andato crescendo nell’ultimo decennio per la maggior parte degli Istituti Nazionali di Statistica (INS). In Istat i data set di fonte amministrativa acquisiti per finalità statistiche sono cresciuti da 90 nel 2009 a 230 nel 2014 La strategia dell’Istat: creazione di un ufficio dedicato alla acquisizione e integrazione dei dati ammnistrativi stotto la Direzione degli Archivi e Registri Statistici
Uso dei dati amministrativi in Istat
Servizio di acquisizione e integrazione dei dati amministrativi (ADA), Ha il compito di: • acquisire, trattare, valorizzare e fornire a fini statistici gli archivi
amministrativi relativi ad aziende agricole, imprese, istituzioni pubbliche, istituzioni non profit, famiglie e individui;
• coordinare e gestire l’interscambio di dati con gli enti titolari di fonti amministrative;
• progettare, realizzare e gestire il Sistema Integrato di Microdati (SIM) relativi a famiglie, individui e unità economiche,
• sviluppare e mantenere la documentazione sulle fonti e sui metodi di integrazione utilizzati.
Uso dei dati amministrativi in Istat
• I sistemi di integrazione sono sviluppati su l la base del la t ipologia d i dat i amministrativi disponibili
• Individuare la presenza della stessa unità
elementare (persona fisica, persona giuridica, luogo, relazione) nelle diverse f o n t i a t t r i b u e n d o u n a c h i a v e d i identificazione univoca e stabile nel tempo
• In alcuni dei sottosistemi sono stati definiti collegamenti diretti tra le fonti creando una struttura di relazioni a ‘tela di ragno’ in cui ogni archivio è collegato con tutti gli altri entrati a far parte del sistema e tutti sono collegati con la base per l’integrazione
Integrazione dei dati amministrativi in Istat
ASIA
Censimento imprese
Censimento istituzioni non profit
Censimento istituzioni pubbliche
Censimenti economici
Asia imprese
Asia Unità locali
Registri statistici: fonti statistiche e amministrative
I principali archivi amministrativi che forniscono informazioni sugli indirizzi nei quali l’impresa svolge le proprie attività sono: - Gli archivi gestiti dall’Agenzia delle entrate per
conto del Ministero dell’Economia e delle finanze, quali l’Anagrafe tributaria, le Dichiarazioni annuali delle imposte indirette, le Dichiarazioni dell’imposta regionale sulle attività produttive (Irap);
- Gli archivi gestiti dalle Camere di commercio, industria, artigianato e agricoltura, quali il Registro delle imprese e il Modello unico di dichiarazione ambientale (Mud);
- L’Archivio delle dichiarazioni retributive (Emens) gestito dall’Istituto nazionale di previdenza sociale;
- L’Archivio delle utenze telefoniche gestito dalla Consodata s.p.a. (gruppo Seat-Pagine gialle);
- L’Archivio degli istituti di credito gestito dalla Banca d’Italia;
- L’Archivio della grande distribuzione gestito dalla società Ac-Nielsen.
Asia Occupazione
Farm register
Dati strutturali Metodi di produzione
Sostenibilità e caratteri
economici
Censimento agricoltura
AGEA
Registri statistici: fonti statistiche e amministrative Anagrafi
zootecniche
“Depositi” di dati che servono a integrare le informazioni contenute nei diversi Data Base amministrativi e relativi a uno specifico insieme di unità di analisi. La loro strutturazione fisica, pur seguendo una logica comune, dipende dal particolare sottosistema di integrazione a cui si riferiscono. In generale, le Basi per l’integrazione contengono: • Il codice dell’archivio; • Il codice identificativo dell’unita di analisi nel sottosistema di • integrazione; • Il progressivo dell’unità di analisi all’interno di ciascun archivio di • provenienza del quale esso costituisce un’istanza; • Il valore della variabile d’integrazione1 presente nell’archivio per • quell’elemento; • Il valore della variabile d’integrazioneN presente nell’archivio per • quell’elemento; • La data di primo inserimento; • La data di ultimo aggiornamento.
Basi per l’integrazione
Identificare ogni entità (famiglia; individuo; unità; loro relazioni) in fonti diverse con un numero ID univoco e stabile (nel tempo). Definire, per ogni entità, le relazioni logiche e fisiche (nel tempo e nello spazio) tra le informazioni disponibili da fonti diverse. Realizzare strutture dati con unità elementari appartenenti a popolazioni statistiche specifiche (famiglie, studenti, lavoratori, luogo di lavoro, ...) utili a: • Realizzare registri statistici (persone, residenti abituali, unità • economiche, …) • Realizzare sottosistemi di informazioni statistiche (lavoro, mobilità, • istruzione, reddito, …) • Sostenere le indagini statistiche.
SIM: Sistema Integrato di Microdati
Obiettivo: ampliamento dell’offerta informativa dell’ISTAT mediante produzione di collezioni di dati elementari di tipo longitudinale (ad es. percorsi sociali ed economici) e crossection, da rendere disponibili all’utenza Utili alla ricerca sociale ed economica, alla programmazione territoriale e settoriale, alla valutazione delle politiche pubbliche a livello nazionale, regionale e locale. Valorizzazione dei contenuti informativi di fonti amministrative «integrate» presenti in SIM. Inversione del flusso delle informazioni elementari (esclusivamente per finalità statistiche) dall’Istat ad altri enti pubblici. Riutilizzazione di metodi, modelli e «sintassi» già sviluppati dentro e all’esterno dell’ISTAT.
Da SIM ad ARCHIMEDE
• Popolazione Insistente (Mobilità sul territorio; Realizzazione Sis. Inf. Persons&Places; Identificazione delle tipologie di «city users»: residenti, temporaneamente dimoranti, pendolari; • Precarietà Lavorativa (analizzare caratteristiche economico
lavorative e aspetti socioanagrafici di un universo di individui definiti «lavoratori precari» osservandone le trasformazioni nel tempo)
• Precarietà Socioeconomica delle famiglie (classificazione socioeconomica delle famiglie secondo le dimensioni: tipologia della famiglia; reddito; condizione lavorativa; disagio (disabilità, pensioni al minimo, cittadinanza, istruzione)
Progetti di ARCHIMEDE
Surveydata
Registerdata
Input
DataTreatment(transforma8on
func8on)
Administra8vedata
Usersta(s(csoriented
Producersta(s(csoriented DataTreatment
(transforma8onfunc8on)
Sta8s8cal Output
Quality Report Card for Administrative Data
Valutazione della qualità di AD
HYPERDIMENSION DIMENSION
SOURCE F1. Information on ADSs
information needed to manage the AD acquisition process with the aim of evaluating and improving the quality of the acquired data
F2. AD source relevance
F3. Privacy e security in using AD
F4. Arrangements for the data delivery
F5. Relationships and feedback with administrative source holder
METADATA M1. Clarity and interpretabilityInformation for the quality assessment at the conceptual level and description of the acquisition procedures
M2. Comparability
M3. Data acquisition/treatment (by AD source holder)
DATA D1. Technical checks
Quality evaluation indicators for AD supplied
D2. Integrability
D3. Accuracy
D4. Completeness
D5. Time-related dimension
AD quality framework for AD
• Il sistema di controllo della qualità dei dati dovrebbe essere quanto
più possibile automatizzato ma esistono alcune differenze:
• Rilevanza: uno specifico report per ogni fonte deve essere stilato sulla base di un questionario somministrato agli utilizzatori
• Chiarezza: riguarda l’acquisizione oltre che dei dati anche dell’aparato dei metadati da parte del tenutario degli AD
• Comparabilità: deve essere assicurata creando un sistema ponte per le principali definizioni e classificazioni attraverso quelle disponibili su I.stat
Il sistema di controllo della qualità
L'utilizzo a scopo statistico degli archivi amministrativi da parte di una platea di soggetti sempre più estesa richiede la predisposizione delle condizioni affinché ciò possa avvenire in modo agevole ed efficiente a partire dall'accesso alla necessaria informazione sulle caratteristiche strutturali degli archivi e sulla loro qualità, intesa in senso multidimensionale. Un primo aspetto è la disponibilità di documentazione completa e articolata dei contenuti dell'archivio, vale a dire la possibilità di acquisire conoscenza puntuale dei collettivi di tipo popolazione o evento ai quali sono riferite le informazioni in esso gestite, delle variabili osservate per ciascun elemento di ogni collettivo con le relative classificazioni, degli identificativi utilizzati per gli elementi di ogni collettivo, delle relazioni che legano gli elementi dei collettivi, e di disporre di definizioni quanto più accurate possibile dei collettivi stessi e delle variabili. Ulteriori dimensioni della qualità rilevanti per gli archivi amministrativi quando sono utilizzati a scopo statistico sono: la copertura dei collettivi osservati, la tempestività della raccolta dei dati, la presenza e la natura degli errori di misura e la possibilità di correggerli.
Il framework per la qualità degli archivi amministrativi
DARCAP - DOCUMENTAZIONE DEGLI ARCHIVI DELLE AMMINISTRAZIONI PUBBLICHE La strategia dell’Istat per il coordinamento della modulistica amministrativa si impernia sulle seguenti attività: - conduzione di istruttorie su ciascun archivio amministrativo,
consistenti nell'analisi dei relativi contenuti secondo un modello concettuale standard, nello studio della qualità per finalità statistiche, nella formulazione di raccomandazioni;
- realizzazione di rilevazioni sugli archivi gestiti dagli enti territoriali; - rilascio di valutazioni tecnico-metodologiche sui progetti di innovazione relativi agli archivi amministrativi e ai moduli che li alimentano, comunicati all'Istat dall'ente titolare.
Inoltre l'Istat è impegnato a fornire ai soggetti del Sistema una serie di strumenti di supporto alla standardizzazione dei contenuti e, in generale, all'armonizzazione delle fonti statistiche e amministrative. I l p r i m o d i q u e s t i s t r u m e n t i è i l Sistema per la diffusione delle classificazioni ufficiali.
Progetto sperimentale di costruzione di SITU • Collaborazione tra Istat, Servizio Statistica e Analisi economica e
Osservatorio turistico della Regione Siciliana, stipulata in base alla lettera di intenti Turismo (prot. Istat n. 49 del 3 febbraio 2015) finalizzata alla realizzazione di un Sistema Informativo Trasversale sul Turismo (SITU)
• WP fonti locali avrà cura di selezionare le fonti provenienti dai diversi Assessorati della Regione Siciliana (o di altri enti regionali) che detengono archivi statistici e/o amministrativi su dati riguardanti il turismo e i settori e i fenomeni a esso collegati. L’identificazione delle fonti a carattere locale sarà guidata dallo strumento di intervista tramite peer review, il trattamento sarà invece gestito in base alla compilazione di un template qualità.
• WP fonti nazionali si occuperà di selezionare quelle fonti di carattere nazionale (cioè provenienti da Ministeri o altri enti a carattere nazionale quali Banca d’Italia, Unioncamere, ISPRA, Legambiente,…) che riguardano anch’esse il tema turismo e quelli a esso collegati. Anche in questo caso sarà importante la fase di trattamento attraverso la scheda di template qualità.
• Per la diffusione dei dati sul turismo, si ipotizza di sfruttare il nodo Sicilia Sistan Hub. Il Sistan Hub è un sistema per la pubblicazione di macrodati di diffusione prodotti dagli enti Sistan che aderiscono al progetto, con l’obiettivo di creare un unico punto di accesso e una vista univoca sulla produzione dati del Sistan, consentendo all’utente finale di navigare il catalogo dei dataset pubblicati e scaricare in modo agevole dataset o porzioni di dataset sui vari nodi.
• Il SITU sfrutta lo standard SDMX attualmente prodotto da 7 organizzazioni internazionali (Eurostat, Fondo Monetario Internazionale, Banca Mondiale, Nazioni Unite, OECD, Bank of European Settlements, European Central Bank). SDMX è oggi lo standard più affermato per lo scambio e la condivisione di dati statistici nella comunità statistica globale e su di esso sono basati molti progetti Stat2015 in Istat.
Nodo Sicilia di Sistan Hub attraverso SDMX
Documentazione dei processi amministrativi per fini statistici in accordo al Template Qualità
Template qualità
SPERIMENTAZIONE NELL’AMBITO DEL PROGETTO “PERSONS AND PLACES – POPOLAZIONE INSISTENTE E CITY USERS”.
Nel contesto degli studi dedicati all’utilizzo dei Big Data per le finalità della statistica ufficiale verrà sviluppato un progetto teso a sperimentare l’uso integrato di dati anonimizzati di telefonia mobile e di dati amministrativi per migliorare la qualità delle stime dei flussi di popolazione intercomunale. Il test sarà condotto dall’Istat nell’ambito del progetto Persons and Places - Popolazione insistente e city users, utilizzando congiuntamente dati da sistema informativo statistico e dati che saranno forniti dalla compagnia telefonica Wind.
I dati di telefonia mobile, da acquisire presso Wind, sono i Call Detail Records (CDR), relativi alle chiamate effettuate dagli utenti in un territorio predefinito e in un arco di tempo stabilito. I dati saranno relativi al seguente insieme di variabili: progressivo (anonimizzato) corrispondente all’utente che effettua le chiamate; codice del Comune all’interno del quale si trova la cella da cui proviene la chiamata; data e ora della chiamata.
Le pubblicazioni: le “edizioni chiave” Principali pubblicazioni di carattere generale, che presentano una sintesi su
tutta la produzione dell'Istituto (formato pdf con tavole su foglio elettronico):
Annuario statistico italiano offre un ritratto completo del Paese sui principali temi di interesse; i dati sono accompagnati da un confronto con i quattro anni precedenti e da una descrizione di sintesi, per accompagnare l’utente nell’approfondimento dei fenomeni.
Rapporto annuale focalizza l’attenzione sulla situazione più attuale, facendo riferimento ai dati più recenti. Contiene un'analisi documentata sulla situazione del Paese, in termini di dinamiche macroeconomiche e sociali, sulle trasformazioni e i problemi emergenti.
Noi Italia attraverso 120 indicatori distribuiti su 19 settori di interesse, offre un quadro d’insieme del Paese, degli aspetti economici, sociali, demografici e ambientali, del suo posizionamento nel contesto europeo, delle differenze regionali e delle dinamiche nel tempo.
Italia in cifre presenta un profilo sintetico dell'Italia e dei suoi aspetti economici, demografici, sociali e territoriali. Completo di glossari e note metodologiche, consente la fruibilità del patrimonio informativo anche a un pubblico di non addetti ai lavori, per il suo carattere divulgativo.
Daas et al. (2009) Checklist for the Quality evaluation of AD Sources. Discussion paper 09042, Statistics Netherlands.
Daas et al. (2011) Reports on methods preferred for the quality
indicators of administrative data sources, Deliverable 4.2 of Workpackage 4 of the BLUE-ETS project. CBS, Netherlands, SSB, Norway, Istat, Italy, SCB, Sweden.
United Nations (2007), Register-based statistics in Nordic countries.
www.unece.org/index.php?id=17470 Bo Sundgren: Towards a system of official statistics based on a coherent combination of data sources, including surveys and administrative data. http://www.divaportal. org/smash/get/diva2:469622/FULLTEXT01.pdf G. Di Bella, S. Ambroselli: Towards a more efficient system of administrative data management and quality evaluation to support s t a t i s t i c s p r o d u c t i o n i n I s t a t . http://www.q2014.at/papers-presentations.html
Bibliografia
Grazie per l’attenzione [email protected]