Download - A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

Transcript
Page 1: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

UN FRAMEWORK PER IL CONTROLLO E LA DOCUMENTAZIONE DELLA QUALITA’ DELLE FONTI AMMINISTRATIVE

IL LAVORO SVOLTO

Andrea Passacantilli

12 novembre 2014

Page 2: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

• vuole essere un MANUALE completo che guidi a diagnosticare la qualità di un archivio amministrativo per gli usi statistici

• eventualmente implementabile come wizard (guida online)

• utilizzabile per la PRIMA DIAGNOSI ma anche per lo STUDIO APPROFONDITO DELLA QUALITA’

• contenente una SPECIFICA STRUTTURATA DI ERRORI e relativi INDICATORI DI QUALITA’ , dettagliata abbastanza da guidare il più possibile il valutatore

Page 3: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

INDICE DELLA PRESENTAZIONE

LA STRUTTURA DEL FRAMEWORK

GLI INDICATORI DELLA QUALITA’ DELL’ARCHIVIO NEL SUO COMPLESSO

DALLA DESCRIZIONE DEL CONTENUTO DELL’ARCHIVIO AMMINISTRATIVO ALLA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI

LA SPECIFICA DEGLI ERRORI E I POSSIBILI INDICATORI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 4: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

Iperdimensioni: Fonte, Metadati, Dati

METADATI1. Chiarezza e standardizzazione della documentazione dei dati 2. Confrontabilità della documentazione dei dati 3. Chiavi identificative univoche e chiavi di raccordo (esistenza, tipo e qualità), 4. Documentazione delle procedure di acquisizione e trattamento dei dati.

FONTE1. Fornitore 2. Rilevanza e usi 3. Privacy e sicurezza 4. Disponibilità

DATI Copertura e identificazione, Linkabilità, Accuratezza, Dimensione temporale

…in buona parte estratti da DARCAP Riferimenti normativi dell’archivio Usi potenziali Tempestività rilascio ….…in buona parte estratti da DARCAP Disponibilità di documentazione

del contenuto dell’archivio Esistenza di una chiave

identificativa, per ogni collettivo ….indicazioni generali sulla copertura estratte da DARCAP

SPECIFICA DETTAGLIATA DEI POSSIBILI ERRORI SUI DATI e relativi INDICATORI, basata sull’ontologia dell’archivio

Struttura del FRAMEWORK PER LA QUALITA’ ARCHIVI AMMINISTRATIVI

Indicatori di qualità

1

IperdimensioniDimensioni

Indicatori di qualità

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 5: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

2

• Ultimata l’introduzione generale• Definiti gli indicatori nelle iperdimensioni FONTE e METADATI

• Iperdimensione DATI: per ciò che riguarda la specifica degli indicatori numerici calcolabili sui dati, il Framework propone un NUOVO APPROCCIO che sfrutta la specifica del contenuto (l’ontologia) dell’archivio documentata in DARCAP

• Definiti gli errori relativi a COPERTURA e IDENTIFICAZIONE e relative proposte di indicatori

• In analisi gli errori sulle informazioni relative al POSSESSO DI CARATTERISTICHE e LEGAMI

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 6: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

GLI INDICATORI DELLA QUALITA’ DELL’ARCHIVIO NEL SUO COMPLESSO

sono gli indicatori nelle

Iperdimensioni FONTE e METADATI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 20143

Page 7: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

4

ESEMPI DI INDICATORI NELLA IPERDIMENSIONE FONTE

Dimensione 2. Rilevanza e usiInfatti, se l’archivio è già utilizzato per finalità statistiche, questo può riflettere un terreno maggiormente favorevole per ulteriori usi. In questa dimensione si documentano gli usi attuali internamente all’Ente proprietario e da parte di altri utilizzatori e gli usi potenziali che l’ente proprietario vede come possibili.

• 2.1. Utilizzi aggiuntivi dell’archivio da parte dell’ente (supporto alle decisioni, supporto a indagini statistiche, elaborazioni statistiche,…)

• 2.2. Utilizzatori per finalità statistiche e descrizione sintetica delle statistiche prodotte

• 2.3. Usi potenziali che l’autorità responsabile identifica come possibili

informazioni desumibili dalle Istruttorie sugli archivi amministrativi

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 8: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

5

ESEMPI DI INDICATORI NELLA IPERDIMENSIONE METADATI

Dimensione 3. Chiavi identificative univoche e chiavi di raccordo (esistenza, tipo e qualità) L’esistenza di chiavi identificative univoche e condivise da altri archivi, permettendo la linkabilità dei dati contenuti nell’AA con dati presenti in altri archivi è condizione favorevole per l’utilizzabilità dell’AA a fini statistici.

3.1. Esistenza delle chiavi identificative e documentazione della loro struttura. Segnalare se nell’archivio esistono collettivi di tipo popolazione o evento per i quali non esiste una chiave identificativa univoca o non è documentata la sua struttura, assegnare un valore sintetico all’indicatore sulla base del numero di tali collettivi e della loro rilevanza

3.2. Qualità delle chiavi identificative: giudizio generale sulla qualità della chiave identificativa (frequenza della scorrettezza sintattica o semantica, mancata stabilità temporale) sia nel ruolo di identificazione che in quello di raccordo.

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 9: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

DALLA DESCRIZIONE DEL CONTENUTO DELL’ARCHIVIO AMMINISTRATIVO ALLA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 20146

Page 10: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

7

UNITA’ MINIME DI INFORMAZIONE REGISTRABILI IN ARCHIVIO

• Appartenenza di un elemento a un collettivo• Rossi appartiene al collettivo Studenti• Esamei appartiene al collettivo Esami

• Possesso di una modalità o di un valore per una caratteristica• Rossi Ha residenza Roma• Esamei Ha Assegnato crediti 12

• Esistenza di un legame tra due elementi• Rossi Ha effettuato Immatricolazionei

• Rossi Ha sostenuto Esamei • Rossi Ha conseguito Laureai

• Rossi Ha tutor Bianchi

Studenti (Rossi)

Ha residenza (Rossi, Roma)

Esami (Esamei)

Ha assegnato crediti (Esamei, 12)

Ha sostenuto (Esamei, Rossi)

Ha effettuato (Immatricolazionei, Rossi,)

Ha conseguito (Laureai, Rossi)

Ha tutor (Rossi, Bianchi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 11: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

8

POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo

ERRORI DI ACCETTAZIONE• Errata esclusione

• Rossi appartiene al collettivo Studenti, ma l’informazione non viene registrata in archivio

• Esamei appartiene al collettivo Esami, ma l’informazione non viene registrata in archivio

• Errata inclusione in particolare Duplicazione• Rossi non esiste o non appartiene al collettivo Studenti, ma l’informazione

‘Rossi appartiene al collettivo Studenti’ viene registrata in archivio• Esamei non è avvenuto (o non appartiene al collettivo) Esami, ma

l’informazione ‘Esamei appartiene al collettivo Esami’ viene registrata in archivio

• l’informazione ‘Rossi appartiene al collettivo Studenti’, o ‘Esamei appartiene al collettivo Esami’, viene registrata più volte in archivio

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Studenti (Rossi)

Esami (Esamei)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 12: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

9

POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo

ERRORE DI IDENTIFICAZIONE

• il codice identificativo dell’elemento (Rossi, oppure Esamei) presenta errori sintattici (ad esempio codice fiscale con struttura non corretta)

• l’elemento (Rossi, oppure Esamei) non esiste ma in archivio riceve ugualmente un identificativo• errore che accompagna una errata inclusione nel collettivo

• l’elemento (Rossi, oppure Esamei) esiste ma nell’archivio non ha un suo identificativo• errore che accompagna o causa una errata esclusione dal collettivo

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Studenti (Rossi)

Esami (Esamei)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 13: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

10

POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo

ERRORE DI IDENTIFICAZIONE • l’elemento (Rossi, oppure Esamei) condivide l’identificativo con un altro

elemento • ‘Rossi’ è usato per identificare sia Rossi che Verdi• ‘Esamei’’ è usato per identificare due esami diversi

• l’elemento (Rossi, oppure Esamei) ha un doppio identificativo (in un dato sistema di identificazione)• ‘Rossi’ e ‘Rossi2’ sono usati entrambi per identificare Rossi• ‘Esamei’’ ed ‘Esamej’ identificano lo stesso esame

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Studenti (Rossi)

Esami (Esamei)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 14: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

11

POSSIBILI CAUSE DI ERRORE per l’informazione Possesso di una modalità o di un valore per la caratteristica

ERRORI DI ACCETTAZIONE• Errata esclusione se la caratteristica è obbligatoria = mancata

risposta• Rossi ha residenza a Roma, ma l’informazione non viene registrata in archivio

• l’esame Esamei ha assegnato 12 crediti, ma l’informazione non viene registrata in archivio

• Errata misura contemporanea errata inclusione ed esclusione: è dichiarata una modalità o valore diversi da quelli veri• Rossi ha residenza a Roma, ma l’informazione ‘Rossi Ha residenza Milano’

viene registrata in archivio

• l’esame Esamei ha assegnato 12 crediti, ma l’informazione ‘Esamei Ha Assegnato crediti 6’ viene registrata in archivio

• Errata inclusione solo se la caratteristica è opzionale

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha residenza (Rossi, Roma)

Ha assegnato crediti (Esamei, 12)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 15: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

12

POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi

ERRORI DI ACCETTAZIONE• Errata esclusione

• Rossi ha tutor Bianchi, ma l’informazione non viene registrata in archivio• viene registrato l’esame Esamei, ma non chi l’ha sostenuto

• Errata misura contemporanea errata inclusione ed esclusione: è dichiarato un legame con

elemento diverso da quello vero• Rossi ha tutor Neri, ma l’informazione ‘Ha tutor (Rossi, Bianchi)’ viene

registrata in archivio• Rossi ha sostenuto l’esame Esamei, ma l’informazione ‘Ha sostenuto

(Esamei, Verdi)’ viene registrata in archivio

• Errata inclusione solo se il legame è opzionale• Rossi non ha un tutor, ma l’informazione ‘Ha tutor (Rossi, Bianchi)’ viene

registrata in archivio

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha sostenuto (Esamei, Rossi)

Ha tutor (Rossi, Bianchi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 16: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

13

POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi

ERRORE DI RACCORDO

• il codice di raccordo ha errori sintattici, ad esempio si utilizza il codice fiscale dell’elemento raccordato (Bianchi, oppure Rossi) ma questo ha una struttura non corretta

• l’elemento raccordato (Bianchi, oppure Rossi) non esiste ma in archivio riceve ugualmente un codice di raccordo

• l’elemento raccordato (Bianchi, oppure Rossi) esiste ma nell’archivio non ha un codice di raccordo

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha sostenuto (Esamei, Rossi)

Ha tutor (Rossi, Bianchi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 17: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

14

POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi

ERRORE DI RACCORDO • l’elemento raccordato condivide il codice di raccordo con un altro

elemento • ‘Bianchi’ è usato per raccordare sia Bianchi che Neri• ‘Rossi’ è usato per raccordare sia Rossi che Verdi

• l’elemento raccordato ha un doppio codice di raccordo • ‘Bianchi’ e ‘Bianchi2’ sono usati entrambi per raccordare Bianchi• ‘Rossi’ e ‘Rossi2’ sono usati entrambi per raccordare Rossi

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha sostenuto (Esamei, Rossi)

Ha tutor (Rossi, Bianchi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 18: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

15

LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE

L’effetto è diverso per gli eventi di ingresso e per tutti gli altri eventi

L’ evento di ingresso

crea un elemento di un collettivo (di tipo popolazione o evento con durata)

con il suo codice identificativo che è uguale al codice di raccordo dell’evento di ingresso

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha effettuato (Immatricolazionei, Rossi,)

Studenti (Rossi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 19: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

IMMATRICOLAZIONI

STUDENTI

Rossi

Ha residenza (Rossi, Roma)

Verdi

Ha residenza (Verdi, Firenze)

Ha Data (Immatricoli, 1/10/2013)

Immatricolazionei,

Ha effettuato (Immatricolazionei, Rossi,)

Codice di raccordoRossi1/10/2013

Roma

Firenze

… …

…………………

…………………

Page 20: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

17

LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE

Effetti della relazione tra un evento di ingresso e l’elemento creato

Errata esclusione evento di ingresso Errata esclusione elemento collettivo (anche temporanea: ritardo) (eventualmente temporanea)

Errata o doppia inclusione evento di ingresso Errata o doppia inclusione

elemento collettivo

Errato codice di raccordo evento di ingresso Errato identificativo dell’elemento

nel collettivo

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Ha effettuato (Immatricolazionei, Rossi,)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 21: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

18

LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE

Eventi qualsiasi che riguardano un elemento di un collettivo

Eventi di aggiornamento di caratteristiche o di relazioni che riguardano un elemento di un collettivo, ad esempio cambio residenza, cambio famiglia di appartenenza

Eventi di uscita che riguardano un elemento di un collettivo

tutti questi altri eventi esercitano un effetto a seconda che trovino o meno il MATCHING CON L’ELEMENTO CUI SONO RIFERITI

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Cambio [Ha residenza (Rossi, Roma), Milano)]

Ha sostenuto (Esamei, Rossi)

Ha conseguito (Laureai, Rossi)

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 22: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

ESAMI

STUDENTI

Ha residenza (Rossi, Roma)

Ha residenza (Verdi, Firenze)

Ha Data (Esamei, 1/6/2014)

Esamei,

Ha assegnato crediti (Esamei, 12)

Ha sostenuto (Esamei, Rossi)

1/6/2014 12 Rossi

Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING

STUDENTI

Rossi

Verdi

Roma

Firenze

…………………

…………………

Page 23: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

Aggiornamenti anagrafici

STUDENTI

Ha residenza (Rossi, Roma)

Cambio residenzai,

Ha Data (Cambio residenzai 1/10/2014)

Cambio [Ha residenza (Rossi, Roma), Milano)]

Ha residenza (Rossi, Milano) : l’aggiornamento avviene solo se c’è stato matching

Rossi

Roma

Rossi1/10/2014 Milano

… …………………

Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING

Page 24: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

LAUREE

STUDENTI

Ha Data (Laureai, 2/11/2014)

Laureai,

Ha assegnato voto (Votoi, 102)

Ha conseguito (Laureai, Rossi)

2/11/2014 102 Rossi

Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING

STUDENTI

Rossi

Roma

… …………………

Se c’è ERRORE DI MATCHING mancata uscita dal collettivo studenti

Page 25: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

22

• Eventi qualsiasi che riguardano un elemento di un collettivo • Eventi di aggiornamento di caratteristiche o di relazioni che riguardano un

elemento di un collettivo, ad esempio cambio residenza, cambio famiglia di appartenenza

• Eventi di uscita che riguardano un elemento di un collettivo

ESITI DEL MATCHING CON L’ELEMENTO CUI SONO RIFERITI• Mancato matching con l’elemento cui sono riferiti• Matching con l’elemento cui sono riferiti• Matching con un altro elemento

DIPENDONO DALLE COMBINAZIONI TRA• Errori nel codice di raccordo• Errori nel codice identificativo dell’elemento cui sono riferiti

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 26: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

23

I diversi possibili ESITI DEL MATCHING si ottengono considerando tutte le combinazioni tra i diversi casi

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

EVENTO DA RACCORDARE• Evento correttamente incluso

con codice di raccordo corretto • Evento correttamente incluso

con codice di raccordo scorretto • Evento scorrettamente incluso

con codice di raccordo corretto• Evento scorrettamente incluso

con codice di raccordo scorretto

ELEMENTO DEL COLLETTIVO AL QUALE L’EVENTO SI DOVREBBE RACCORDARE • Elemento correttamente incluso

con codice identificativo corretto • Elemento correttamente incluso

con codice identificativo scorretto• Elemento scorrettamente escluso • Elemento scorrettamente incluso

con codice identificativo corretto • Elemento scorrettamente incluso

con codice identificativo scorretto

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 27: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

24

DUE CONSIDERAZIONI SULLE PECULIARITA’ DELL’APPROCCIO SEGUITO

• Nella specifica degli errori, importante ruolo attribuito agli identificativi e ai codici di raccordo• dipende dalla considerazione che negli archivi amministrativi l’acquisizione di

informazione è guidata dagli eventi ed è importante la loro raccordabilità, interna all’archivio, con le popolazioni di riferimento

• Questo aspetto, combinato con il fatto di riferire gli errori ai diversi tipi di unità minime di informazione determina nel Framework una SPECIFICA MOLTO DETTAGLIATA DI TIPOLOGIE DI ERRORE

CHE SI GIUSTIFICA CON IL FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 28: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

25

DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)

• Collettivo d’interesse: l’evento Laurea

• In un archivio di lauree si registrano numerose incompatibilità tra lauree e numero crediti (numero crediti insufficienti per la laurea)

• Acquisire o no l’archivio? Acquisirlo per correggerlo?

• La decisione è funzione degli specifici errori che possono coinvolgere l’evento Laurea e le sue caratteristiche e relazioni

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 29: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

26

DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)

• Gli errori possibili sono:• Errate esclusioni eventi Esame, eventualmente temporanee, Errati riferimenti

agli studenti degli eventi Esame per errori nei codici di raccordo, Errori di misura sulla caratteristica Crediti degli eventi Esame

• Errate inclusioni eventi Lauree, Errati riferimenti agli studenti degli eventi Laurea per errori nei codici di raccordo

• La decisione se acquisire/correggere l’archivio è funzione di una misura di affidabilità relativa attribuita alle unità d’informazione • Appartenenza al collettivo Esame• Legami degli elementi del collettivo Esami • Possesso della caratteristica Crediti• Appartenenza al collettivo Lauree• Legami degli elementi del collettivo Lauree

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 30: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

27

DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)

IN GENERALE la decisione se acquisire/correggere l’archivio è funzione di una misura di affidabilità relativa delle unità minime di informazione nell’archivio che sono di specifico interesse dello statistico

Questa misura di affidabilità relativa • deve prendere sistematicamente in considerazione tutte le cause di errore

possibili• generalmente richiede il ricorso ad informazioni ottenibili dai titolari

dell’archivio• dovrebbe essere documentata perché influenza la qualità del prodotto

ottenuto, e per gli altri utilizzatori dell’archivio• dovrebbe basarsi su un criterio probabilistico

FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 31: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

LA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 201428

Page 32: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

29

La specifica degli errori possibili basata sull’ ontologia dell’archivio amministrativo

• mira in prospettiva a permettere allo statistico di assegnare una misura di affidabilità relativa a quelle unità minime di informazione dell’archivio che sono di suo specifico interesse

• ma consente anche la specifica di INDICATORI NUMERICI sintetici DELLA QUALITA’ DEI DATI

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 33: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

30

Per definire INDICATORI NUMERICI sintetici DELLA QUALITA’ DEI DATI

• una volta individuati tutti gli errori possibili per ogni

tipologia di errore

• elenchiamo tutti i metodi di controllo disponibili

• ed enucleiamo gli indicatori calcolabili raffrontando i

metodi di controllo disponibili agli errori possibili

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 34: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

31

Sono stati individuati i micro-eventi di errore relativi agli enunciati di appartenenza ai collettivi che, aggregandosi, determinano la COPERTURA di un collettivo osservato, ad es. Studente, Esame, Iscrizione

• ERRATA INCLUSIONE con codice sintatticamente errato• ……………………………………………………………………........................• ERRATA INCLUSIONE + INCLUSIONE CORRETTA DI DUE ELEMENTI CON

STESSO CODICE: ripetizione di codice in archivio• ……………………………………………………………………………………..• ERRATA ESCLUSIONE DOVUTA A CODICE NON DEFINITO PER ELEMENTO

ESISTENTE E APPARTENENTE AL COLLETTIVO• ………………………………………………………………………………………• INCLUSIONE CORRETTA CON DUPLICAZIONE DI UN ELEMENTO CHE HA

DUE CODICI DIVERSI• ………………………………………………………………………………….

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 35: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

32

In relazione alla COPERTURA e all’IDENTIFICAZIONE i METODI DI CONTROLLO APPLICABILI sono:

• Informazioni a priori ottenute dagli esperti dell’archivio• Controlli strutturali

• sulla correttezza di costruzione degli identificativi se strutturati, sulla presenza di record duplicati e di codici identificativi ripetuti, sull’identità dell’elemento

• Controlli mediante matching con altri archivi • che gestiscano informazioni relative al collettivo di provenienza, allo stesso

collettivo o a un collettivo complementare• Controlli mediante vincoli di incompatibilità/obbligatorietà

• che legano l’appartenenza al collettivo al possesso di caratteristiche o relazioni con elementi di altri collettivi, in particolare con eventi precedenti

• Calcolo del tempo intercorso tra l’evento e la sua registrazione

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014

Page 36: A. Passacantilli - Un framework per il controllo e la documentazione della qualita’ delle fonti amministrative

33

Analizzando questi METODI DI CONTROLLO e raffrontandoli ai MICRO-EVENTI DI ERRORE si è ottenuta una SPECIFICA RAGIONATA degli INDICATORI DI COPERTURA (e identificazione) – un esempio parziale

MATCHING CON ALTRI ARCHIVI 1:

presenza di elementi dell'archivio controllato con identificativi sintatticamente coretti e non ripetuti che non trovano il matching con un’ anagrafe relativa al collettivo di provenienza con identificativi certificati (esempio Anagrafe fiscale)

INDICATORE:% errori =(numero mancati matching/numero elementi verificati)*100

Errori diagnosticatiPer identificativo di tipo semplice … Per identificativo strutturato ….

• ERRATA INCLUSIONE DI UN ELEMENTO CON STESSO CODICE DI UN ELEMENTO CORRETTAMENTE ESCLUSO

• ERRATA INCLUSIONE DI UN ELEMENTO CON STESSO CODICE DI UN ELEMENTO CORRETTAMENTE ESCLUSO

• …………………………………………………………………………………………………. • ………………………………………………………………………• ……………………………………………………………………………………………...... • ………………………………………………………………………

IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO

Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014