UN FRAMEWORK PER IL CONTROLLO E LA DOCUMENTAZIONE DELLA QUALITA’ DELLE FONTI AMMINISTRATIVE
IL LAVORO SVOLTO
Andrea Passacantilli
12 novembre 2014
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
• vuole essere un MANUALE completo che guidi a diagnosticare la qualità di un archivio amministrativo per gli usi statistici
• eventualmente implementabile come wizard (guida online)
• utilizzabile per la PRIMA DIAGNOSI ma anche per lo STUDIO APPROFONDITO DELLA QUALITA’
• contenente una SPECIFICA STRUTTURATA DI ERRORI e relativi INDICATORI DI QUALITA’ , dettagliata abbastanza da guidare il più possibile il valutatore
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
INDICE DELLA PRESENTAZIONE
LA STRUTTURA DEL FRAMEWORK
GLI INDICATORI DELLA QUALITA’ DELL’ARCHIVIO NEL SUO COMPLESSO
DALLA DESCRIZIONE DEL CONTENUTO DELL’ARCHIVIO AMMINISTRATIVO ALLA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI
LA SPECIFICA DEGLI ERRORI E I POSSIBILI INDICATORI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
Iperdimensioni: Fonte, Metadati, Dati
METADATI1. Chiarezza e standardizzazione della documentazione dei dati 2. Confrontabilità della documentazione dei dati 3. Chiavi identificative univoche e chiavi di raccordo (esistenza, tipo e qualità), 4. Documentazione delle procedure di acquisizione e trattamento dei dati.
FONTE1. Fornitore 2. Rilevanza e usi 3. Privacy e sicurezza 4. Disponibilità
DATI Copertura e identificazione, Linkabilità, Accuratezza, Dimensione temporale
…in buona parte estratti da DARCAP Riferimenti normativi dell’archivio Usi potenziali Tempestività rilascio ….…in buona parte estratti da DARCAP Disponibilità di documentazione
del contenuto dell’archivio Esistenza di una chiave
identificativa, per ogni collettivo ….indicazioni generali sulla copertura estratte da DARCAP
SPECIFICA DETTAGLIATA DEI POSSIBILI ERRORI SUI DATI e relativi INDICATORI, basata sull’ontologia dell’archivio
Struttura del FRAMEWORK PER LA QUALITA’ ARCHIVI AMMINISTRATIVI
Indicatori di qualità
1
IperdimensioniDimensioni
Indicatori di qualità
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
2
• Ultimata l’introduzione generale• Definiti gli indicatori nelle iperdimensioni FONTE e METADATI
• Iperdimensione DATI: per ciò che riguarda la specifica degli indicatori numerici calcolabili sui dati, il Framework propone un NUOVO APPROCCIO che sfrutta la specifica del contenuto (l’ontologia) dell’archivio documentata in DARCAP
• Definiti gli errori relativi a COPERTURA e IDENTIFICAZIONE e relative proposte di indicatori
• In analisi gli errori sulle informazioni relative al POSSESSO DI CARATTERISTICHE e LEGAMI
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
GLI INDICATORI DELLA QUALITA’ DELL’ARCHIVIO NEL SUO COMPLESSO
sono gli indicatori nelle
Iperdimensioni FONTE e METADATI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 20143
4
ESEMPI DI INDICATORI NELLA IPERDIMENSIONE FONTE
Dimensione 2. Rilevanza e usiInfatti, se l’archivio è già utilizzato per finalità statistiche, questo può riflettere un terreno maggiormente favorevole per ulteriori usi. In questa dimensione si documentano gli usi attuali internamente all’Ente proprietario e da parte di altri utilizzatori e gli usi potenziali che l’ente proprietario vede come possibili.
• 2.1. Utilizzi aggiuntivi dell’archivio da parte dell’ente (supporto alle decisioni, supporto a indagini statistiche, elaborazioni statistiche,…)
• 2.2. Utilizzatori per finalità statistiche e descrizione sintetica delle statistiche prodotte
• 2.3. Usi potenziali che l’autorità responsabile identifica come possibili
informazioni desumibili dalle Istruttorie sugli archivi amministrativi
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
5
ESEMPI DI INDICATORI NELLA IPERDIMENSIONE METADATI
Dimensione 3. Chiavi identificative univoche e chiavi di raccordo (esistenza, tipo e qualità) L’esistenza di chiavi identificative univoche e condivise da altri archivi, permettendo la linkabilità dei dati contenuti nell’AA con dati presenti in altri archivi è condizione favorevole per l’utilizzabilità dell’AA a fini statistici.
3.1. Esistenza delle chiavi identificative e documentazione della loro struttura. Segnalare se nell’archivio esistono collettivi di tipo popolazione o evento per i quali non esiste una chiave identificativa univoca o non è documentata la sua struttura, assegnare un valore sintetico all’indicatore sulla base del numero di tali collettivi e della loro rilevanza
3.2. Qualità delle chiavi identificative: giudizio generale sulla qualità della chiave identificativa (frequenza della scorrettezza sintattica o semantica, mancata stabilità temporale) sia nel ruolo di identificazione che in quello di raccordo.
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
DALLA DESCRIZIONE DEL CONTENUTO DELL’ARCHIVIO AMMINISTRATIVO ALLA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 20146
7
UNITA’ MINIME DI INFORMAZIONE REGISTRABILI IN ARCHIVIO
• Appartenenza di un elemento a un collettivo• Rossi appartiene al collettivo Studenti• Esamei appartiene al collettivo Esami
• Possesso di una modalità o di un valore per una caratteristica• Rossi Ha residenza Roma• Esamei Ha Assegnato crediti 12
• Esistenza di un legame tra due elementi• Rossi Ha effettuato Immatricolazionei
• Rossi Ha sostenuto Esamei • Rossi Ha conseguito Laureai
• Rossi Ha tutor Bianchi
Studenti (Rossi)
Ha residenza (Rossi, Roma)
Esami (Esamei)
Ha assegnato crediti (Esamei, 12)
Ha sostenuto (Esamei, Rossi)
Ha effettuato (Immatricolazionei, Rossi,)
Ha conseguito (Laureai, Rossi)
Ha tutor (Rossi, Bianchi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
8
POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo
ERRORI DI ACCETTAZIONE• Errata esclusione
• Rossi appartiene al collettivo Studenti, ma l’informazione non viene registrata in archivio
• Esamei appartiene al collettivo Esami, ma l’informazione non viene registrata in archivio
• Errata inclusione in particolare Duplicazione• Rossi non esiste o non appartiene al collettivo Studenti, ma l’informazione
‘Rossi appartiene al collettivo Studenti’ viene registrata in archivio• Esamei non è avvenuto (o non appartiene al collettivo) Esami, ma
l’informazione ‘Esamei appartiene al collettivo Esami’ viene registrata in archivio
• l’informazione ‘Rossi appartiene al collettivo Studenti’, o ‘Esamei appartiene al collettivo Esami’, viene registrata più volte in archivio
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Studenti (Rossi)
Esami (Esamei)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
9
POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo
ERRORE DI IDENTIFICAZIONE
• il codice identificativo dell’elemento (Rossi, oppure Esamei) presenta errori sintattici (ad esempio codice fiscale con struttura non corretta)
• l’elemento (Rossi, oppure Esamei) non esiste ma in archivio riceve ugualmente un identificativo• errore che accompagna una errata inclusione nel collettivo
• l’elemento (Rossi, oppure Esamei) esiste ma nell’archivio non ha un suo identificativo• errore che accompagna o causa una errata esclusione dal collettivo
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Studenti (Rossi)
Esami (Esamei)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
10
POSSIBILI CAUSE DI ERRORE per l’informazione Appartenenza di un elemento al collettivo
ERRORE DI IDENTIFICAZIONE • l’elemento (Rossi, oppure Esamei) condivide l’identificativo con un altro
elemento • ‘Rossi’ è usato per identificare sia Rossi che Verdi• ‘Esamei’’ è usato per identificare due esami diversi
• l’elemento (Rossi, oppure Esamei) ha un doppio identificativo (in un dato sistema di identificazione)• ‘Rossi’ e ‘Rossi2’ sono usati entrambi per identificare Rossi• ‘Esamei’’ ed ‘Esamej’ identificano lo stesso esame
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Studenti (Rossi)
Esami (Esamei)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
11
POSSIBILI CAUSE DI ERRORE per l’informazione Possesso di una modalità o di un valore per la caratteristica
ERRORI DI ACCETTAZIONE• Errata esclusione se la caratteristica è obbligatoria = mancata
risposta• Rossi ha residenza a Roma, ma l’informazione non viene registrata in archivio
• l’esame Esamei ha assegnato 12 crediti, ma l’informazione non viene registrata in archivio
• Errata misura contemporanea errata inclusione ed esclusione: è dichiarata una modalità o valore diversi da quelli veri• Rossi ha residenza a Roma, ma l’informazione ‘Rossi Ha residenza Milano’
viene registrata in archivio
• l’esame Esamei ha assegnato 12 crediti, ma l’informazione ‘Esamei Ha Assegnato crediti 6’ viene registrata in archivio
• Errata inclusione solo se la caratteristica è opzionale
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha residenza (Rossi, Roma)
Ha assegnato crediti (Esamei, 12)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
12
POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi
ERRORI DI ACCETTAZIONE• Errata esclusione
• Rossi ha tutor Bianchi, ma l’informazione non viene registrata in archivio• viene registrato l’esame Esamei, ma non chi l’ha sostenuto
• Errata misura contemporanea errata inclusione ed esclusione: è dichiarato un legame con
elemento diverso da quello vero• Rossi ha tutor Neri, ma l’informazione ‘Ha tutor (Rossi, Bianchi)’ viene
registrata in archivio• Rossi ha sostenuto l’esame Esamei, ma l’informazione ‘Ha sostenuto
(Esamei, Verdi)’ viene registrata in archivio
• Errata inclusione solo se il legame è opzionale• Rossi non ha un tutor, ma l’informazione ‘Ha tutor (Rossi, Bianchi)’ viene
registrata in archivio
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha sostenuto (Esamei, Rossi)
Ha tutor (Rossi, Bianchi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
13
POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi
ERRORE DI RACCORDO
• il codice di raccordo ha errori sintattici, ad esempio si utilizza il codice fiscale dell’elemento raccordato (Bianchi, oppure Rossi) ma questo ha una struttura non corretta
• l’elemento raccordato (Bianchi, oppure Rossi) non esiste ma in archivio riceve ugualmente un codice di raccordo
• l’elemento raccordato (Bianchi, oppure Rossi) esiste ma nell’archivio non ha un codice di raccordo
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha sostenuto (Esamei, Rossi)
Ha tutor (Rossi, Bianchi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
14
POSSIBILI CAUSE DI ERRORE per l’informazione Esistenza di un legame tra due elementi
ERRORE DI RACCORDO • l’elemento raccordato condivide il codice di raccordo con un altro
elemento • ‘Bianchi’ è usato per raccordare sia Bianchi che Neri• ‘Rossi’ è usato per raccordare sia Rossi che Verdi
• l’elemento raccordato ha un doppio codice di raccordo • ‘Bianchi’ e ‘Bianchi2’ sono usati entrambi per raccordare Bianchi• ‘Rossi’ e ‘Rossi2’ sono usati entrambi per raccordare Rossi
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha sostenuto (Esamei, Rossi)
Ha tutor (Rossi, Bianchi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
15
LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE
L’effetto è diverso per gli eventi di ingresso e per tutti gli altri eventi
L’ evento di ingresso
crea un elemento di un collettivo (di tipo popolazione o evento con durata)
con il suo codice identificativo che è uguale al codice di raccordo dell’evento di ingresso
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha effettuato (Immatricolazionei, Rossi,)
Studenti (Rossi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
IMMATRICOLAZIONI
STUDENTI
Rossi
Ha residenza (Rossi, Roma)
Verdi
Ha residenza (Verdi, Firenze)
Ha Data (Immatricoli, 1/10/2013)
Immatricolazionei,
Ha effettuato (Immatricolazionei, Rossi,)
Codice di raccordoRossi1/10/2013
Roma
Firenze
… …
…
…
…………………
…………………
17
LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE
Effetti della relazione tra un evento di ingresso e l’elemento creato
Errata esclusione evento di ingresso Errata esclusione elemento collettivo (anche temporanea: ritardo) (eventualmente temporanea)
Errata o doppia inclusione evento di ingresso Errata o doppia inclusione
elemento collettivo
Errato codice di raccordo evento di ingresso Errato identificativo dell’elemento
nel collettivo
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Ha effettuato (Immatricolazionei, Rossi,)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
18
LE RELAZIONI TRA COLLETTIVI HANNO UN RUOLO PARTICOLARE, perché attraverso le relazioniGLI ERRORI SI POSSONO PROPAGARE
Eventi qualsiasi che riguardano un elemento di un collettivo
Eventi di aggiornamento di caratteristiche o di relazioni che riguardano un elemento di un collettivo, ad esempio cambio residenza, cambio famiglia di appartenenza
Eventi di uscita che riguardano un elemento di un collettivo
tutti questi altri eventi esercitano un effetto a seconda che trovino o meno il MATCHING CON L’ELEMENTO CUI SONO RIFERITI
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Cambio [Ha residenza (Rossi, Roma), Milano)]
Ha sostenuto (Esamei, Rossi)
Ha conseguito (Laureai, Rossi)
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
ESAMI
STUDENTI
Ha residenza (Rossi, Roma)
Ha residenza (Verdi, Firenze)
Ha Data (Esamei, 1/6/2014)
Esamei,
Ha assegnato crediti (Esamei, 12)
Ha sostenuto (Esamei, Rossi)
1/6/2014 12 Rossi
Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING
STUDENTI
Rossi
Verdi
Roma
Firenze
…
…
…
…………………
…………………
Aggiornamenti anagrafici
STUDENTI
Ha residenza (Rossi, Roma)
Cambio residenzai,
Ha Data (Cambio residenzai 1/10/2014)
Cambio [Ha residenza (Rossi, Roma), Milano)]
Ha residenza (Rossi, Milano) : l’aggiornamento avviene solo se c’è stato matching
Rossi
Roma
Rossi1/10/2014 Milano
… …………………
Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING
LAUREE
STUDENTI
Ha Data (Laureai, 2/11/2014)
Laureai,
Ha assegnato voto (Votoi, 102)
Ha conseguito (Laureai, Rossi)
2/11/2014 102 Rossi
Codice di raccordo: se non coincide con l’identificativo dell’elemento raccordato ERRORE DI MATCHING
STUDENTI
Rossi
Roma
…
… …………………
Se c’è ERRORE DI MATCHING mancata uscita dal collettivo studenti
22
• Eventi qualsiasi che riguardano un elemento di un collettivo • Eventi di aggiornamento di caratteristiche o di relazioni che riguardano un
elemento di un collettivo, ad esempio cambio residenza, cambio famiglia di appartenenza
• Eventi di uscita che riguardano un elemento di un collettivo
ESITI DEL MATCHING CON L’ELEMENTO CUI SONO RIFERITI• Mancato matching con l’elemento cui sono riferiti• Matching con l’elemento cui sono riferiti• Matching con un altro elemento
DIPENDONO DALLE COMBINAZIONI TRA• Errori nel codice di raccordo• Errori nel codice identificativo dell’elemento cui sono riferiti
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
23
I diversi possibili ESITI DEL MATCHING si ottengono considerando tutte le combinazioni tra i diversi casi
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
EVENTO DA RACCORDARE• Evento correttamente incluso
con codice di raccordo corretto • Evento correttamente incluso
con codice di raccordo scorretto • Evento scorrettamente incluso
con codice di raccordo corretto• Evento scorrettamente incluso
con codice di raccordo scorretto
ELEMENTO DEL COLLETTIVO AL QUALE L’EVENTO SI DOVREBBE RACCORDARE • Elemento correttamente incluso
con codice identificativo corretto • Elemento correttamente incluso
con codice identificativo scorretto• Elemento scorrettamente escluso • Elemento scorrettamente incluso
con codice identificativo corretto • Elemento scorrettamente incluso
con codice identificativo scorretto
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
24
DUE CONSIDERAZIONI SULLE PECULIARITA’ DELL’APPROCCIO SEGUITO
• Nella specifica degli errori, importante ruolo attribuito agli identificativi e ai codici di raccordo• dipende dalla considerazione che negli archivi amministrativi l’acquisizione di
informazione è guidata dagli eventi ed è importante la loro raccordabilità, interna all’archivio, con le popolazioni di riferimento
• Questo aspetto, combinato con il fatto di riferire gli errori ai diversi tipi di unità minime di informazione determina nel Framework una SPECIFICA MOLTO DETTAGLIATA DI TIPOLOGIE DI ERRORE
CHE SI GIUSTIFICA CON IL FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
25
DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)
• Collettivo d’interesse: l’evento Laurea
• In un archivio di lauree si registrano numerose incompatibilità tra lauree e numero crediti (numero crediti insufficienti per la laurea)
• Acquisire o no l’archivio? Acquisirlo per correggerlo?
• La decisione è funzione degli specifici errori che possono coinvolgere l’evento Laurea e le sue caratteristiche e relazioni
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
26
DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)
• Gli errori possibili sono:• Errate esclusioni eventi Esame, eventualmente temporanee, Errati riferimenti
agli studenti degli eventi Esame per errori nei codici di raccordo, Errori di misura sulla caratteristica Crediti degli eventi Esame
• Errate inclusioni eventi Lauree, Errati riferimenti agli studenti degli eventi Laurea per errori nei codici di raccordo
• La decisione se acquisire/correggere l’archivio è funzione di una misura di affidabilità relativa attribuita alle unità d’informazione • Appartenenza al collettivo Esame• Legami degli elementi del collettivo Esami • Possesso della caratteristica Crediti• Appartenenza al collettivo Lauree• Legami degli elementi del collettivo Lauree
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
27
DI FATTO LO STATISTICO HA BISOGNO DI VALUTARE GLI ERRORI SULLE SPECIFICHE UNITA’ MINIME DI INFORMAZIONE: ESEMPIO (fittizio!)
IN GENERALE la decisione se acquisire/correggere l’archivio è funzione di una misura di affidabilità relativa delle unità minime di informazione nell’archivio che sono di specifico interesse dello statistico
Questa misura di affidabilità relativa • deve prendere sistematicamente in considerazione tutte le cause di errore
possibili• generalmente richiede il ricorso ad informazioni ottenibili dai titolari
dell’archivio• dovrebbe essere documentata perché influenza la qualità del prodotto
ottenuto, e per gli altri utilizzatori dell’archivio• dovrebbe basarsi su un criterio probabilistico
FRAMEWORK QUALITA’ degli ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
LA SPECIFICA DEGLI ERRORI POSSIBILI SUI DATI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 201428
29
La specifica degli errori possibili basata sull’ ontologia dell’archivio amministrativo
• mira in prospettiva a permettere allo statistico di assegnare una misura di affidabilità relativa a quelle unità minime di informazione dell’archivio che sono di suo specifico interesse
• ma consente anche la specifica di INDICATORI NUMERICI sintetici DELLA QUALITA’ DEI DATI
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
30
Per definire INDICATORI NUMERICI sintetici DELLA QUALITA’ DEI DATI
• una volta individuati tutti gli errori possibili per ogni
tipologia di errore
• elenchiamo tutti i metodi di controllo disponibili
• ed enucleiamo gli indicatori calcolabili raffrontando i
metodi di controllo disponibili agli errori possibili
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
31
Sono stati individuati i micro-eventi di errore relativi agli enunciati di appartenenza ai collettivi che, aggregandosi, determinano la COPERTURA di un collettivo osservato, ad es. Studente, Esame, Iscrizione
• ERRATA INCLUSIONE con codice sintatticamente errato• ……………………………………………………………………........................• ERRATA INCLUSIONE + INCLUSIONE CORRETTA DI DUE ELEMENTI CON
STESSO CODICE: ripetizione di codice in archivio• ……………………………………………………………………………………..• ERRATA ESCLUSIONE DOVUTA A CODICE NON DEFINITO PER ELEMENTO
ESISTENTE E APPARTENENTE AL COLLETTIVO• ………………………………………………………………………………………• INCLUSIONE CORRETTA CON DUPLICAZIONE DI UN ELEMENTO CHE HA
DUE CODICI DIVERSI• ………………………………………………………………………………….
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
32
In relazione alla COPERTURA e all’IDENTIFICAZIONE i METODI DI CONTROLLO APPLICABILI sono:
• Informazioni a priori ottenute dagli esperti dell’archivio• Controlli strutturali
• sulla correttezza di costruzione degli identificativi se strutturati, sulla presenza di record duplicati e di codici identificativi ripetuti, sull’identità dell’elemento
• Controlli mediante matching con altri archivi • che gestiscano informazioni relative al collettivo di provenienza, allo stesso
collettivo o a un collettivo complementare• Controlli mediante vincoli di incompatibilità/obbligatorietà
• che legano l’appartenenza al collettivo al possesso di caratteristiche o relazioni con elementi di altri collettivi, in particolare con eventi precedenti
• Calcolo del tempo intercorso tra l’evento e la sua registrazione
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014
33
Analizzando questi METODI DI CONTROLLO e raffrontandoli ai MICRO-EVENTI DI ERRORE si è ottenuta una SPECIFICA RAGIONATA degli INDICATORI DI COPERTURA (e identificazione) – un esempio parziale
MATCHING CON ALTRI ARCHIVI 1:
presenza di elementi dell'archivio controllato con identificativi sintatticamente coretti e non ripetuti che non trovano il matching con un’ anagrafe relativa al collettivo di provenienza con identificativi certificati (esempio Anagrafe fiscale)
INDICATORE:% errori =(numero mancati matching/numero elementi verificati)*100
Errori diagnosticatiPer identificativo di tipo semplice … Per identificativo strutturato ….
• ERRATA INCLUSIONE DI UN ELEMENTO CON STESSO CODICE DI UN ELEMENTO CORRETTAMENTE ESCLUSO
• ERRATA INCLUSIONE DI UN ELEMENTO CON STESSO CODICE DI UN ELEMENTO CORRETTAMENTE ESCLUSO
• …………………………………………………………………………………………………. • ………………………………………………………………………• ……………………………………………………………………………………………...... • ………………………………………………………………………
IL FRAMEWORK PER LA QUALITA’ DEGLI ARCHIVI AMMINISTRATIVI: un NUOVO APPROCCIO
Il lavoro svolto, A. Passacantilli – Roma, 12 novembre 2014