Post on 04-Aug-2015
1
Modulo Archivistica Informatica
Master Informatica del testo-edizione elettronica
2
ObiettivoElementi del Contesto: la società dell’informazione
produce e consuma documenti digitali.
Necessità: le organizzazioni/enti devono:• Saper produrre e consumare documenti digitali• Saper trasmettere documenti documenti digitali• Saper gestire documenti digitali• Saper archiviare i documenti digitali• Saper conservare i documenti digitali
Obiettivo della lezione:• Individuare una possibile soluzione• Le infrastrutture e gli strumenti per poter realizzare
la soluzione• Illustrare alcuni primi parziali esempi di
implementazioni di tale soluzione
3
Principale
DOCUMENTO
[.]Principale
FILE<.> Lista di
FILE<.> elemento
documento: unità di informazione producibile
Firma
<.>attributi
MarcaTemporal
e
<.>attributi
Impronta
<.>attributi
Segnatura
<.>attributi
Documenti Digitali
Quanto è distante dalla vostra idea di documento?
4
Documenti Digitali
Processo astrazionesemantica
Computer possono tradurre 0 e 1in simboli interpretabili da persone che possono modificarli
Computer possono eseguire dei“ragionamenti”
Estrazione di semantica dai documenti=> convivenza con l’esistente
Formalizzazione dei documenti dalla loro nascita=> premesse per il futuro
“Il documento attesta un evento e ne tramanda la memoria testimoniando il
passato”
Nella definizione di prima il concetto di semantica dove sta?
Nella definizione di prima il concetto di semantica dove sta?
5
Produzione e Consumo di documenti digitali
Processo di estrazione semantica => passaggio da applicazioni caratterizzate dai formati quali:- word processor (l’utente dice “scrivo un documento”)- editor di contenuti (l’utente dice “faccio una slide”)
- altri...ad applicazioni caratterizzate dai contenuti => applicazioni specializzate quali:- apps per i Cittadini (l’utente dice “mando una fattura”)- sistemi verticali (l’utente dice “emetto un mandato di
pagamento”) per gli EntiApplicazioni Specializzate => definizione forma, contenuto e supporto del documento
La Produzione e Consumo di documenti digitali avviene tramite applicazioni software che trasformano sequenze di “0” e “1” in simboli interpretabili dalle persone e da essi modificabili
- Da Word ad Aps- Da Generici a Specifici
- Da Word ad Aps- Da Generici a Specifici
6
Trasmissione di documenti digitali
Trasmissione di un file => invio di un flusso di “0” e “1” (mittente) / ricostruzione del flusso di “0” e “1” (destinatario)
Interoperabilità delle applicazioni => a) tecnica: ricostruzione della stessa sequenza di simbolib) semantica: attribuzione dello stesso significatoc) giuridica: legalmente riconosciuta da entrambe le parti ossia conforme alla normativad) organizzativa: strutture e servizi tra organizzazioni diverse.
Applicazioni Specializzate => passare da poche applicazioni a molte applicazioni => problema della trasmissione dei documenti e interoperabilità delle applicazioni.
7
Gestione di documenti digitaliLa gestione dei documenti digitali è l’insieme delle attività volte a: registrare, organizzare, classificare, assegnare, reperire i documenti digitali. Inoltre spesso è necessario:- definire azioni automatiche o processi da svolgere sui documenti- definire proprietà e meta-informazioni essenziali dei documenti digitaliTali attività sono svolte da un Sistema per la Gestione Documentale (SGD).
attuale .. futuro
- forma- contenuto - supporto già formalizzati
- forma- contenuto - supporto da formalizzare
es. Carta->Scanner->Upload
Cambiamento nel modo di lavorare dell’archivista?Cambiamento nel modo di lavorare dell’archivista?
8
Open Document (ODF)
Un documento è: un file compresso così fatto:- File XML: content.xml; meta.xml; settings.xml; styles.xml- Altri file: mimetype- Cartelle: META-INF/ Thumbnails/
ODF - Open Document Format for Office Applications
esempio: content.xml<text:h text:style-name="Heading_2">Questo è un titolo
</text:h>
<text:p text:style-name="Text_body">
Questo è un paragrafo. Le informazioni di formattazione si
trovano nello stile Text_body.
</text:p>
esempio: meta.xml <meta:creation-date>2003-09-10T15:31:11</meta:creation-date>
<dc:creator>Daniel Carrera</dc:creator>
<dc:date>2005-06-29T22:02:06</dc:date>
<dc:language>es-ES</dc:language>
<meta:document-statistic
meta:table-count="6" meta:object-count="0"
meta:page-count="59" meta:paragraph-count="676"
meta:image-count="2" meta:word-count="16701"
meta:character-count="98757"/>
I file che noi leggiamo sono costituiti da una serie di file XML che vengono interpretati.
Il documento non è quello che ci immaginiamo ma è una serie di file XML interpretati dal computer.
Stiamo quindi andando nella direzione della formalizzazione e quindi in una potenziale gestione automatizzata anche del significato.
I file che noi leggiamo sono costituiti da una serie di file XML che vengono interpretati.
Il documento non è quello che ci immaginiamo ma è una serie di file XML interpretati dal computer.
Stiamo quindi andando nella direzione della formalizzazione e quindi in una potenziale gestione automatizzata anche del significato.
9
XForms
XForms (XML Forms) è un linguaggio basato su XML per la definizione delle form all’interno di documenti XML
XForm consente di separare i dati dalla loro presentazione. Una XForm è costituita da due parti:
- XForm Model- XForm User Interface
- XForm Model: definisce la struttura dei dati e come questi verranno trasmessi- XForm User Interface: definisce i controlli di input ossia stabilisce come l’utente può interagire con il documento
<head><xf:model> <xf:instance> <utente> <nome/> <cognome/> </utente> </xf:instance><xf:submission id=”invioDati” method=”post” action=”elabora.asp”/></xf:model></head>
<body><xf:input ref=”nome”><xf:label>Nome</xf:label></xf:input><br/><xf:input ref=”cognome”><xf:label>Cognome</xf:label></xf:input><br/><xf:submit submission=”invioDati”><xf:label>Invia</xf:label></xf:submit></body>
=><utente> <nome>Mario</nome> <cognome>Rossi</cognome></utente>
Il contenuto di un documento è estratto dal documento stesso.
Ci si spinge sempre di più verso una formalizzazione.
Il contenuto di un documento è estratto dal documento stesso.
Ci si spinge sempre di più verso una formalizzazione.
10
Struttura meta-informazioni obbligatorie per la gestione dei documenti informatici
la struttura delle meta informazioni obbligatorie per la gestione dei documenti informatici (http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%205%20-%20Metadati.pdf)
<?xml version="1.0" encoding="ISO-8859-1" ?><xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"><xs:element name="documento"><xs:complexType><xs:sequence><xs:element name="datachiusura" type="xs:date"/><xs:element name="oggettodocumento" type="xs:string /><xs:element name="soggettoproduttore"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element name="cognome" type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element><xs:element name="destinatario"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element name="cognome" type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element></xs:sequence><xs:attribute name="IDDocumento" type="xs:string" use="required"/></xs:complexType></xs:element></xs:schema>
=> sia il documento che le meta-informazioni necessarie alla gestione sono descritte in linguaggio XML
XML è quindi l’elemento che fa da collante.
Due concetti su XML:XML ben formatoXML valido
XML per la gestione documentale
XML è quindi l’elemento che fa da collante.
Due concetti su XML:XML ben formatoXML valido
XML per la gestione documentale
11
La Gestione Documentale per la PA Italiana
CNIPA -> DigitPA -> Agenzia Digitale Italiana
http://www.digitpa.gov.it
12
Archiviazione dei documenti digitali
Il documento “Chiuso” viene archiviato. Il Sistema di Gestione di Archivio (SGA) è lo strumento per la garanzia nel tempo della memoria.
Il documento in SGD è “vivo” e arricchito, durante il suo ciclo di vita, di meta-informazioni funzionali alla ricerca e alla creazione del vincolo archivistico
Applicazione
più oneroso
- Versamento- Ricerca- Invio piano di classificazione- Invio organigramma
Standard di riferimento: OAIS
Chiuso = è nel senso di compiuto e completo di tutti gli elementi (perfezionato)
Chiuso = è nel senso di compiuto e completo di tutti gli elementi (perfezionato)
13
Conservazione dei documenti digitali
Un documento digitale può aver associato: firme digitali e marche temporali => necessaria applicare una procedura di gestione nel tempo.
Un documento archiviato deve poter essere visualizzato anche tra molti anni => necessario dare garanzia della sua corretta consultazione nel tempo.
Il documento in SGD o SGA deve essere “conservato a norma”. Il Sistema di Conservazione a Norma (SCN) deve offrire queste garanzie.
ApplicazioneStandard di riferimento: UNISInCRO
14
Caratteristiche di una soluzione per la gestione del ciclo di vita di documenti digitali
1) basata su infrastruttura aperta => interoperabilità => a livello:a) tecnicob) semanticoc) organizzativod) legale2) integrata con interfacce standard 3) gestione dei documenti digitali e della loro semantica
4) registrazione degli eventi relativi al ciclo di vita dei documenti digitali.
5) dotata di strumenti per la gestione delle esigenze degli utenti
15
Struttura di un SGD(scomposizione funzionale)
Servizi agli utenti
Controllo del funzionamentodelle applicazioni
Comunicazioni tra applicazioni conformi
Comunicazioni tra applicazioninon conformi
Descrizione delle interazioni
Memorizzazione dei messaggi e documenti
Gestione dei processi
16
Struttura di un SGD(produzione e consumo di documenti digitali)
Gestione comunicazione standard
Gestione comunicazione non standard
Conforme alle regole di SGD
NON Conforme alle regole di SGD
17
Struttura di un SGD(interoperabilità)Censimento di Applicazioni e loro
responsabili
Struttura dei messaggi che possono accompagnare il
documento (XML-Schema)
Censimento dei possibili usi (servizi) del SGD (WSDL)
Catalogo dei significati dei messaggio documenti (OWL/RDF)
Associa ad un messaggio una forma (XSLT)
- Quali servizi offre l’ente?- A chi sono offerti i servizi?
- Come faccio ad utilizzare i servizi?...
18
Struttura di un SGD(memorizzazione)Memorizza i documenti
(messaggi) che si scambiano le applicazioni o che vengono
inserite da utenti
Memorizza tutte le operazioni svolte sui messaggi/documenti ossia i legami:
Produttore-Consumatore-Unità Documentaria
Memorizza le meta-informazioni associate ai documenti
- Che cosa è successo?- Quando è successo?- Chi ha fatto che cosa?...=> premesse alla archiviazione
19
Posizione di SGD nell’ente
Esempio 1 Esempio 2
Schema Generale
SUAP: Sportello UnicodelleAttivitàProduttive
SUAP: Sportello UnicodelleAttivitàProduttive
20
Operazioni DI BASE sui documenti
- Firma digitale- Marca temporale
- Scadenza certificati- Visualizzazione nel tempo dei documenti
- Riversamento contro l’obsolescenza
21
Firma DigitaleChe cosa deve avere un utente per firmare un documento?- Dispositivo di firma (lettore di smart card)- Supporto di memorizzazione della chiave privata (smart card)- Certificato digitale pubblico (sito della Certification Autority)- Software per la firma (installato sul PC)
Dove prende tutta questa roba?- Lettore di smart card se lo compra ad un negozio e la installa sul PC - smart card acquistata da una Certification Autority qualificato da DigitPA insieme al Certificato - software per la firma se lo scarica da internet
22
Firma DigitaleChiavi Asimmetriche Pub e Priv di un Utente:
Pub(Priv(File))=FileHash di un file:
Hash(File)=file; File1<> File2 => Hash(File1)<>Hash(File2)
Che cosa c’è nella Smart Card? Priv + Certificato
A che è la Smart Card? dispositivo che garantisce che nessuno possa prelevare la chiave Priv a meno che si acceda alla Smart Card con un software appropriato e che l’utente digiti il corretto PIN
Che cosa c’è nel Certificato? Pub + Informazioni sulla Persona + Informazioni sulla CA + Informazioni su algoritmi usati
23
Firma DigitaleEsempio di come si firma un documento?1. l’utente trascina il FILE da firmare sull’applicazione di firma installata sul computer2. l’applicazione chiede il PIN3. l’utente digita il PIN4. l’applicazione verifica se il PIN è corretto5. l’applicazione esegue la firma: usando il lettore accede alla Smart Card; prende Priv dalla Smart Card e dal certificato legge l’algoritmo di firma e di Hash da applicare; esegue le seguenti operazioni matematiche Priv(Hash(FILE) e ottiene una sequenza di bit detta FIRMA; crea un nuovo file così ottenuto FILE+FIRMA+CERTIFICATO 6. crea un nuovo file con estensione .p7m (es. FILE_FIRMATO.p7m) le cui informazioni contenute sono <FILE,FIRMA,CERTIFICATO> 7. l’applicazione scrive il file FILE_FIRMATO.p7m sul computer dell’utente e gli comunica che ha terminato la firma
24
Firma Digitale
Esempio di come si verifica un documento?1. l’utente trascina il FILE_FIRMATO.p7m da verificare sull’applicazione di firma installata sul computer2. l’applicazione esegue la verifica: accede al FILE_FIRMATO.p7m (si ricorda che le informazioni in esso contenute sono <FILE,FIRMA,CERTIFICATO> ) e dal certificato in esso contenuto estrae la chiave Pubblica e l’algoritmo di Hash usato per la firma; se Pub(FIRMA)=Hash(FILE) allora l’applicazione comunica all’utente che la firma è corretta; se Pub(FIRMA)<>Hash(FILE) allora l’applicazione comunica all’utente che la firma NON è corretta
25
Marcatura Temporale
- Serve a collocare nel tempo un documento firmato digitalmente
- E’ effettuata da una terza parte (una Certification Autority) rispetto a chi firma o riceve il documento
- L’utente utilizza un software installato sul proprio PC che dato in ingresso un file .p7m restituisce un file .m7m
- Il file .m7m è firmato digitalmente dalla Certification Autority e contiene la data della sua firma.
P.s. Per legge la marca temporale può essere sostituita dalla segnatura di protocollo.
Tecnologia Vs Processo?Spesso è meglio il processo :-)
P.s. Per legge la marca temporale può essere sostituita dalla segnatura di protocollo.
Tecnologia Vs Processo?Spesso è meglio il processo :-)
26
Alcuni problemi nell’archiviazione di documenti digitali
- Per evitare attacchi o frodi => i certificati digitali scadono => potrei archiviare documenti e scoprire che non sono più giuridicamente validi- Obsolescenza della tecnologia => potrei archiviare un documento ma non esiste più nessun PC, dispositivo o software per poterlo consultare- Script all’interno di un documento (es. “la data di oggi”) => ho archiviato un documento che cambia significato nel tempo- ..=> lo sforzo per gestire questa complessità è enorme e deve essere supportato da ogni soggetto pubblico
27
EsempiElementi per la gestione documentale in
Toscana:- Contesto: RTRT
- AP@CI- InterPro
- DAX
28
RTRT un approccio condiviso con gli enti del territorio toscano
- Pianificazione: Regione Toscana sviluppa un piano quinquennale per la «Società dell’informazione e della conoscenza»- Modello Organizzativo: Rete Telematica Regionale Toscana (RTRT), Comitato Strategico, Direzione Tecnico Operativa, Gruppi di lavoro tematici- Modello Tecnologico: Infrastrutture, Open Specific, Open Source- Progetti condivisi: SUAP, InterPRO, AP@CI, DAX, ...
29
AP@CIObiettivo:
- Dare alle Imprese e ai Cittadini uno strumento semplice (CNS più semplice della firma ed equivalente) inviare/ricevere documenti alla PA toscana- Dare alle Imprese e ai Cittadini evidenza che la PA ha iniziato il processo di elaborazione della istanza presentata (numero di protocollo è attesta l’inizio del processo)- Migliorare i tempi dei gestione delle istanza da parte della PA toscana
Documenti:- autenticazione tramite CNS
- firmati digitalmente- trasformati in PDF/a e accettati
dall’utente- numero di protocollo viene
notificato all’utente
30
InterPro
Obiettivo:- Interconnettere gli uffici di protocollo della PA Regionale- Interconnettere gli uffici di protocollo della PA- Trasmettere i dati della segnatura di protocollo- Iniziare un processo di gestione documentale e degli archivi
Documenti:- Gestione della Segnatura di Protocollo- Gestione eventi del documento protocollato (es. annullamento)
31
DAX
Obiettivo:- Realizzare sistema di gestione e conservazione di archivi già formati: insieme di documenti funzionalmente strutturati e organizzati- Salvaguardare l’unitarietà dell’archivio (descrizione e gestione)
32
SGA (Sistema di Gestione degli Archivi) - OAIS CARATTERISTICHE:
- Gestione funzionalità archivistiche (descrizione, riordino, scarto, gestione, topografici)
- Utilizza gli strumenti di gestione archivistica (classificazione, massimario)
- Gestione di entità archivistiche (aggregati, unità archivistiche, unità di conservazione)
- E' l'unico punto di accesso
SIP: Subscribe Information PackageAIP: Archivial Information PackageDIP: Dissemination Information Package
OAIS = Open Archival Information System
FASI: Acquisizione, Archiviazione, Accesso, Pianificazione, Amministrazione
33
SGA (Sistema di Gestione degli Archivi) - OAIS
Meta dati principali del documento:
- identificativo- classifica/fascicolo- data- autore- destinatario- sintesi (oggetto)- allegati- tipo supporto
Meta-dati archivistici- n° protocollo e data- oggetto- codice di classificazioneMeta-dati identità- autore- scrittore- data creazione- mittente - destinatario
Meta-dati accesso- consultabile SI/NO - profili- stampabile SI/NO - profili- copia SI/NO - profili
Meta-dati informatici- firma digitale- marca temporale- data/ora ultimo accesso- tipo di operazione- formato
34
Sistema di Conservazione a Norma (SCN) - UNISInCRO
Conservare è un’attività della fase di Archiviazione (OAIS)
Conservare vuol dire mantenere nel tempo:- autenticità- leggibilità - integrità- affidabilità del documento digitale.
Caratteristiche- rispetta la normativa DigitPA e comunque la normativa sulla conservazione- prevede di essere aggiornato a nuove norme- accetta documenti solo in determinati formati, per i quali garantisce l’esibizione a norma- ha la capacità di memorizzazione dei documenti e mantenere traccia delle operazioni eseguite su di essi
35
Sistema DAX
Comunicazioni tra sistemi di enti diversi (stesso problema per AP@CI e InterPro, SUAP, ...)
=> necessari strumenti e metodi standard (infrastrutture):
[quale strumento?] CART: Cooperazione Applicativa Regionale Toscana[come si accordano gli enti?] e.Toscana Compliance
36
e.Toscana Compliance- e.Toscana Compliance è uno strumento per definire le modalità con cui interagiscono le applicazioni di un Ente con le applicazioni esterne. Tale strumento è articolato in:§ Comitato e.Toscana Compliance§ Centro Tecnico e.Toscana Compliance§ Sito e.Toscana Compliance
- RFC e.Toscana è il documento concertato tra gli enti e le imprese utilizzato per descrivere le interfacce delle applicazioni
- Accreditamento delle applicazioni è un attestato che garantisce gli enti della perfetta aderenza del software che acquistano alle specifiche descritte nelle RFC e.Toscana
37
CART (Cooperazione Applicativa Regionale Toscana)
SPCoop
Interoperabilità
- integra le applicazioni di più di 300 enti diversi- gestisce più di 100.000.000 di interazioni al mese- conforme alle specifiche SPCoop- gestito da Regione Toscana
38
Le infrastrutture di RTRT
39
Riferimenti- Foxes&Fishes: http://www.foxesandfishes.it- eCompliance: http://web.rete.toscana.it/eCompliance- CART: http://www.cart.rete.toscana.it- InterPro e AP@CI: http://www.e.toscana.it/e-toscana/it/inter_pro.wp- eToscana: http://www.e.toscana.it- RTRT: http://www.rtrt.it- Open Document - http://it.wikipedia.org/wiki/OpenDocument- ADI - www.digitpa.gov.it- Metadati - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%205%20-
%20Metadati.pdf- Pacchetto di Archiviazione - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%204%20-%20Specifiche%20tecniche%20pacchetto
%20archiviazione.pdf- FORMATI - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%202%20-%20Formati.pdf
Walter Volpiwalter.volpi@gmail.com