Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

39
1 Modulo Archivistica Informatica Master Informatica del testo-edizione elettronica

Transcript of Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

Page 1: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

1

Modulo Archivistica Informatica

Master Informatica del testo-edizione elettronica

Page 2: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

2

ObiettivoElementi del Contesto: la società dell’informazione

produce e consuma documenti digitali.

Necessità: le organizzazioni/enti devono:• Saper produrre e consumare documenti digitali• Saper trasmettere documenti documenti digitali• Saper gestire documenti digitali• Saper archiviare i documenti digitali• Saper conservare i documenti digitali

Obiettivo della lezione:• Individuare una possibile soluzione• Le infrastrutture e gli strumenti per poter realizzare

la soluzione• Illustrare alcuni primi parziali esempi di

implementazioni di tale soluzione

Page 3: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

3

Principale

DOCUMENTO

[.]Principale

FILE<.> Lista di

FILE<.> elemento

documento: unità di informazione producibile

Firma

<.>attributi

MarcaTemporal

e

<.>attributi

Impronta

<.>attributi

Segnatura

<.>attributi

Documenti Digitali

Quanto è distante dalla vostra idea di documento?

Page 4: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

4

Documenti Digitali

Processo astrazionesemantica

Computer possono tradurre 0 e 1in simboli interpretabili da persone che possono modificarli

Computer possono eseguire dei“ragionamenti”

Estrazione di semantica dai documenti=> convivenza con l’esistente

Formalizzazione dei documenti dalla loro nascita=> premesse per il futuro

“Il documento attesta un evento e ne tramanda la memoria testimoniando il

passato”

Nella definizione di prima il concetto di semantica dove sta?

Nella definizione di prima il concetto di semantica dove sta?

Page 5: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

5

Produzione e Consumo di documenti digitali

Processo di estrazione semantica => passaggio da applicazioni caratterizzate dai formati quali:- word processor (l’utente dice “scrivo un documento”)- editor di contenuti (l’utente dice “faccio una slide”)

- altri...ad applicazioni caratterizzate dai contenuti => applicazioni specializzate quali:- apps per i Cittadini (l’utente dice “mando una fattura”)- sistemi verticali (l’utente dice “emetto un mandato di

pagamento”) per gli EntiApplicazioni Specializzate => definizione forma, contenuto e supporto del documento

La Produzione e Consumo di documenti digitali avviene tramite applicazioni software che trasformano sequenze di “0” e “1” in simboli interpretabili dalle persone e da essi modificabili

- Da Word ad Aps- Da Generici a Specifici

- Da Word ad Aps- Da Generici a Specifici

Page 6: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

6

Trasmissione di documenti digitali

Trasmissione di un file => invio di un flusso di “0” e “1” (mittente) / ricostruzione del flusso di “0” e “1” (destinatario)

Interoperabilità delle applicazioni => a) tecnica: ricostruzione della stessa sequenza di simbolib) semantica: attribuzione dello stesso significatoc) giuridica: legalmente riconosciuta da entrambe le parti ossia conforme alla normativad) organizzativa: strutture e servizi tra organizzazioni diverse.

Applicazioni Specializzate => passare da poche applicazioni a molte applicazioni => problema della trasmissione dei documenti e interoperabilità delle applicazioni.

Page 7: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

7

Gestione di documenti digitaliLa gestione dei documenti digitali è l’insieme delle attività volte a: registrare, organizzare, classificare, assegnare, reperire i documenti digitali. Inoltre spesso è necessario:- definire azioni automatiche o processi da svolgere sui documenti- definire proprietà e meta-informazioni essenziali dei documenti digitaliTali attività sono svolte da un Sistema per la Gestione Documentale (SGD).

attuale .. futuro

- forma- contenuto - supporto già formalizzati

- forma- contenuto - supporto da formalizzare

es. Carta->Scanner->Upload

Cambiamento nel modo di lavorare dell’archivista?Cambiamento nel modo di lavorare dell’archivista?

Page 8: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

8

Open Document (ODF)

Un documento è: un file compresso così fatto:- File XML: content.xml; meta.xml; settings.xml; styles.xml- Altri file: mimetype- Cartelle: META-INF/ Thumbnails/

ODF - Open Document Format for Office Applications

esempio: content.xml<text:h text:style-name="Heading_2">Questo è un titolo

</text:h>

<text:p text:style-name="Text_body">

Questo è un paragrafo. Le informazioni di formattazione si

trovano nello stile Text_body.

</text:p>

esempio: meta.xml <meta:creation-date>2003-09-10T15:31:11</meta:creation-date>

<dc:creator>Daniel Carrera</dc:creator>

<dc:date>2005-06-29T22:02:06</dc:date>

<dc:language>es-ES</dc:language>

<meta:document-statistic

meta:table-count="6" meta:object-count="0"

meta:page-count="59" meta:paragraph-count="676"

meta:image-count="2" meta:word-count="16701"

meta:character-count="98757"/>

I file che noi leggiamo sono costituiti da una serie di file XML che vengono interpretati.

Il documento non è quello che ci immaginiamo ma è una serie di file XML interpretati dal computer.

Stiamo quindi andando nella direzione della formalizzazione e quindi in una potenziale gestione automatizzata anche del significato.

I file che noi leggiamo sono costituiti da una serie di file XML che vengono interpretati.

Il documento non è quello che ci immaginiamo ma è una serie di file XML interpretati dal computer.

Stiamo quindi andando nella direzione della formalizzazione e quindi in una potenziale gestione automatizzata anche del significato.

Page 9: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

9

XForms

XForms (XML Forms) è un linguaggio basato su XML per la definizione delle form all’interno di documenti XML

XForm consente di separare i dati dalla loro presentazione. Una XForm è costituita da due parti:

- XForm Model- XForm User Interface

- XForm Model: definisce la struttura dei dati e come questi verranno trasmessi- XForm User Interface: definisce i controlli di input ossia stabilisce come l’utente può interagire con il documento

<head><xf:model> <xf:instance>  <utente>   <nome/>   <cognome/>  </utente> </xf:instance><xf:submission id=”invioDati” method=”post” action=”elabora.asp”/></xf:model></head>

<body><xf:input ref=”nome”><xf:label>Nome</xf:label></xf:input><br/><xf:input ref=”cognome”><xf:label>Cognome</xf:label></xf:input><br/><xf:submit submission=”invioDati”><xf:label>Invia</xf:label></xf:submit></body>

=><utente> <nome>Mario</nome> <cognome>Rossi</cognome></utente>

Il contenuto di un documento è estratto dal documento stesso.

Ci si spinge sempre di più verso una formalizzazione.

Il contenuto di un documento è estratto dal documento stesso.

Ci si spinge sempre di più verso una formalizzazione.

Page 10: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

10

Struttura meta-informazioni obbligatorie per la gestione dei documenti informatici

la struttura delle meta informazioni obbligatorie per la gestione dei documenti informatici (http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%205%20-%20Metadati.pdf)

<?xml version="1.0" encoding="ISO-8859-1" ?><xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"><xs:element name="documento"><xs:complexType><xs:sequence><xs:element name="datachiusura" type="xs:date"/><xs:element name="oggettodocumento" type="xs:string /><xs:element name="soggettoproduttore"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element name="cognome" type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element><xs:element name="destinatario"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element name="cognome" type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element></xs:sequence><xs:attribute name="IDDocumento" type="xs:string" use="required"/></xs:complexType></xs:element></xs:schema>

=> sia il documento che le meta-informazioni necessarie alla gestione sono descritte in linguaggio XML

XML è quindi l’elemento che fa da collante.

Due concetti su XML:XML ben formatoXML valido

XML per la gestione documentale

XML è quindi l’elemento che fa da collante.

Due concetti su XML:XML ben formatoXML valido

XML per la gestione documentale

Page 11: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

11

La Gestione Documentale per la PA Italiana

CNIPA -> DigitPA -> Agenzia Digitale Italiana

http://www.digitpa.gov.it

Page 12: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

12

Archiviazione dei documenti digitali

Il documento “Chiuso” viene archiviato. Il Sistema di Gestione di Archivio (SGA) è lo strumento per la garanzia nel tempo della memoria.

Il documento in SGD è “vivo” e arricchito, durante il suo ciclo di vita, di meta-informazioni funzionali alla ricerca e alla creazione del vincolo archivistico

Applicazione

più oneroso

- Versamento- Ricerca- Invio piano di classificazione- Invio organigramma

Standard di riferimento: OAIS

Chiuso = è nel senso di compiuto e completo di tutti gli elementi (perfezionato)

Chiuso = è nel senso di compiuto e completo di tutti gli elementi (perfezionato)

Page 13: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

13

Conservazione dei documenti digitali

Un documento digitale può aver associato: firme digitali e marche temporali => necessaria applicare una procedura di gestione nel tempo.

Un documento archiviato deve poter essere visualizzato anche tra molti anni => necessario dare garanzia della sua corretta consultazione nel tempo.

Il documento in SGD o SGA deve essere “conservato a norma”. Il Sistema di Conservazione a Norma (SCN) deve offrire queste garanzie.

ApplicazioneStandard di riferimento: UNISInCRO

Page 14: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

14

Caratteristiche di una soluzione per la gestione del ciclo di vita di documenti digitali

1) basata su infrastruttura aperta => interoperabilità => a livello:a) tecnicob) semanticoc) organizzativod) legale2) integrata con interfacce standard 3) gestione dei documenti digitali e della loro semantica

4) registrazione degli eventi relativi al ciclo di vita dei documenti digitali.

5) dotata di strumenti per la gestione delle esigenze degli utenti

Page 15: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

15

Struttura di un SGD(scomposizione funzionale)

Servizi agli utenti

Controllo del funzionamentodelle applicazioni

Comunicazioni tra applicazioni conformi

Comunicazioni tra applicazioninon conformi

Descrizione delle interazioni

Memorizzazione dei messaggi e documenti

Gestione dei processi

Page 16: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

16

Struttura di un SGD(produzione e consumo di documenti digitali)

Gestione comunicazione standard

Gestione comunicazione non standard

Conforme alle regole di SGD

NON Conforme alle regole di SGD

Page 17: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

17

Struttura di un SGD(interoperabilità)Censimento di Applicazioni e loro

responsabili

Struttura dei messaggi che possono accompagnare il

documento (XML-Schema)

Censimento dei possibili usi (servizi) del SGD (WSDL)

Catalogo dei significati dei messaggio documenti (OWL/RDF)

Associa ad un messaggio una forma (XSLT)

- Quali servizi offre l’ente?- A chi sono offerti i servizi?

- Come faccio ad utilizzare i servizi?...

Page 18: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

18

Struttura di un SGD(memorizzazione)Memorizza i documenti

(messaggi) che si scambiano le applicazioni o che vengono

inserite da utenti

Memorizza tutte le operazioni svolte sui messaggi/documenti ossia i legami:

Produttore-Consumatore-Unità Documentaria

Memorizza le meta-informazioni associate ai documenti

- Che cosa è successo?- Quando è successo?- Chi ha fatto che cosa?...=> premesse alla archiviazione

Page 19: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

19

Posizione di SGD nell’ente

Esempio 1 Esempio 2

Schema Generale

SUAP: Sportello UnicodelleAttivitàProduttive

SUAP: Sportello UnicodelleAttivitàProduttive

Page 20: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

20

Operazioni DI BASE sui documenti

- Firma digitale- Marca temporale

- Scadenza certificati- Visualizzazione nel tempo dei documenti

- Riversamento contro l’obsolescenza

Page 21: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

21

Firma DigitaleChe cosa deve avere un utente per firmare un documento?- Dispositivo di firma (lettore di smart card)- Supporto di memorizzazione della chiave privata (smart card)- Certificato digitale pubblico (sito della Certification Autority)- Software per la firma (installato sul PC)

Dove prende tutta questa roba?- Lettore di smart card se lo compra ad un negozio e la installa sul PC - smart card acquistata da una Certification Autority qualificato da DigitPA insieme al Certificato - software per la firma se lo scarica da internet

Page 22: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

22

Firma DigitaleChiavi Asimmetriche Pub e Priv di un Utente:

Pub(Priv(File))=FileHash di un file:

Hash(File)=file; File1<> File2 => Hash(File1)<>Hash(File2)

Che cosa c’è nella Smart Card? Priv + Certificato

A che è la Smart Card? dispositivo che garantisce che nessuno possa prelevare la chiave Priv a meno che si acceda alla Smart Card con un software appropriato e che l’utente digiti il corretto PIN

Che cosa c’è nel Certificato? Pub + Informazioni sulla Persona + Informazioni sulla CA + Informazioni su algoritmi usati

Page 23: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

23

Firma DigitaleEsempio di come si firma un documento?1. l’utente trascina il FILE da firmare sull’applicazione di firma installata sul computer2. l’applicazione chiede il PIN3. l’utente digita il PIN4. l’applicazione verifica se il PIN è corretto5. l’applicazione esegue la firma: usando il lettore accede alla Smart Card; prende Priv dalla Smart Card e dal certificato legge l’algoritmo di firma e di Hash da applicare; esegue le seguenti operazioni matematiche Priv(Hash(FILE) e ottiene una sequenza di bit detta FIRMA; crea un nuovo file così ottenuto FILE+FIRMA+CERTIFICATO 6. crea un nuovo file con estensione .p7m (es. FILE_FIRMATO.p7m) le cui informazioni contenute sono <FILE,FIRMA,CERTIFICATO> 7. l’applicazione scrive il file FILE_FIRMATO.p7m sul computer dell’utente e gli comunica che ha terminato la firma

Page 24: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

24

Firma Digitale

Esempio di come si verifica un documento?1. l’utente trascina il FILE_FIRMATO.p7m da verificare sull’applicazione di firma installata sul computer2. l’applicazione esegue la verifica: accede al FILE_FIRMATO.p7m (si ricorda che le informazioni in esso contenute sono <FILE,FIRMA,CERTIFICATO> ) e dal certificato in esso contenuto estrae la chiave Pubblica e l’algoritmo di Hash usato per la firma; se Pub(FIRMA)=Hash(FILE) allora l’applicazione comunica all’utente che la firma è corretta; se Pub(FIRMA)<>Hash(FILE) allora l’applicazione comunica all’utente che la firma NON è corretta

Page 25: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

25

Marcatura Temporale

- Serve a collocare nel tempo un documento firmato digitalmente

- E’ effettuata da una terza parte (una Certification Autority) rispetto a chi firma o riceve il documento

- L’utente utilizza un software installato sul proprio PC che dato in ingresso un file .p7m restituisce un file .m7m

- Il file .m7m è firmato digitalmente dalla Certification Autority e contiene la data della sua firma.

P.s. Per legge la marca temporale può essere sostituita dalla segnatura di protocollo.

Tecnologia Vs Processo?Spesso è meglio il processo :-)

P.s. Per legge la marca temporale può essere sostituita dalla segnatura di protocollo.

Tecnologia Vs Processo?Spesso è meglio il processo :-)

Page 26: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

26

Alcuni problemi nell’archiviazione di documenti digitali

- Per evitare attacchi o frodi => i certificati digitali scadono => potrei archiviare documenti e scoprire che non sono più giuridicamente validi- Obsolescenza della tecnologia => potrei archiviare un documento ma non esiste più nessun PC, dispositivo o software per poterlo consultare- Script all’interno di un documento (es. “la data di oggi”) => ho archiviato un documento che cambia significato nel tempo- ..=> lo sforzo per gestire questa complessità è enorme e deve essere supportato da ogni soggetto pubblico

Page 27: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

27

EsempiElementi per la gestione documentale in

Toscana:- Contesto: RTRT

- AP@CI- InterPro

- DAX

Page 28: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

28

RTRT un approccio condiviso con gli enti del territorio toscano

- Pianificazione: Regione Toscana sviluppa un piano quinquennale per la «Società dell’informazione e della conoscenza»- Modello Organizzativo: Rete Telematica Regionale Toscana (RTRT), Comitato Strategico, Direzione Tecnico Operativa, Gruppi di lavoro tematici- Modello Tecnologico: Infrastrutture, Open Specific, Open Source- Progetti condivisi: SUAP, InterPRO, AP@CI, DAX, ...

Page 29: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

29

AP@CIObiettivo:

- Dare alle Imprese e ai Cittadini uno strumento semplice (CNS più semplice della firma ed equivalente) inviare/ricevere documenti alla PA toscana- Dare alle Imprese e ai Cittadini evidenza che la PA ha iniziato il processo di elaborazione della istanza presentata (numero di protocollo è attesta l’inizio del processo)- Migliorare i tempi dei gestione delle istanza da parte della PA toscana

Documenti:- autenticazione tramite CNS

- firmati digitalmente- trasformati in PDF/a e accettati

dall’utente- numero di protocollo viene

notificato all’utente

Page 30: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

30

InterPro

Obiettivo:- Interconnettere gli uffici di protocollo della PA Regionale- Interconnettere gli uffici di protocollo della PA- Trasmettere i dati della segnatura di protocollo- Iniziare un processo di gestione documentale e degli archivi

Documenti:- Gestione della Segnatura di Protocollo- Gestione eventi del documento protocollato (es. annullamento)

Page 31: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

31

DAX

Obiettivo:- Realizzare sistema di gestione e conservazione di archivi già formati: insieme di documenti funzionalmente strutturati e organizzati- Salvaguardare l’unitarietà dell’archivio (descrizione e gestione)

Page 32: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

32

SGA (Sistema di Gestione degli Archivi) - OAIS CARATTERISTICHE:

- Gestione funzionalità archivistiche (descrizione, riordino, scarto, gestione, topografici)

- Utilizza gli strumenti di gestione archivistica (classificazione, massimario)

- Gestione di entità archivistiche (aggregati, unità archivistiche, unità di conservazione)

- E' l'unico punto di accesso

SIP: Subscribe Information PackageAIP: Archivial Information PackageDIP: Dissemination Information Package

OAIS = Open Archival Information System

FASI: Acquisizione, Archiviazione, Accesso, Pianificazione, Amministrazione

Page 33: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

33

SGA (Sistema di Gestione degli Archivi) - OAIS

Meta dati principali del documento:

- identificativo- classifica/fascicolo- data- autore- destinatario- sintesi (oggetto)- allegati- tipo supporto

Meta-dati archivistici- n° protocollo e data- oggetto- codice di classificazioneMeta-dati identità- autore- scrittore- data creazione- mittente - destinatario

Meta-dati accesso- consultabile SI/NO - profili- stampabile SI/NO - profili- copia SI/NO - profili

Meta-dati informatici- firma digitale- marca temporale- data/ora ultimo accesso- tipo di operazione- formato

Page 34: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

34

Sistema di Conservazione a Norma (SCN) - UNISInCRO

Conservare è un’attività della fase di Archiviazione (OAIS)

Conservare vuol dire mantenere nel tempo:- autenticità- leggibilità - integrità- affidabilità del documento digitale.

Caratteristiche- rispetta la normativa DigitPA e comunque la normativa sulla conservazione- prevede di essere aggiornato a nuove norme- accetta documenti solo in determinati formati, per i quali garantisce l’esibizione a norma- ha la capacità di memorizzazione dei documenti e mantenere traccia delle operazioni eseguite su di essi

Page 35: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

35

Sistema DAX

Comunicazioni tra sistemi di enti diversi (stesso problema per AP@CI e InterPro, SUAP, ...)

=> necessari strumenti e metodi standard (infrastrutture):

[quale strumento?] CART: Cooperazione Applicativa Regionale Toscana[come si accordano gli enti?] e.Toscana Compliance

Page 36: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

36

e.Toscana Compliance- e.Toscana Compliance è uno strumento per definire le modalità con cui interagiscono le applicazioni di un Ente con le applicazioni esterne. Tale strumento è articolato in:§ Comitato e.Toscana Compliance§ Centro Tecnico e.Toscana Compliance§ Sito e.Toscana Compliance

- RFC e.Toscana è il documento concertato tra gli enti e le imprese utilizzato per descrivere le interfacce delle applicazioni

- Accreditamento delle applicazioni è un attestato che garantisce gli enti della perfetta aderenza del software che acquistano alle specifiche descritte nelle RFC e.Toscana

Page 37: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

37

CART (Cooperazione Applicativa Regionale Toscana)

SPCoop

Interoperabilità

- integra le applicazioni di più di 300 enti diversi- gestisce più di 100.000.000 di interazioni al mese- conforme alle specifiche SPCoop- gestito da Regione Toscana

Page 38: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

38

Le infrastrutture di RTRT

Page 39: Master Informatica del Testo – Edizione elettronica - Arezzo - 2012

39

Riferimenti- Foxes&Fishes: http://www.foxesandfishes.it- eCompliance: http://web.rete.toscana.it/eCompliance- CART: http://www.cart.rete.toscana.it- InterPro e AP@CI: http://www.e.toscana.it/e-toscana/it/inter_pro.wp- eToscana: http://www.e.toscana.it- RTRT: http://www.rtrt.it- Open Document - http://it.wikipedia.org/wiki/OpenDocument- ADI - www.digitpa.gov.it- Metadati - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%205%20-

%20Metadati.pdf- Pacchetto di Archiviazione - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%204%20-%20Specifiche%20tecniche%20pacchetto

%20archiviazione.pdf- FORMATI - http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%202%20-%20Formati.pdf

Walter [email protected]