[email protected] · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione...

26
La conservazione delle e-mail SILVIO SALZA Università degli Studi di Roma “La Sapienza” [email protected] 6ª CONFERENZA ORGANIZZATIVA DEGLI ARCHIVI DELLE UNIVERSITÀ ITALIANE Padova 28 ottobre 2009

Transcript of [email protected] · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione...

Page 1: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 1

La conservazione delle e-mail

SILVIO SALZAUniversità degli Studi di Roma “La Sapienza”

[email protected]

6ª CONFERENZA ORGANIZZATIVA DEGLI ARCHIVI DELLE UNIVERSITÀ ITALIANEPadova 28 ottobre 2009

Page 2: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 2

L’irresistibile ascesa dell’e-mail

• 1971 – Prima e-mail inviata tra due computer (sono nella stessa stanza, ma transita attraverso la rete Arpanet)

• 1980-1990 – La posta elettronica si consolida come strumento di comunicazione nella comunità scientifica

• 1990-2000 – Nasce il Web, Internet si apre al grande pubblico, e con essa l’uso della posta elettronica

• 2000-2010 – Internet supera il miliardo di utenti e l’e-mail diviene la più diffusa forma di comunicazione scritta

• 2009- .…. – Altre forme di comunicazione (messaggistica istantanea) insidiano il predominio dell’e-mail

Page 3: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 3

Una rivoluzione negli archivi?

• Un grande flusso di informazioni si sposta dal parlato(telefono) allo scritto (posta elettronica)

• Le telefonate non possono essere archiviate (almeno si spera…), ma le e-mail sì!

• Rispetto al passato, l’archiviazione delle e-mail può dare un contributo determinante per la ricostruzione degli eventi

• L’uso del telefono nella seconda metà del ‘900 ha ci ha privato della memoria di molta della comunicazione rapida

Potremmo parlare di ritorno al passato nella comunicazione scritta: a Londra e Parigi alla fine dell’800 la posta veniva

recapitata in mezza giornata; poi il telefono e l’inefficienza dei servizi postali hanno modificato le abitudini

Page 4: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 4

Vettore o documento?

• Grazie al meccanismo degli allegati, il messaggio di posta elettronica ha una doppia valenza:

A. È un vettore che permette di fissare tempi e dettagli di spedizione e consegna dei documenti che vengono trasmessi come allegati

B. È un documento esso stesso, quando si considera l’informazione contenuta nel corpo del messaggio

Limitarsi alla prima visione è molto riduttivo:– Si cerca di ignorare consuetudini ormai consolidate

nell’uso dello strumento– Si rischia di ingessare il processo di comunicazione– Si rischia di trascurare la conservazione di informazioni

importanti

Page 5: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 5

La posta elettronica nella PA

• L’uso della posta elettronica è incoraggiato nella PA ed è stato sponsorizzato da tutti i ministri della Funzione Pubblica

• Da questa rivoluzione ci si attendono risparmi mirabolanti• Il Codice dell’Amministrazione Digitale fornisce importanti

presupposti:– Prevede l’e-mail per la comunicazione tra pubbliche

amministrazioni– Istituisce la Posta Elettronica Certificata

• Tuttavia …..– Le buone intenzioni quasi sempre si infrangono sulle barriere

normative che nessuno si dà la pena di rimuovere– Raramente ci si preoccupa che i presupposti all’uso della

posta elettronica siano effettivamente garantiti– Uno di questi è risolvere il problema dell’archiviazione

Page 6: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 6

Perché archiviare la posta elettronica?

• Obblighi normativi– Messaggi con valenza formale possono essere soggetti a

obblighi di conservazione– L’e-mail è un documento elettronico, o, come minimo, ne può

essere il vettore– Alcune informazioni potrebbero dover essere esibite in sede

di controversia legale (negli USA la mancata esibizione èequiparata all’occultamento volontario)

• Incentivazione dell’uso dello strumento– La garanzia che i messaggi sono archiviati ne promuove

l’uso anche per comunicazioni formali– Abbattimento dei costi e dei tempi

Se veramente vogliamo sostituire la corrispondenza cartaceacon la posta elettronica dobbiamo prima creare i presupposti

Page 7: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 7

Perché archiviare la posta elettronica (2)

• Importanza strategica– I messaggi contengono informazioni di rilevanza strategica

per le organizzazioni (private e pubbliche)– Si stima che la posta elettronica contenga addirittura il 75%

della proprietà intellettuale delle aziende. • Integrazione con il workflow

– L’integrazione dell’e-mail nel workflow snellisce e introduce efficienza e velocizza le procedure amministrative

– Accesso ai messaggi archiviati tramite paradigmi di ricerca sofisticati ed efficaci

• Conservazione storica (last but not least)– Preservare la memoria storica è un obbligo verso la civiltà

e la cultura

Page 8: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 8

Il problema dei volumi

• Troppi messaggi– Ogni giorno nel mondo vengono inviati più di 200 miliardi di

messaggi di posta elettronica• Troppe schifezze

– Spam: disgustosa e misteriosa carne in scatola (mystery meat), da uno sketch cult dei Monty Python (1970)

– Oggi ben oltre il 60% dei messaggi sono spam• Ma anche il resto ….

– Tolto lo spam (magari!), non tutto quello che resta è degno di attenzione

– Molti messaggi sono privi di interesse– Nel processo di archiviazione è molto difficile individuare i

messaggi significativi

Page 9: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 9

Un documento un po’ particolare

I messaggi di e-mail sono figli di Internet, nel bene e nel male

• Aspetti positivi– Internet deve garantire l’interoperabilità: nella torre di

Babele sono indispensabili regole precise– Struttura e modalità di gestione dei messaggi regolate da

precisi standard internazionali– I messaggi contengono al loro interno una messe di

informazioni da cui estrarre metadati• Aspetti negativi

– Internet è libera e senza controllo per definizione: nessuno garantisce che le regole siano osservate

– L’assenza di controllo introduce anche problemi di autenticità e integrità

Page 10: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 10

Struttura dei messaggi

INTESTAZIONE

PARTE 1

PARTE n

Messaggio informato standardRFC 2822/MIME

Testo del messaggioe allegati

Dati su mittente, destinatario, processodi consegna e strutturadel messaggio

La struttura precisa dei messaggi ben si presta ad una automazione delle procedure di archiviazione, sia per

l’individuazione e la gestione dei contenuti che per l’estrazione dei metadati e la classificazione

Page 11: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 11

Il processo di archiviazione

• Cattura– Selezione e individuazione dei messaggi da archiviare

• Classificazione e metadatazione– Estrazione automatica e intervento degli utenti

• Gestione dei formati– Occorre garantire la interpretabilità dei formati nel tempo

• Gestione dell’autenticità e dell’integrità– Superare le scarse garanzie fornite da Internet

• Conservazione– Garantire integrità e leggibilità nel tempo

Comporta la soluzione di tutta una serie di problemi:

Page 12: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 12

Cattura dei messaggi

• Cattura lato server– I messaggi sono catturati non appena giungono nel server– Possono essere usate regole di selezione e filtraggio– Idonea per conservazione “di massa”

• Cattura lato client– Gli utenti sono coinvolti nel processo di selezione e cattura

dei messaggi• Schema misto

– Basata sulla selezione preliminare lato server– Gli utenti devono successivamente fornire il consenso e

scegliere la classificazione e i metadati tra un ventaglio prospettato

Page 13: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 13

Cosa catturare

• Tutto– Facile da implementare– Alta percentuale di mail inutili– Difficile la ricerca– Problemi di privacy nelle aziende

• Solo i messaggi selezionati– Limitata efficacia dei filtri e dei sistemi di selezione

automatici– Il coinvolgimento degli utenti può essere problematico

(problemi di tempo, soggettività, malafede …)

Page 14: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 14

Estrazione dei metadati

• Messaggio– Message ID, subject, sender, recipients

• Consegna– Data, ora e altre informazioni relative al processo di

consegna• Thread

– Connessioni logiche tra i messaggi (risposta, inoltro, ricevute)

• MIME– Struttura del messaggio e formati degli allegati

Diverse tipologie di metadati possono essere estratte automaticamente dalla testata del messaggio (header)

Page 15: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 15

Classificazione dei messaggi

• Classificazione automatica– Basata su strumenti automatici di classificazione– Sfruttano le informazioni contenute nell’intestazione

(es. mittente, oggetto …) e nel testo (parole chiave)– Necessaria, almeno come primo livello, nella cattura

lato server • Intervento dell’utente

– Destinatario, mittente e archivista controllano o provvedono alla classificazione

– Può limitarsi alla selezione tra alternative suggerite da strumenti automatici

Possibili diverse opzioni (e le loro combinazioni):

Page 16: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 16

Il problema dei formati

• Messaggi in formato standard RFC 2822/MIME– Il corpo può essere in testo semplice o in html – Una corretta restituzione dipende dalla codifica dei

caratteri, in genere ISO-88591 UTF8 (ma non sempre)– Frequenti errori (es. caratteri accentati)

• Gli allegati possono avere formato qualsiasi– Per la visualizzazione di un allegato è necessario

disporre dell’applicazione che lo ha creato o di una compatibile

Mantenere l’integrità degli allegati significa garantirne la restituzione in forma identica a quella in cui sono stati creati, e nella quale l’autore li ha concepiti e percepiti

Page 17: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 17

Autenticità ed integrità

• I problemi– La sicurezza dell’e-mail è un punto dolente– Tecniche di contraffazione relativamente semplici– Difficile stabilire autenticità e integrità– Problemi anche per la riservatezza dei contenuti

• Le soluzioni– Autenticazione tramite certificati digitali (firma digitale)– Forme di autenticazione ‘debole’ sono più che sufficienti

in molte circostanze– Lo standard S-MIME e quasi i tutti i client supportano

firma e cifratura– La cifratura pone i noti problemi in sede di archiviazione

Page 18: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 18

La Posta Elettronica Certificata (PEC)

• Prevista dal Codice dell’Amministrazione Digitale e attualmente operativa

• Basata su una rete di provider certificati (stile firma digitale)• Richiede l’uso di caselle certificate: tutte le PA centrali sono

obbligate ad avere caselle di PEC• La PEC garantisce autenticità ed integrità:

– Prova dell’invio del messaggio (non ripudio)– Prova della ricezione del messaggio– Integrità del contenuto (impronta digitale del messaggio)

È uno strumento utile ed efficace, ma un’estensione generalizzata della PEC può non essere opportuna

e rischia di ingessare la comunicazione tramite e-mail

Page 19: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 19

Scenari di conservazione

• Conservazione di breve e medio periodo– Orizzonte temporale inferiore a 10 anni– Relativamente semplice garantire la leggibilità di

messaggi ed allegati– Occorre comunque censire tutti i formati archiviati e

garantire la disponibilità delle relative applicazioni• Conservazione di lungo periodo

– Orizzonte temporale superiore a 10 anni– Non è pensabile garantire la disponibilità delle

applicazioni– Problemi anche relativi alla memorizzazione digitale– Si spera di poter contare nel medio termine su centri di

servizio a livello regionale o nazionale

Page 20: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 20

Conservazione di lungo periodo

• Conservazione del messaggio originale– Conservare comunque una copia del messaggio nel suo

formato originale (RFC 2822/MIME)– Mantiene l’originalità del messaggio ma non garantisce

la leggibilità degli allegati• Conversione degli allegati

– Estrazione degli allegati e loro archiviazione come oggetti collegati ma indipendenti

– Conversione in formati che garantiscano la leggibilità nel tempo

– Per tutti gli oggetti stampabili possono essere usati i cosiddetti formati di stampa

– La conformità agli originali dovrebbe essere attestata in sede di archiviazione

Page 21: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 21

Conservazione degli oggetti digitali

• Carenze normative: il punto di riferimento resta ancora la deliberazione Cnipa 11/2004 (supporti ottici)

• Cosa manca:– Regole sulla qualità di supporti e registrazioni– Criteri per stabilire la loro durata– La cultura del ‘processo di qualità’

• Il processo di conservazione è comunque così complesso che non ha senso gestirlo su piccola e media scala

Una via d’uscita (sia per i privati che per la PA) può essere la creazione la centri di servizio a livello

regionale o nazionale, nell’ambito di un sistemamolto rigoroso di regolamentazione e certificazione

Page 22: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 22

E-mail e protocollo informatico

• Nella PA il processo di archiviazione inizia con il protocollo– Il protocollo informatico riguarda oggi prevalentemente

immagini scannerizzate di documenti cartacei– Rrichiesto un consistente intervento umano

• La protocollazione dei messaggi di e-mail offre larghi spazi ad una gestione largamente automatizzata– Messaggi in entrata

− Estrazione automatica dei metadati− Selezione fra proposte alternative

– Messaggi in uscita− Integrazione della funzione nei client di e-mail− Generazione di messaggi con segnatura di

protocollo

Page 23: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 23

Il problema della privacy

• La tutela della posta elettronica è assimilata alla tutela della corrispondenza– Il contenuto dei messaggi di posta elettronica – come

pure i dati esteriori delle comunicazioni e i file allegati –riguardano forme di corrispondenza assistite da garanzie di segretezza tutelate anche costituzionalmente

– … un'ulteriore protezione deriva dalle norme penali a tutela dell'inviolabilità dei segreti

– Linee guida Garante: deliberazione 13/2007• Limiti restrittivi sulla durata della conservazione• L’eventuale uso “promiscuo” della posta aziendale viene

attribuito all’assenza di policy che la regolamentino

Page 24: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 24

Privacy: come tutelarsi

• Caselle associate agli uffici e alle funzioni e condivise tra piùdipendenti

• Ulteriori indirizzi destinati all’uso privato dei singoli dipendenti: ma contrasta con l’articolo 314 del CP (peculato)!!

• Regole chiare per il routing delle e-mail in caso di assenza• Sistema di deleghe per l’accesso alla casella di posta in caso di

necessità• Avvertimento ai destinatari circa la natura non personale dei

messaggi

La definizione di regole precise cui sia data adeguata pubblicitàpuò rendere possibile la gestione automatizzata dell’e-mail

Si consiglia alle PA di dotarsi di un adeguato disciplinare sull’uso di Internet ed e-maiil; alcune PA lo hanno già fatto

Page 25: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 25

Prodotti di mercato

• Ampio mercato di prodotti per l’archiviazione della e-mail• Fatturato annuo che supera il mezzo miliardo di dollari• Caratteristiche dei prodotti

– Integrazione con client e sistemi per gestione dell’e-mail (MS Exchannge e Outlook, IBM Lotus Domino)

– Supporto alla classificazione dei messaggi – Possibilità di definire regole articolate per la

conservazione o la cancellazione delle e-mail– Integrazione con i sistemi documentali e di gestione dei

contenuti• Può essere necessario realizzare comunque un ulteriore

strato di software applicativo

Page 26: salza@dis.uniroma1 · SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail 6ª Conferenza organizzativa degli archivi delle università italiane

SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009 26

Conclusioni

• Molte ragioni valide per predisporre l’archiviazione della posta elettronica

• Presupposto fondamentale ad un ampia diffusione della posta elettronica anche nelle comunicazioni formali

• L’e-mail come documento ha molti aspetti positivi:– Standardizzazione del formato– Automazione della classificazione e metadatazione

• Il problema del formato degli allegati: ma vale per tutti i documenti informatici

• Problematica gestione degli aspetti di privacy: in parte risolti da disciplinari che definiscano le policy