La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

98
M.Messina, 6-7.11.2008 LA DIGITALIZZAZIONE DEI FONDI ANTICHI Corso per l’Associazione Italiana biblioteche, Sezione Friuli , 6-7 Novembre 2008 Maurizio Messina [email protected]

description

La digitalizzazione dei fondi antichi. Corso per l'Associazione Italiana Biblioteche, Sezione Friuli, 2008.

Transcript of La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

Page 1: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA DIGITALIZZAZIONE DEI FONDI ANTICHI

Corso per l’Associazione Italiana biblioteche, Sezione Friuli , 6-7 Novembre 2008

Maurizio [email protected]

Page 2: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA DIGITALIZZAZIONE DEI FONDI ANTICHI

Quest'opera è stata rilasciata sotto la licenza Creative Commons Attribuzione-Non commerciale-Non opere derivate 2.5 Italia. Per leggere una copia della licenza visita il sito web http://creativecommons.org/licenses/by-nc-nd/2.5/it/

Page 3: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PER UN’ONTOLOGIA DELLE BIBLIOTECHE DIGITALI - 1

ONTOLOGIA:• Specificazione di un ambito

concettuale• Individuazione dei concetti coinvolti e

delle relazioni fra i concetti• Definizione di una terminologia

Page 4: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PER UN’ONTOLOGIA DELLE BIBLIOTECHE DIGITALI - 2

LE PAROLE DELLE BIBLIOTECHE DIGITALI• Pluralità, il centro è il punto di vista dell’utente

• Convergenza, dei domini digitali di entità diverse

• Interoperabilità, tecnica, semantica, giuridica, amministrativa, organizzativa

• Integrabilità, riorganizzazione virtuale dei domini digitali anche da parte dell’utente finale

(Claudio Leombroni, 2003)

• Linguaggio, parlare il linguaggio degli utenti

• Persistenza, mantenimento, integrità, autenticità dei contenuti

• Sostenibilità, organizzativa, funzionale, finanziaria

Page 5: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

ALCUNI TESTI DI RIFERIMENTO

• Manifesto per le biblioteche digitali. AIB, 2005 http://www.aib.it/aib/cg/gbdigd05a.htm3

• The Digital Libraries Manifesto. DELOS, [2006] http://delos-dl.isti.cnr.it/OLP/UI/1.0/Load/manifestation_ext/1227463918OgqR0T0r4W?uri=http%3A//146.48.87.21%3A8003/OLP/Repository/1.0/Disseminate/delos/2006_other_0081/content/pdf%3Fversion%3D1&epl_content_type=application/pdf

• R. David Lankes, Joanne Silverstein, Scott Nicholson. Le reti partecipative: la biblioteca come conversazione. AIB, 2007 http://www.aib.it/aib/cg/gbdigd07.htm3

• Riccardo Ridi. Manifesto per la biblioteca ipertestuale. In: «Bibliotime», anno X, numero 3 (novembre 2007) http://www2.spbo.unibo.it/bibliotime/num-x-3/ridi.htm

Page 6: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA BIBLIOTECA DIGITALE

“una zona controllata di Internet. In questo spazio informativo si possono trovare risorse digitali controllate e filtrate da specialisti e risorse digitali acquisite o create dalla biblioteca. Le risorse che vi si trovano hanno come caratteristiche di qualità l’integrità, l’accuratezza e l’aggiornamento. L’accesso è facilitato attraverso indici e classificazioni. Infine sono resi disponibili servizi personalizzati per l’utenza”

Alberto Salarelli, Annamaria Tammaro. La biblioteca digitale. Milano : Bibliografica, c2000

Page 7: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA BIBLIOTECA DIGITALE una definizione ancora valida

“le biblioteche digitali sono organizzazioni che forniscono le risorse, compreso il personale specializzato, per selezionare, organizzare, dare l’accesso intellettuale, interpretare, distribuire, preservare l’integrità e assicurare la persistenza nel tempo delle collezioni digitali così che queste possano essere accessibili prontamente ed economicamente per una comunità definita o per un insieme di comunità”

Digital Library Fedration , 1995 http://www.diglib.org/

Page 8: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA BIBLIOTECA DIGITALE

• La biblioteca ibrida: integrare le risorse su supporto tradizionale e le risorse digitali in un contesto di servizio adeguato alle mutevoli esigenze degli utenti

• Le biblioteche digitali: la produzione di contenuti scientifici e culturali originali

• Le biblioteche digitali: un soggetto attivo nella catena di valore dell’informazione e delle risorse culturali

• Le biblioteche digitali: collezioni digitali primarie e secondarie

Page 9: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

IL PROGETTO DI DIGITALIZZAZIONE aspetti rilevanti

• Creazione di nuovi documenti• Produzione di nuovi contenuti• Da un punto di vista tecnico:

creazione di oggetti digitali, rappresentati da file digitali, cioè da sequenze di bit

Page 10: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

FASI DI UN PROGETTO (da

contestualizzare) • Ideazione• Studio di fattibilità• Pianificazione operativa (definizione di:

obiettivi finali e intermedi, tempi, costi, controlli di qualità, criteri di collaudo)

• Esecuzione delle attività• Controllo e valutazione• Chiusura e comunicazione dei risultati

Page 11: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 1

• La digitalizzazione è finalizzata all’accessibilità ed alla fruizione dei contenuti

• La digitalizzazione non è uno strumento di conservazione degli originali analogici

• Progetti analoghi o simili (sinergie)?

Page 12: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 2Analisi dei rischi, es.:• Situazione dei diritti• Finanziamenti / sostenibilità• Situazione catalografica• Necessità di competenze specialistiche• Obiettivi “nascosti” (nei progetti

cooperativi) • .....

Page 13: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 3

Inscindibilità della definizione degli obiettivi e del modello dei servizi

• Modalità d’uso degli oggetti digitali• Diritti e sistemi di protezione• Eventuali aspetti commerciali• Utenza di riferimento e livello di interazione

previsto• Relazioni con reti parallele/sovraordinate• Permeabilità della base dati ad agenti esterni• Continuità del servizio, integrità ed autenticità dei

contenuti• .....

Page 14: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

CRITERI DI SELEZIONE DEL MATERIALE - 1

• Digitalizzare collezioni• La digitalizzazione di questa collezione (o di

questo fondo, o di questa tipologia di materiale) comporta un miglioramento significativo nel modo in cui gli utenti possono accedervi e servirsene, o consente a nuove fasce di utenza di accedervi e servirsene utilmente, magari per finalità nuove o impreviste?

Page 15: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

CRITERI DI SELEZIONE DEL MATERIALE - 2

• Buon bilanciamento fra alto valore della collezione e elevata domanda (reale o potenziale)

• Digitalizzazione appropriata per il tipo di materiale• Manipolazione priva di rischi• Diritto d’autore?• Materiale già catalogato e presente in OPAC• Riunione virtuale di collezioni fisicamente separate• Sostenibilità dell’impatto sull’organizzazione• Rapporto costi-benefici

Accessibilità VS Conservazione

Page 16: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

CATALOGAZIONE vs DIGITALIZZAZIONE

• non si dovrebbe (non si deve) procedere alla digitalizzazione di documenti che non siano già stati catalogati, e per i quali non si disponga di record catalografici in un formato bibliografico standard disponibili al pubblico in rete su sistemi di recupero delle informazioni

• tutte le esigenze di natura descrittiva relative ai documenti e agli oggetti digitali devono essere pienamente soddisfatte al livello delle descrizioni formalizzate dei documenti analogici fonte; non andranno di norma descritti i documenti digitali frutto delle operazioni di scansione

Page 17: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

DEFINIZIONE DELLE COMPONENTI DEL SISTEMA

• Software applicativo di catalogazione• Archivio dei record catalografici

(OPAC)• Archivio degli oggetti digitali• Archivio dei metadati associati agli

oggetti digitali

Page 18: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI RECORD CATALOGRAFICI

Record catalografici = metadati descrittivi

• definizione: informazioni su altre informazioni, o “dati che descrivono o caratterizzano altri dati” (McClennen, 2002)

• i metadati descrittivi sono finalizzati all’identificazione, descrizione e recupero dei documenti digitali (finding-aids)

Page 19: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI

DESCRITTIVI - 1• Dublin Core Metadata Initiative (DCMI)

“La DCMI è un forum aperto impegnato nello sviluppo di standard per metadati interoperabili in linea e tali da sostenere una serie ampia di attività e modelli operativi diversi”. La missione della DCMI è facilitare il reperimento di risorse in Internet attraverso le seguenti attività:

- Sviluppo di standard per i metadati per la ricerca inter-dominio

- Definizione di schemi per l’interoperabilità fra i set di metadati

- Impulso allo sviluppo di specifici set di metadati di tipo disciplinare coerenti con i punti precedenti

http://dublincore.org/

Page 20: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI

DESCRITTIVI - 2

i 15 elementi del Dublin Core: (Dublin Core Metadata Element set, Version 1.1: Reference Description)

Titolo; Creatore; Soggetto; Descrizione; Editore; Autore di contributo subordinato; Data; Tipo di risorsa; Formato; Identificatore; Fonte; Lingua; Relazione; Copertura; Gestione dei diritti

http://www.iccu.sbn.it/genera.jsp?id=116

Page 21: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI

DESCRITTIVI - 3 • i 15 elementi del Dublin Core:

- semplicità di utilizzo - interoperabilità semantica (rete di dati con significato comune) - promozione di uno strumento utile per una infrastruttura internazionale - flessibilità (possibilità di integrazione di semantiche diverse appropriate al contesto) - minimo comune denominatore per la descrizione, in una base dati integrata, di documenti digitali provenienti da settori diversi del mondo dei beni culturali (archivi, biblioteche, musei) e dell’informazione (autori, editori)

Page 22: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI

DESCRITTIVI - 4

• Dublin Core simple e Dublin Core qualified

• DC non specifica nessuna struttura, nessuna sintassi per esprimere i 15 elementi in funzione dello scambio o del trasferimento dei record; nelle applicazioni di biblioteca digitale i record DC vengono abitualmente espressi in formato XML.

Page 23: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI DEGLI OGGETTI DIGITALI

• Documenti, Oggetti e file digitali• Requisiti - accessibilità permanente - integrità - conservazione permanente - interoperabilità

• L’Open Archival Information System (OAIS) ISO 14721/2003

http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=24683

Page 24: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

1

Archivio OAIS: “un'organizzazione di soggetti e sistemi che hanno accettato la responsabilità di conservare l'informazione e di mantenerla disponibile per la comunità di riferimento”. 

Page 25: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

2

“OAIS individua termini e concetti rilevanti per l'archiviazione di documenti digitali, identifica le componenti ed i processi chiave comuni alla maggior parte delle attività di conservazione digitale, e propone un modello logico di riferimento per gli oggetti digitali ed i metadati loro associati, che comprende la creazione e l'uso dei metadati utili a gestire il materiale elettronico, dalla fase di acquisizione a quella della conservazione, fino alla fase di accesso”

Page 26: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

3

OAIS “non specifica nessun tipo di implementazione e può essere applicato indifferentemente a oggetti digitali nativi, a prodotti di attività di digitalizzazione (quali files di immagini), e persino a oggetti fisici”

Page 27: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

4

Le funzioni

- Immissione

- Archiviazione - Gestione - Accesso - Amministrazione - Pianificazione della conservazione

Page 28: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

5

Il modello di strutturazione dei dati• L’Oggetto informativo è composto da: - i Dati (Sequenza di bit) - l’Informazione sulla rappresentazione

(tutto quanto serve a rendere quei dati accessibili, comprensibili ed utilizzabili: formato dei dati, SW di accesso, condizioni d’uso e quant’altro)

• I dati, in unione alla loro Informazione sulla Rappresentazione, veicolano significato

Page 29: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

6

Modi di “confezione” dei dati(Packaging Information)

• SIP (Submission Information Package): Immissione

• AIP (Archival Information Package): Archiviazione• DIP (Dissemination Information Package):

Distribuzione

Page 30: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

7

Page 31: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’Open Archival Information System (OAIS) -

8

Obblighi/Responsabilità dell’Archivio• Negoziare ed accettare informazioni appropriate dal Produttore di

informazione• Ottenere un sufficiente controllo sull’informazione fornita, adeguato

al livello necessario a garantire la conservazione a lungo termine• Identificare la Comunità di fruizione designata, in grado di

comprendere l’informazione fornita• Assicurare che l’informazione da conservare sia comprensibile da

parte della Comunità designata senza avere bisogno dell’ausilio del Produttore di informazione

• Implementare e mantenere politiche e procedure documentate che assicurino la conservazione dell’informazione in ogni situazione prevedibile, e che garantiscano che l’informazione disseminata a seguito di una richiesta costituisca una copia identica dell’informazione originale, o che sia tracciabile sull’originale

• Rendere l’informazione così conservata effettivamente disponibile per la comunità designata. (Angela Di Iorio, 2007)

Page 32: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA DISSEMINAZIONE DEGLI OGGETTI DIGITALI: L’Open Archives Initiative

Protocol for Metadata Harvesting (OAI-PMH) - 1

• Protocollo di pubblico dominio (open source = a codice sorgente aperto) sviluppato nell’ambito della comunità degli Archivi aperti (open access)

• Consente l’interoperabilità fra gli archivi aperti che lo adottano (ricerche su una pluralità di archivi, accessibilità del singolo archivio da parte di tutti gli altri) attraverso l’”esposizione” in rete dei metadati associati agli oggetti digitali

• Ciascun archivio può inviare e/o ricevere richieste di accesso agli oggetti digitali tramite una procedura standard

http://www.openarchives.org/OAI/2.0/

openarchivesprotocol.htm

Page 33: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’Open Archives Initiative Protocol for Metadata Harvesting

(OAI-PMH) - 2Entità

• Data Provider: è il gestore di uno o più archivi di documenti digitali che supportano il protocollo OAI-PMH; espone e rende accessibili i metadati relativi a quei documenti.

• Service Provider: è un qualunque servizio web (harvester) che interroga gli archivi di documenti digitali del/dei Data provider usando le modalità di richiesta previste dal protocollo OAI-PMH; cattura i metadati esposti dal Data provider e li usa per costruire servizi a valore aggiunto (es. servizi di indicizzazione e interfacce di ricerca).

(Valdo Pasqui, 2001)

Page 34: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’Open Archives Initiative Protocol for Metadata Harvesting

(OAI-PMH) - 3Funzioni (verbs)

• Get record: per ottenere uno specifico record (cioè i metadati relativi ad un documento digitale dell'archivio)

• List identifiers: per ottenere gli identificatori dei record che possono essere catturati dall'archivio

• List records: per ottenere un insieme di record• Identify: per ottenere informazioni sull'archivio• List metadata formats: per ottenere i formati di

metadati resi disponibili dall'archivio• List sets: per ottenere la struttura dei set

(partizioni)

Page 35: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’Open Archives Initiative Protocol for Metadata Harvesting

(OAI-PMH) - 4• OAIster: http://oaister.umdl.umich.edu/o/oaister/

• OPENDOAR: http://www.opendoar.org/

Page 36: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: l’ambiente software per la gestione - 1

• Software proprietario o software a codice sorgente aperto?

• Analisi di mercato della Biblioteca Nazionale della Repubblica Ceca, 2007 (digitalpreservationeurope) http://www.digitalpreservationeurope.eu/publications/dpe-market-analysis.pdf

• Confronto fra software per la gestione di Digital repository. Firenze : FRD, 2006 http://documenti.rinascimento-digitale.info/doc-pdf/ConfrontoRepository2006-8.pdf

Page 37: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEGLI OGGETTI DIGITALI: l’ambiente software per la gestione - 2

• OPENDOAR: http://www.opendoar.org/

Page 38: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 1

Tassonomia dei metadati (categorie funzionali)

• descrittivi: per l’identificazione, la descrizione ed il recupero degli oggetti digitali;

• amministrativi (e gestionali n.d.r., MAG): per le varie operazioni di gestione degli oggetti digitali all’interno dell’archivio;

• strutturali: per descrivere la struttura interna dei documenti e gestire le relazioni fra le varie parti componenti di oggetti digitali complessi (relazioni parte/tutto, ma non solo)

R. Wendler. LDI Update: Metadata in the Library. In: “Library Notes”, n. 1286 (1999), p. 4-5

Page 39: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 2, il MAG

Schema

• Comitato MAG. Manuale utente : versione 2.0.1. Roma : ICCU, 2006.

“costituisce uno strumento di supporto alle attività di impianto e di gestione di basi dati di oggetti digitali che formano una collezione digitale. Tali oggetti possono essere il prodotto di lavori di digitalizzazione di originali analogici o essere digitali nativi, e possono avere molteplici tipologie: immagini statiche, documenti in formato testo, suono, documenti audiovisivi, e insieme possono generare collezioni digitali multimediali”

Page 40: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 3, il MAG

Schema

• Il MAG schema come profilo di applicazione• MAG e METS• METS come contenitore di schemi di metadati

“completamente agnostico riguardo agli schemi da utilizzare nelle varie sezioni” (Angela Di Iorio, 2007)

• Il “Comitato MAG”: diffusione dello Schema, suo mantenimento ed evoluzione,

produzione di manuali e linee guida, assistenza agli implementatori, formazione e promozione, rapporti con altri progetti e agenzie

Page 41: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 4, il MAG

Schema• “Il MAG Schema costituisce dunque un profilo di

applicazione (application profile) che ha l'obiettivo di fornire le specifiche formali per la fase di raccolta, di trasferimento e disseminazione dei metadati e dei dati digitali nei rispettivi archivi” (Comitato MAG. Manuale utente, cit. p.6.)

• ”Si può definire un profilo di applicazione un “assemblaggio” di elementi di metadati selezionati da uno o più schemi. L’obiettivo di un profilo è combinare gli schemi di metadati esistenti in un “pacchetto” che si adatta alle funzioni richieste da una particolare applicazione pur mantenendo una interoperabilità con lo schema di base originale” (Cristina Magliano. I profili di applicazione, 2005)

Page 42: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 5, il MAG

SchemaI MAG consentono di:

• identificare in maniera univoca gli oggetti digitali

• certificare l’autenticità e l’integrità dei contenuti

• fornire informazioni, anche in maniera indiretta, sulle condizioni e i diritti di accesso agli oggetti digitali da parte degli utenti finali

Page 43: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 6, il MAG

Schema• è definito per tipologie di oggetti digitali e non per tipologie

di oggetti fonte• è espresso nella sintassi XML• si presenta come uno standard aperto, documentato,

liberamente disponibile e del tutto indipendente da specifiche piattaforme HW e SW

• non obbliga all’uso di una particolare struttura di archivio digitale

• comprende una quantità limitata di metadati descrittivi, ereditati dagli applicativi di catalogazione ed espressi in formato Dublin Core

• di norma i MAG vanno associati al documento digitale nel suo complesso, ma comprendono anche informazioni relative all’unità elementare dell’archivio, il singolo oggetto digitale

• i MAG vanno raccolti/prodotti con procedure automatizzate

Page 44: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 7, il MAG

SchemaIl MAG Schema nella versione 2.0.1 è composto dalle

seguenti sezioni: • GEN: informazioni generali sul progetto e sul tipo di

digitalizzazione • BIB: metadati descrittivi dell’oggetto fonte • STRU: metadati strutturali dell’oggetto digitale• IMG: metadati tecnici specifici per le immagini statiche • OCR: metadati tecnici specifici relativi a testi riconosciuti

otticamente• DOC: metadati tecnici specifici per file digitali (es. html o

pdf)• AUDIO: metadati tecnici specifici per file audio • VIDEO: metadati tecnici specifici per file video • DIS: metadati specifici per la distribuzione degli oggetti

digitali

Page 45: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 8, il MAG

SchemaCasi d’uso della Sezione <stru>

• quando si ritenga opportuno mettere in evidenza le eventuali partizioni interne di un documento digitale (es. capitoli di un libro);

• nel caso di spogli, laddove le partizioni spogliate (es. articoli di una rivista, canzoni di un CD) siano autonome, cioè tali da avere una propria sezione BIB;

• per far riferimento ad altri oggetti MAG correlati non appartenenti alla stessa tipologia, per esempio nel caso di un cofanetto contenente 1 CD musicale e un fascicolo di testo.

Page 46: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 9, il MAG

Schema

Come produrre i MAG? - 1

• I metadati descrittivi (sezione <bib>) e strutturali (sezione <stru>) sono di norma ereditati dagli applicativi di catalogazione

• I metadati amministrativi e gestionali di natura tecnica sono di norma prodotti dal sw di scansione

• Appositi tools li riassemblano e li associano a ciascun set di immagini relative ad un record catalografico

Page 47: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 10,il MAG

SchemaCome produrre i MAG? - 2

Alcuni requisiti di un pacchetto sw per la produzione di MAG• Creazione una volta per tutte delle informazioni ripetitive (es. per la

sezione <bib>)• Importazione di record bibliografici da fonti esterne• Elaborazione di elementi della descrizione bibliografica per il

popolamento delle sezioni <bib> e <stru> e per facilitare il workflow della digitalizzazione

• Costruzione e presentazione al digitalizzatore del piano di scansione• Importazione dall’applicativo di scansione dei metadati tecnici per

la sezione <img>• Assemblaggio dei metadati in un file xml• Estrazione dei metadati necessari a consentire l’harvesting OAI/PMH

da parte dei Service provider

Page 48: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 11,il MAG

Schema

Come produrre i MAG? - 3

Page 49: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 12,il MAG

Schema

Come produrre i MAG? - 4

Page 50: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 13,il MAG

Schema

Come produrre i MAG? - 5

Page 51: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI – altri schemi

Metadati per la gestione dei diritti

• METS schema for rights declaration: http://cosimo.stanford.edu/sdr/metsrights.xsd • XrML (eXtensible Rights Markup Language) http://www.xrml.org/

• ODRL (Open Digital Rights Language) http://odrl.net/

Page 52: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA DEFINIZIONE DEL FLUSSO DI LAVORO

• Movimentazione del materiale• Controllo bibliografico ed eventuale bonifica• Digitalizzazione• Post-produzione delle immagini• Assemblaggio dei metadati• Controlli di qualità• Ricollocazione fisica del materiale• Popolamento dell’archivio digitale, connessione

OPAC• Pubblicazione/messa in servizio• Piano di comunicazione e marketing dei servizi

Page 53: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’ALLESTIMENTO DELL’AMBIENTE DI LAVORO

• Apparati di scansione• Sistema di illuminazione• Un laboratorio fotografico

Page 54: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE - 1

La qualità desiderata delle immagini master condiziona:

• Scelta degli apparati HW e degli applicativi SW• Tempi di acquisizione ed elaborazione delle

immagini• Spazio disco per lo storage• Oneri di gestione a carico del personale • Costi

Page 55: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE - 2

• Immagine digitale raster: insieme di dati numerici che si realizza in una matrice di punti colorati detti pixel

• Densità (o frequenza) di campionamento spaziale: si esprime in ppi (pixel x inch), indica quanti pixel “entrano” nel corrispettivo digitale di un pollice (2,54 cm) del documento analogico

• Risoluzione:”distanza minima D fra due linee ben contrastate … tale che queste ultime possano essere percepibili come distinte”

(Franco Lotti, Giorgio Trumpy. La digitalizzazione documentaria. Firenze :

Fondazione Rinascimento digitale, 2007, p.14-15)

Page 56: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 3

Pieter Van Der Aa. Galerie agrèable du monde … [1729], Tav. 108

Page 57: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 4

Domenico Scarlatti. Sonate, Libro 5. 1753, c1v

Page 58: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 5

Il sistema di rappresentazione dei colori Red (canale rosso) Green (canale verde) Blue (canale blu) (RGB)

• Tutti gli altri colori sono una miscela dei tre primari• Ai tre canali primari corrispondono tre diverse intensità

luminose, che vengono rilevate dal sensore dello scanner per ciascun pixel

• Un convertitore analogico/digitale converte il segnale elettrico che esprime le intensità luminose in bit

• Profondità di colore: si esprime in bpp (bit per pixel), consiste nel numero di bit che il sistema ha a disposizione per rappresentare le diverse intensità luminose di ciascun pixel

• 8 bit per ciascun canale RGB -> 24 bit totali -> oltre 16 mil. di colori

Page 59: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 6

Page 60: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

FORMATI IMMAGINE E SUPPORTI DI MEMORIZZAZIONE – 1

• Le immagini master vanno memorizzate in formato non compresso e non devono subire alcun trattamento

• Il formato TIFF (Tagged Image File Format) http://partners.adobe.com/public/developer/tiff/index.html

• I trattamenti sono possibili solo sulle immagini derivate (tipicamente in formato compresso JPEG, con diverse densità di campionamento spaziale)

• Compressione: un algoritmo elimina i pixel considerati superflui

• Il formato JPEG2000: http://www.jpeg.org/jpeg2000/

Page 61: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

FORMATI IMMAGINE E SUPPORTI DI MEMORIZZAZIONE – 2

• CD• DVD• Nastri LTO

• Dischi rigidi (hard disk), NAS (Network Attached Storage), SAN (Storage Area Network)

Page 62: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 1

Watermarking o filigrana elettronica, può essere visibile o invisibile

Page 63: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 2

Applicazioni della marchiatura:

• Provare l’autenticità del documento (ma non basta!!)

• Individuare usi commerciali illeciti• Dichiarare la proprietà dell’originale• Dichiarare la titolarità di diritti sull’oggetto

digitale

Page 64: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 3

Il marchio (filigrana) elettronico:

• E’ un codice identificativo permanentemente “impresso” sul documento tramite un codificatore

• Può essere “rivelato” o estratto dal documento con una specifica procedura di decodifica

• Deve resistere a: -- tecniche di elaborazione del segnale -- manipolazioni geometriche

Page 65: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 4

Requisiti di un sistema di marchiatura:

• Definizione del n. di bit “impercettibili” da inserire nell’oggetto

• Rivelazione affidabile• Marchiatura multipla• Reversibilità del marchio• Non invertibilità del marchio• Interoperabilità

Page 66: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE -1

Da dove partire?

• PADI (Preserving Access to Digital Information) http://www.nla.gov.au/padi/

• DigitalPreservationEurope http://www.digitalpreservationeurope.eu/

• ERPANET http://www.erpanet.org/

Page 67: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE - 2

L’obsolescenza tecnologica

• Incompatibilità di versioni differenti di HW e SW• Progressiva perdita delle conoscenze necessarie a

gestire le vecchie versioni di HW e SW• Decadimento fisico dei supporti di

archiviazione/memorizzazione

Indifferenza o scarsa sensibilità al problema da parte delle aziende, del legislatore, degli amministratori e degli stakeholders in genere

Page 68: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE - 3

Acrobat 5 Acrobat 7

Da: S. Strathmann, Digital Preservation: an introduction, 2007

Page 69: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONVERGENZA DIGITALE

• un file è composto da una sequenza di bit, cioè da una catena codificata di 0 e di 1, a prescindere dai contenuti che esprime (convergenza digitale)

• è indipendente dal supporto, e dunque replicabile• è dipendente da altre catene di 0 e di 1 per

essere interpretato (dipende dal software)• è dipendente da apparecchiature in grado di

elaborare quelle catene e renderle utilizzabili (dipende dall’hardware)

Page 70: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

UN ESEMPIO: queste slide

Costituiscono una risorsa digitale indipendente dal supporto (non cambiano se le memorizzo sul disco rigido, su un CD-rom, o se le trasmetto per e-mail)

Ma dipendono dalla disponibilità nel tempo di: Programma Powerpoint, versione … Sistema operativo Windows, versione … Personal computer Intel/AMD, versione …

Il problema dell’obsolescenza tecnologica nasce quando quel software e/o quell’hardware non sono più disponibili.

Page 71: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

QUANTA INFORMAZIONE?

• HOW MUCH INFORMATION 2003?http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/index.htm

Dati riferiti al 2002

• 800 Mb prodotti per ciascun abitante della terra• 30% di incremento annuo fra 1999 e 2002• 92% immagazzinata su dischi rigidi in formato

digitale• 0,01% disponibile su cartaEterogeneità Standardizzazione, Interoperabilità,

Cooperazione

Page 72: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFORMAZIONE DIGITALE

• il contenuto significante (testo)• le strutture iconiche (e/o testuali) che

accompagnano il testo (paratesto e peritesto)

• la rete di relazioni con altre Informazioni digitali (attraverso i link ipertestuali)

Look and feel dell’informazione

Page 73: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE IN SENSO STRETTO consiste nel:

• mantenimento nel lungo periodo di una sequenza di bit (conservazione fisica)

• mantenimento nel lungo periodo dell’accessibilità ai contenuti espressi da quella sequenza di bit (conservazione funzionale) Trusted Digital Repositories: Attributes and Responsabilities, an RLG-OCLC Report. Mountain View : RLG, 2002

http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf ma: alcune procedure adottabili per la conservazione

digitale, in particolare la migrazione, possono alterare la sequenza originaria di bit, creando copie autentiche del documento originale

Page 74: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE, una definizione:

• L’insieme delle attività e degli strumenti che assicurano che i documenti informatici siano mantenuti accessibili, utilizzabili (leggibili e intelligibili) e autentici (univocamente identificabili e integri) nel medio e nel lungo periodo, in un ambiente tecnologico presumibilmente diverso da quello originario (Maria Guercio, 2005)

• L’espressione “ ‘nel lungo periodo’ non significa fornire una garanzia per cinque o cinquanta anni, ma piuttosto lo sviluppo responsabile di strategie che possano affrontare i cambiamenti costanti prodotti dal mercato dell’informazione”

(U. Schwens, H. Liegmann. Citati da S.Strathmann, Digital Preservation: an introduction, 2007)

Page 75: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE come fenomeno di natura sociale e

culturale-1

Charter on the Preservation of the Digital Heritage (UNESCO, 2003) http://infolac.ucol.mx/observatorio

/memoria/carta%20ingles.pdf

• L’ “Eredità culturale digitale” deve essere conservata

• Selezione del materiale• Deposito legale o volontario• Quali istituzioni• Con quali risorse

Page 76: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

LA CONSERVAZIONE DIGITALE come fenomeno di natura sociale e

culturale-2Firenze Agenda http://www.iccu.sbn.it/upload/documenti

/Firenze-agenda-17-Oct_ITAL.pdf

• Creare consapevolezza e sviluppare meccanismi di cooperazione

• Scambiarsi le “buone pratiche” e sviluppare punti di vista comuni

• Politiche e strategie di lungo periodo

Page 77: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 1

• un sistema nazionale e distribuito di archivi digitali collettivamente responsabili dell'accessibilità nel lungo periodo agli oggetti digitali, che sono istanze dell'eredità sociale, culturale ed economica di una nazione;

• il carattere di affidabilità degli archivi, che devono essere in grado di gestire con sicurezza le operazioni di stoccaggio degli oggetti digitali, le procedure tecniche di conservazione e quelle necessarie al mantenimento dell'accessibilità;

• la definizione di un processo di certificazione degli archivi, che sia prova della loro affidabilità;

• la definizione di un diritto-dovere degli archivi certificati di esercitare attivamente una funzione di salvataggio dell'informazione digitale a rischio di distruzione o abbandono

Preserving Digital Information: Report of the Task Force on Archiving of Digital Information. Commission on Preservation and Access and the Research Libraries Group. 1996 http://www.oclc.org/programs/ourwork/past/digpresstudy/final-report.pdf

Page 78: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 2

Un archivio certificato

• ha la missione di fornire un accesso permanente a risorse digitali gestite

• ha la responsabilità della conservazione permanente delle risorse digitali per conto dei soggetti depositanti e a vantaggio di utenti attuali e futuri

• dispone di strumenti organizzativi atti a mantenere nel tempo sia l’archivio che le risorse digitali di cui è responsabile

• è in grado di dimostrare la propria sostenibilità finanziaria

Trusted Digital Repositories: Attributes and Responsabilities, an RLG-OCLC Report. Mountain View : RLG, 2002 http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf

Page 79: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 3

Un archivio certificato• progetta i propri sistemi in conformità con le convenzioni e

gli standard comunemente accettati, al fine di assicurare continuativamente la gestione, l'accessibilità e la sicurezza delle risorse depositate

• definisce metodi di valutazione dei sistemi che soddisfino i requisiti di affidabilità

• è tale che i soggetti depositanti e gli utenti possano farvi assegnamento, per la conservazione permanente, in maniera aperta ed esplicita

• adotta politiche e prassi verificabili , i cui risultati siano misurabili

Trusted Digital Repositories: Attributes and Responsabilities, an RLG-OCLC Report. Mountain View : RLG, 2002 http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf

Page 80: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 4

Digital stewardship (gestione responsabile)

“conservare l’eredità culturale digitale è qualcosa di più del processo tecnico di mantenimento dei segnali digitali nel tempo. E’ un processo sociale e culturale, che implica la scelta di quali risorse conservare e in che forma; è un processo economico, che implica l’armonizzazione di mezzi limitati con obiettivi ambiziosi; è un processo giuridico, che implica la definizione del complesso dei diritti necessari alla conservazione permanente delle risorse culturali; è una questione di responsabilità ed incentivi, e di articolazione ed organizzazione di nuove procedure gestionali. E soprattutto è un’impegno continuativo, di lungo periodo, spesso condiviso e gestito in cooperazione da una molteplicità di istituzioni”

B.Lavoie, L. Dempsey. Thirteen Ways of Looking at...Digital Preservation. In: D-Lib magazine, luglio/agosto 2004 http://www.dlib.org/dlib/july04/lavoie/07lavoie.html

Page 81: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 5

• responsabilità pubblica dell’intero processo• natura intrinsecamente sistemica e distribuita

del servizio di conservazione permanente• problemi giuridici: - irrigidimento della normativa sul diritto d’autore - normative specifiche sul deposito dei documenti

elettronici, o diffusi tramite rete informatica• modelli dei costi

Page 82: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE – 1

Preservation Metadata: Implementation Strategiesworking group (PREMIS)

http://www.oclc.org/research/projects/pmwg/

• Provenienza: informazioni storiche sulla catena di custodia e/o proprietà

• Autenticità: informazioni necessarie a certificare che l’oggetto non è stato alterato senza documentare l’alterazione

• Attività di conservazione: documentazione delle azioni operate nel tempo sull’oggetto a fini di conservazione

• Ambiente tecnologico: descrizione di hardware, sistema operativo e applicazioni software, necessarie a rappresentare ed usare l’oggetto

• Gestione dei diritti: dichiarazione e registrazione storica dei diritti di proprietà intellettuale inerenti all’oggetto

Page 83: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE - 2

PREMIS

ha definito un modello dei dati, questi consistono di:

> Entità > Relazioni > Proprietà La “mappa” delle Entità si può rappresentare in

questo modo:

Page 84: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE - 3

PREMIS - Entità

• Entità intellettuale: un insieme coerente di contenuto che può essere ragionevolmente descritto come un’unità, per esempio, un libro, una mappa, una fotografia o un database

• Oggetto o Oggetto Digitale: un’unità discreta di informazione nella forma digitale, per esempio le singole pagine di un libro, la singola canzone di un CD

• Evento: un’azione che implica almeno un oggetto o un agente noto al repository

• Agente: una persona, un’organizzazione, o un programma software associato agli eventi di conservazione nella vita di un oggetto.

• Diritti: dichiarazione di uno o più diritti o permessi legati ad un oggetto e/o ad un agente.

Page 85: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE - 4

PREMIS – Proprietà delle Entità

• Ciascuna Entità ha delle Proprietà, elencate nel Dizionario PREMIS dei dati e definite “Unità semantiche”

• Es.: l’Unità semantica Identificatore dell’Oggetto è una Proprietà dell’Entità Oggetto, così come la data di creazione, il checksum etc.

Page 86: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE - 5

PREMIS – Relazioni fra le Entità

• Le Relazioni dichiarano le associazioni fra le istanze delle Entità (sono espresse dalle frecce)

• Sono possibili solo fra due o più Entità Oggetto o fra Entità di tipo diverso (es. fra un Oggetto e un Agente)

Page 87: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METADATI SPECIFICI PER LA CONSERVAZIONE – 4, PREMIS, modello dei dati

Entità intellettuale

Comprende 1 … nFanno parte di 1

Oggetti

Partecipano a 0 … nModificano 0 … n

Eventi

Diritti

Riguardano 1 … nDefiniscono 1 … n

Agenti

Abilitano 0 … n

Eseguono 0 …n

Basato su: Angela Di Iorio, 2007

Page 88: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

GLI IDENTIFICATORI PERSISTENTI -1

• gli Identificatori Persistenti : “etichette” che permettono di identificare e localizzare il documento con continuità

- assegnare al documento un identificatore univoco, che sia potenzialmente stabile oltre il ciclo di vita del documento e del produttore del documento, e questo è un problema di natura tecnologica

- assegnare all’identificatore univoco il documento, assicurando che quel documento sia sempre lo stesso, cioè che il suo contenuto non venga alterato, e questo è compito del produttore del contenuto

(Norman Paskin, 2004)

Page 89: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

GLI IDENTIFICATORI PERSISTENTI-2

Modello “organizzativo” generale di un sistema di identificatori persistenti

Selezione dei documenti digitali a cui attribuire un PI

Attribuzione al documento digitale di un PI e creazione di un registro dei PI

“Risoluzione” del PI, cioè associazione al PI della URL del documento

Mantenimento del registro che associa PI e URL (anche se la URL cambia si mantiene il legame con il PI)

Page 90: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

GLI IDENTIFICATORI PERSISTENTI-3 un modello di applicazione di NBN (progetto FRD/BNCF)

E.Bellini, C.Cirinnà, M. Lunghi, 2008

Page 91: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I FORMATI DEI FILE - 1

• La conoscenza del formato di un file, cioè delle informazioni necessarie ad interpretarlo, è irrinunciabile per la conservazione digitale

• L’obsolescenza dei formati è una delle minacce più gravi alla conservazione della memoria digitale

Page 92: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I FORMATI DEI FILE - 2

Esempi di formati sono i seguenti:

• Documenti: DOC, HTML• Immagini raster: TIFF, PNG, JPEG• Audio: WAV, MP3, MIDI• Video: MPEG, AVI

Page 93: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I FORMATI DEI FILE - 3

requisiti di ordine generale per i formati adatti alla conservazione:

• specifiche sintattiche e semantiche pubbliche• uso non condizionato da licenze o brevetti• riconoscimento da parte di organismi di

standardizzazione• ampia diffusione• indipendenza da tecniche proprietarie di

crittografia o compressione• indipendenza dai supporti di memorizzazione• specifiche tecniche contenute nel formato stesso

(self-contained)

Page 94: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I FORMATI DEI FILE - 4

lo standard ISO 19005-1:2005 (PDF-A)http://www.iso.org/iso/catalogue_detail?csnumber=38920

• applicabile a documenti contenenti testo, immagini raster e dati vettoriali

• totalmente self-contained, cioè contiene in sé stesso, embedded nel file, tutte le informazioni (cioè i metadati) che servono per renderlo accessibile, interpretabile e leggibile, e non dipende funzionalmente da nessuna entità esterna (cioè non embedded)

Page 95: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

I FORMATI DEI FILE - 5

I Registri dei formati dei file

• IdentificazioneHo un oggetto digitale, qual’è il suo formato?

• ValidazioneHo un oggetto che dichiara di essere di formato F, è vero?

• Trasformazioneho un oggetto di formato F, ma ho bisogno di un formato G, come posso produrlo?

• Caratterizzazioneho un oggetto di formato F, quali sono le sue caratteristiche?

• Valutazione del rischioho un oggetto di formato F, è a rischio di obsolescenza?

• Consegnaho un oggetto di formato F , come posso fornirlo?

Page 96: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METODI DELLA CONSERVAZIONE DIGITALE - 1

• Refreshing: trasferimento periodico dei documenti

digitali su nuovi supporti; si tratta di una “pre-strategia necessaria ma non

sufficiente, e comunque consolidata” (Giovanni

Bergamin)

Page 97: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METODI DELLA CONSERVAZIONE DIGITALE - 2

• Migrazione: trasferimento sistematico dei documenti

digitali su nuove piattaforme HW e SW prima che le precedenti diventino obsolete

Page 98: La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

M.Messina, 6-7.11.2008

METODI DELLA CONSERVAZIONE DIGITALE - 3

• Emulazione: Il suo maggiore teorico, Jeff Rothenberg, la definisce (1999):

“un approccio che permette l’emulazione di sistemi obsoleti su sistemi futuri e non ancora noti, in modo che un software originale di un documento digitale possa essere usato in futuro malgrado sia ormai obsoleto”. Rothenberg si propone di far funzionare una nuova piattaforma tecnologica “come se” fosse una vecchia piattaforma . A questo scopo egli propone di “incapsulare” il documento digitale in un contenitore fisico o logico insieme alla documentazione dell’hardware, al sistema operativo, al software di gestione ed ai diversi tipi di metadati necessari per renderlo accessibile, interpretabile e fruibile, tutti sotto forma di catene di 0 e di 1. Questo allo scopo di costruire in futuro un SW che emuli la vecchia piattaforma.