EPG Metodologia e analisi dei dati Lezione 3 Mirta Vernice [email protected].
Introduzione ai metadati amministrativo-gestionali Scuola vaticana di biblioteconomia anno...
-
Upload
giorgina-leone -
Category
Documents
-
view
214 -
download
0
Transcript of Introduzione ai metadati amministrativo-gestionali Scuola vaticana di biblioteconomia anno...
Introduzione ai metadati amministrativo-gestionali
Scuola vaticana di biblioteconomia
anno accademico 2007-2008
Paul Gabriele [email protected]
Conservazione digitale comprende un’ampia serie di attività volte ad estendere la durata
degli archivi digitali e di salvaguardarli dal danneggiamento del supporto, dalla perdita di dati e dall’obsolescenza
si è soliti ripartire le attività tra quelle intese a favorire la conservazione della codifica binaria dei
dati: l’informazione deve essere intatta e leggibile nel supporto di archiviazione
quelle che garantiscono l’accesso nel tempo ai contenuti: l’informazione deve essere visibile e trattabile da utenti e apparecchiature e comprensibile per gli utenti
non è perciò sufficiente limitare la conservazione alla codifica binaria dei dati, ma occorre che dei documenti siano preservati il contenuto, la forma, lo stile, l’aspetto e la funzionalità
la conservazione digitale richiede pertanto l’uso delle tecnologie migliori e più adeguate la messa in atto di strategie e procedure accuratamente
pianificate
Risoluzione del Consiglio d’Europa (25 giugno 2002) [...] PRENDENDO ATTO dei grandi cambiamenti metodologici che
investono la creazione, la memorizzazione e la conservazione delle registrazioni, dei documenti e degli archivi, specialmente in formato digitale, e SOTTOLINEANDO l'esigenza di continuare a definire metodi e linee guida per la conservazione a lungo termine di quelle registrazioni, documenti, collezioni e archivi che sono indispensabili per la salvaguardia del patrimonio europeo; [...]
Risoluzione del Consiglio d’Europa (25 giugno 2002)PROPONE di analizzare ulteriormente i seguenti obiettivi e misure: stimolare la messa a punto di politiche di conservazione della cultura e del
patrimonio digitali nonché la loro accessibilità mediante la creazione di quadri e meccanismi di cooperazione tra gli Stati membri finalizzati
allo scambio di esperienze su politiche, programmi e questioni regolamentari connesse, nonché allo sviluppo di una metodologia condivisa,
sostenendo, a livello collettivo ed individuale, le pertinenti organizzazioni preposte alla conservazione (ad esempio archivi, biblioteche e musei) nella responsabilità che incombe loro di raccogliere e di mantenere disponibili nel tempo i contenuti digitali,
esaminando quali infrastrutture organizzative e norme tecniche siano necessarie per sostenere reti stabili e compatibili di raccolte protette,
rafforzare il consenso e la sensibilizzazione tramite reti che appoggino la condivisione delle esperienze e dei progressi compiuti, l'adozione di norme appropriate come pure la valutazione e la divulgazione delle buone pratiche,
valutare le possibilità di opportuni investimenti, nonché analizzare i costi e l'impatto sui finanziamenti attuali efuturi, come pure le potenziali sinergie tra finanziamenti pubblici e privati,
migliorare la base di competenza, creando dei meccanismi per lo scambio di conoscenze e competenze, nonché per la continua identificazione dei nuovi requisiti in termini di competenze e dei nuovi requisiti in fatto di formazione,
stimolare la ricerca sui problemi e le relative soluzioni, mediante lo sviluppo di programmi di ricerca, sperimentazioni tecnologiche ed applicazioni sperimentali su larga scala
Gruppo di lavoro per la
conservazione delle memorie digitali Conferenza internazionale di Firenze (16-17 ottobre 2003) sotto il
coordinamento della Presidenza italiana dell’Unione EuropeaA livello europeo, ha fatto proprio l’obiettivo di procedere a una ricognizione
dello stato dell’arte in materia di conservazione digitale e allo sviluppo di un piano d’intervento necessario a diffondere e dar seguito ai principi contenuti nella risoluzione.
Il gruppo di lavoro ha avuto come referenti principali i progetti ERPANET e MINERVA, sotto la guida della Commissione Europea e della Presidenza italiana.
La Risoluzione del Consiglio sollecita la Commissione Europea e gli stati membri a fare il punto e promuovere un’indagine conoscitiva sulla situazione corrente, sulle emergenze e sui rischi, sulle criticità che ostacolano la conservazione del patrimonio culturale digitale, a intraprendere le attività e un piano d’azione adeguati.
Fanno parte del gruppo di lavoro alcuni esperti già coinvolti nell’elaborazione della Risoluzione, altri esperti nominati dalle autorità nazionali attraverso il NRG (National Representatives Group), altri ancora riconosciuti per il loro impegno in iniziative rilevanti a livello internazionale.
Attività del Gruppo di lavoroIl gruppo di lavoro punta a realizzare tre obiettivi principali: delineare il quadro delle iniziative attualmente in corso e favorire lo
scambio di “buone pratiche” definire una agenda di priorità come punto di partenza per un piano
d’azione condiviso dagli Stati-membri definire le basi per la formazione di una rete europea e per lo sviluppo
di iniziative nazionali. La prima attività del gruppo è consistita nel favorire un processo di
cooperazione, nel definire priorità e meccanismi capaci di incrementare il coordinamento e l’efficacia delle iniziative di carattere nazionale o di settore sulla conservazione digitale in Europa.
Questa prima fase di lavoro è confluita nell’Agenda di Firenze, presentata alla Conferenza internazionale di Firenze. Nel corso della Conferenza sono stati anche presentati due rapporti: l’uno documenta alcuni casi di emergenza e di rischio; l’altro pubblica un’indagine conoscitiva sullo stato delle normative, procedure e linee guida per la conservazione, attualmente vigenti in alcuni paesi in Europa e nel mondo.
Dopo FirenzeL’ICCU ha profuso un impegno scientifico e organizzativo di primo piano
sia nell’ideazione della Conferenza internazionale di Firenze sia nel garantire al progetto e al gruppo di lavoro sviluppo, continuità, possibilità di radicamento e di coordinamento in Italia.
L’agenda di Firenze è stata sottoscritta da 27 paesi (stati-membri, nuovi stati aderenti, Russia, Israele) nel corso del V° Convegno del Gruppo dei Rappresentanti Nazionali (NRG) a Parma il 19 novembre 2003. Il NRG ha riconosciuto l’attività del gruppo di lavoro sulla conservazione come complementare all’impegno per la digitalizzazione del patrimonio culturale e ha offerto il suo sostegno sia partecipando al gruppo di esperti, sia offrendo l’infrastruttura di rete.
Dopo la Conferenza di Firenze il gruppo di lavoro ha continuato e continua a svolgere la sua attività con l’obiettivo di favorire la cooperazione a livello europeo e di rafforzare la crescita di consapevolezza e consenso sui temi della conservazione digitale.
Metadati per la conservazione
Saving Digital Heritage Considering that the disappearance of
heritage in whatever form constitutes an impoverishment of the heritage of all nations …
Recognising that … resources of information and creative expression are increasingly produced, distributed, accessed and maintained in digital form, creating a new legacy—the digital heritage …
Understanding that this digital heritage is at risk of being lost and that its preservation for the benefit of present and future generations is an urgent issue of worldwide concern …
Le azioni dell’UNESCO (1/3) Draft Charter on the Preservation of the Digital Heritage
vengono analizzate le barriere alla continuità digitale per prevenire l’insorgere di un ulteriore fenomeno di “digital divide”: gli strumenti per la conservazione digitale vengono applicati al patrimonio di pochi Paesi maggiormente dotati di risorse
come gli altri documenti dell’UNESCO non è vincolante, ma si limita ad esprimere auspici e a formulare priorità
patrimonio digitale: “consists of unique resources of human knowledge and expression, whether cultural, educational, scientific or administrative, while embracing technical, legal, medical and other kinds of information that more and more are being created digitally, or converted into digital form from existing analogue resources.… Many of these resources have lasting value and significance, and therefore constitute a heritage that should be protected and preserved for current and future generations. This heritage may exist in any language, in any part of the world, and in any area of human knowledge or expression”
Le azioni dell’UNESCO (2/3) viene espresso l’auspicio che si trovi un compromesso tra i
legittimi diritti dei creatori e degli altri aventi diritto e l’interesse del pubblico all’accesso al patrimonio documentale, nel rispetto degli accordi internazionali
tra le minacce al patrimonio digitale, vengono citate la rapida obsolescenza delle tecnologie per l’accesso l’assenza di una legislazione che persegua la conservazione le incertezze internazionali riguardanti risorse, responsabilità
e metodologie tra le priorità, si collocano
campagne di sensibilizzazione alle tematiche della conservazione
formazione di specialisti in tecnologie della conservazione progetti internazionali di cooperazione finalizzati alla
conservazione del patrimonio digitale
Le azioni dell’UNESCO (3/3) Guidelines for the Preservation of Digital Heritage si rivolgono a più tipologie di destinatari
amministratori con responsabilità di tipo politico che necessitino di informazioni sulle quali basare la strategia della digitalizzazione
amministratori di alto livello che abbiano necessità di conoscere le questioni gestionali relative alla conservazione nell’ambito del proprio ruolo di coordinamento
gestori che abbiano bisogno di comprendere in dettaglio le questioni pratiche per assumere consapevolmente le decisioni quotidiane
operatori con responsabilità di implementare programmi che necessitino di una prospettiva generale su come le diverse questioni pratiche e i processi operativi si combinino fra loro
due approcci concetti base della conservazione digitale (definizioni di patrimonio
digitale, conservazione digitale, programmi di conservazione, responsabilità, gestione e cooperazione)
descrizione delle procedure e delle decisioni relative alle diverse fasi del ciclo di vita dell’oggetto digitale (cosa conservare, operare con i produttori, organizzare e documentare gli oggetti digitali, gestire i diritti, proteggere i dati, garantire l’accessibilità)
Alcuni principi (1/3)
1. Non tutti i materiali digitali debbono essere conservati; soltanto quelli dei quali è accertato un valore permanente costituiscono il patrimonio digitale
3. Non si possono ritenere conservati quei materiali digitali a cui non è più possibile accedere. Lo scopo della conservazione è mantenere la capacità di presentare gli elementi essenziali di materiali digitali autentici
4. La conservazione digitale deve contrastare ogni minaccia nei confronti di tutti i livelli dell’oggetto digitale: fisico, logico, concettuale e sostanziale
5. La conservazione digitale ha successo soltanto se le istituzioni e gli individui se ne assumono la responsabilità. Punto di inizio dell’azione è la decisione riguardante le responsabilità
6. Nessuno deve fare tutto. Niente deve essere fatto in una sola volta7. Programmi di conservazione affidabili ed esaustivi sono fortemente
auspicabili, ma non sempre possono essere realizzati quando vi sia una situazione critica. E’ opportuno pertanto procedere gradualmente, in modo limitato, piuttosto che non procedere affatto
Alcuni principi (2/3)8. Nell’agire gli amministratori debbono essere consapevoli della complessità
delle questioni. Poiché è fondamentale non provocare danni, essi dovrebbero adoperarsi a comprendere l’intero processo e i suoi obiettivi, evitando le decisioni che potrebbero compromettere futuri interventi per la conservazione
15. I programmi di conservazione debbono esplicitare il diritto di raccogliere, copiare, denominare, modificare, archiviare e fornire l’accesso ai materiali digitali dei quali si assumono la responsabilità
24. L’autenticità è protetta meglio da misure che assicurino che l’integrità dei dati non sia compromessa e da documentazione che dimostri chiaramente l’identità del materiale
26. L’obiettivo di garantire l’accessibilità consiste nel trovare modalità economiche di fornire l’accesso in qualunque momento sia necessario, sia nel breve, che nel lungo termine
27. Gli standard sono un fondamento della conservazione digitale, ma occorre trovare il modo di conservare anche materiali poco aderenti agli standard, in un ambiente di standard in costante cambiamento
28. La conservazione non deve essere procrastinata in attesa dello “standard della conservazione digitale”
Alcuni principi (3/3)29. I dati digitali dipendono sempre da una combinazione di hardware e
software. Dalla proporzione tra le due componenti dipendono le strategie fra le quali scegliere ai fini della conservazione
30. E’ buona norma che si diversifichino le strategie per la conservazione, specialmente nel caso di collezioni eterogenee
32. I programmi di conservazione debbono talvolta definire un livello accettabile di perdita in termini di oggetti, elementi e bisogni degli utenti
33. Attendere la disponibilità di soluzioni affidabili e omnicomprensive prima di intraprendere qualunque tipo di intervento probabilmente comporta che del materiale vada perso
34. I programmi di conservazione richiedono buone capacità gestionali, le quali implicano una conoscenza delle questioni connesse al trattamento del materiale digitale adeguata alle decisioni da prendere al momento giusto
35. La conservazione digitale implica l’individuazione e la gestione dei rischi39. Sebbene i service provider spesso prevedano una limitata funzione di
conservazione, la responsabilità principale ricade sui programmi di conservazione specificamente realizzati e su coloro che li sovrintendono e li supportano
Archivi / depositi digitali i due termini (archive e repository) vengono utilizzati
indifferentemente per indicare un sistema organizzativo finalizzato a preservare l’informazione per l’accesso e l’uso da parte di una specifica comunità di utenti
altro è invece la biblioteca digitale (digital library) con la quale si intende un sistema organizzativo finalizzato a rendere possibile la ricerca e l’accesso a documenti ed informazioni digitali da parte di comunità di utenti, senza che ciò implichi necessariamente la messa in atto di strategie di conservazione nel tempo dei dati
Open Archival Information System
è una tipologia di archivio che consiste nell’insieme organizzato di soggetti e di sistemi che perseguono l’obiettivo di preservare l’informazione per una o più di una determinata comunità di utenti http://www.ccsds.org/docu/dscgi/ds.py/Get/File-1
43/650x0b1.pdf Il modello OAIS / Gloria Cirocchi
http://www.iccu.sbn.it/PDF/Cirocchi.pdf
Origine di OAIS
il modello svolge nel contesto dei metadati gestionali-amministrativi e strutturali una funzione per qualche verso analoga alla funzione svolta da FRBR per i metadati relativi alla ricerca e al recupero delle risorse informative
è stato sviluppato dal Consultative Committee for Space Data Systems della NASA come standard per la conservazione a lungo termine dei dati derivati dall'osservazione dello spazio e del pianeta
nonostante la sua origine, il modello OAIS è adeguato alle finalità della conservazione a lungo termine anche per altre comunità utenziali e tipologie di documenti
Diffusione di OAIS (1/2) pur essendo fortemente orientato al trattamento dei
documenti elettronici, infatti, è applicabile a qualsiasi tipo di archivio (digitale o analogico) non specifica nessun tipo di implementazione può essere applicato indifferentemente a oggetti digitali nativi, a
prodotti di attività di digitalizzazione (quali file di immagini), e persino a oggetti fisici
si sta affermando come lo standard per la conservazione delle risorse digitali in quanto affronta la tematica della responsabilità della conservazione a lungo termine dell'informazione digitale
Diffusione di OAIS (2/2) è stato adottato come modello di riferimento da alcune importanti
esperienze del mondo di biblioteche ed archivi NEDLIB (Networked European Deposit Library) che ha formulato un
modello di deposito delle pubblicazioni elettroniche http://www.kb.nl/coop/nedlib
CEDARS (CURL Exemplars in Digital Archives), promosso dalle Università di Cambridge, Oxford e Leeds, che ha sviluppato uno schema di metadati per la conservazione basato sul modello OAIS http://www.leeds.ac.uk/cedars/index.html
PANDORA (Preserving and Accessing Networked Documentary Resources of Australia) della National Library of Australia, che mira alla conservazione di siti Web selezionati http://pandora.nla.gov.au/index.html
NDIIPP (National Digital Information Infrastructure and Preservation Program) http://www.digitalpreservation.gov/
ARSBNI (Arricchimento dei Servizi della Bibliografia Nazionale Italiana http://www.bncf.firenze.sbn.it/progetti/arsbni/
Il modello OAIS
L’ambiente OAIS è formato dall'interazione di quattro entità, definite
come: i produttori: sulla base di accordi formalizzati per
l'immissione dei dati nell'archivio forniscono i dati in base alle componenti logiche e al modello di rappresentazione OAIS
i consumatori: i soggetti, o sistemi clienti, che interagiscono con i servizi OAIS per reperire e acquisire l'informazione conservata di proprio interesse
il management: esterno all'archivio, si occupa delle politiche dell'archivio: cosa archiviare, come trovare i fondi ecc.
l'archivio stesso: inteso come sistema organizzato che si propone di conservare l'informazione per consentirne l'accesso e l'uso ad una determinata comunità utenziale
Le componenti funzionali di OAIS
sono definite come: Immissione (Ingest): riceve l'informazione dai produttori e la
prepara per l'archiviazione Archiviazione dei dati (Archival Storage): tratta l'archiviazione,
la manutenzione e la gestione della informazione archiviata Gestione dei dati (Data Management): coordina i metadati
descrittivi relativi sia all'informazione archiviata sia ai dati amministrativi interni all’archivio
Accesso (Access): è la funzione che aiuta i consumatori a identificare e ottenere informazione dall'archivio
Amministrazione dell'archivio (Administration): ha in carico le procedure quotidiane di gestione dell'archivio
Pianificazione della conservazione (Preservation Planning): specifica e rende visibili le attività di conservazione effettuate, a prescindere dalla strategia adottata
La strutturazione dei dati oltre alle componenti funzionali, OAIS fornisce anche un modello
di strutturazione dei dati adeguato a rappresentare l'informazione digitale da un punto di vista orientato alla conservazione
centrale è la definizione di Oggetto Informativo (Information Object), di qualsiasi tipo esso sia, come composto da due elementi: Dati Informazione sulla rappresentazione (Representation
information), necessaria per conferire significato ed interpretabilità ai dati
la conservazione nel tempo dei due elementi è un requisito fondamentale nel funzionamento del modello
Informazione sulla rappresentazione
nell’ambiente digitale, occorre che i Dati (una sequenza di bit) siano collegati ad una R.I. (Representation Information) perché è questa componente che contiene le informazioni che rendono comprensibili quei bit dal punto di vista strutturale (specificazione del formato,
descrizione del s/w di accesso, etc.) e semantico (p. es. in quale lingua è un testo in caratteri ASCII).
il medesimo modello si applica anche al documento analogico l'informazione contenuta in un libro espressa da caratteri a
stampa (i dati), in combinazione con una conoscenza della lingua del testo (la Conoscenza di Base), si converte in informazione
poiché la lingua non rientra tra le conoscenze del ricevente, il testo (i dati) dovrà essere accompagnato da un dizionario e da informazioni grammaticali espresse in una forma compresa nella Conoscenza di Base di chi riceve l'informazione: questi due elementi costituiscono l'Informazione sulla Rappresentazione
in generale, perciò si può dire "i Dati, in unione alla loro Informazione sulla Rappresentazione, veicolano significato".
Rete di informazioni sulla rappresentazione
l’Informazione sulla Rappresentazione, in ambiente digitale, è dotata di una natura ricorrente
per essere interpretata, una I.R. avrà bisogno di un'altra I.R., e così via, creando una Rete di Informazioni sulla Rappresentazione, (Representation Network), fino ad incontrare la Conoscenza di Base della Comunità per cui l'informazione viene conservata
Il modello OAIS raccomanda che la Rete termini con un documento in formato analogico che dia avvio all'intera sequenza di interpretazione
Pacchetti di informazione ogni scambio di informazione, da e per l'archivio, e all'interno di
OAIS, avviene attraverso l'utilizzazione di Pacchetti di Informazione (I.P.-Information Packages), che sono dei contenitori concettuali di dati
gli Oggetti Informativi possono comporre 3 tipi di I.P., utilizzati a seconda che il flusso di informazioni avvenga dal Produttore all'OAIS, al suo interno, o dall'archivio stesso verso l’utente (il Consumatore): SIP - (Submission Information Package - Pacchetto di
Informazioni per l'Immissione): utilizzato nella fase di immissione/acquisizione dei dati, inviato dal produttore in base al Submission Agreement stipulato con l'OAIS
AIP - (Archival Information Package - Pacchetto di Informazioni per l'Archiviazione): destinato alla conservazione a lungo termine
DIP - (Dissemination Information Package - Pacchetto di Informazioni per la Distribuzione): trasferito dall'OAIS all'utente in base ad una richiesta di accesso
L’Oggetto Informativo (1/2) un I.P. è costituito dall'aggregazione di quattro classi
di Oggetto Informativo: Informazione sul Contenuto (Content Information):
l'oggetto primario destinato ad essere conservato dall'archivio (p.es. un documento in formato PDF (i dati), più la documentazione del formato PDF (la R.I.)
Informazione Descrittiva per la Conservazione / (Preservation Description Information): è il set di informazioni necessarie a conservare adeguatamente, per un periodo di tempo indefinito, il Contenuto cui sono associate: si focalizza sulla descrizione degli stati passati e presenti
del Contenuto assicura che sia identificato univocamente, che non sia alterato senza che ciò venga registrato.
L’Oggetto Informativo (2/2) Il Contenuto e l’Informazione Descrittiva per la Conservazione
sono viste come incapsulate e identificabili per mezzo della: Informazione di Impacchettamento (Packaging Information):
come reperire 1) e 2), ovvero come sono collegati i componenti di un Pacchetto di Informazioni in un'entità identificabile su uno specifico supporto (p. es. in che disco, in che directory, ecc.)
Il “pacchetto di informazione” che ne risulta è ricercabile attraverso la Informazione Descrittiva (Descriptive Information): finalizzata
alla ricerca e al recupero dell'informazione, p. es.: Manzoni, Alessandro - Autore principale - RICA. Essa può basarsi su informazioni contenute nell’Informazione sul Contenuto e nell’Informazione Descrittiva per la Conservazione, ma ne è distinta sul piano logico
Informazione Descrittiva per la Conservazione vengono individuate quattro categorie di informazioni:
Identificazione (Reference Information): enumera e descrive gli identificatori assegnati al Contenuto (p. es. l'URN di 1. Informazione sul Contenuto e il riferimento alla normativa sull'URN)
Contesto (Context Information): documenta le relazioni del Contenuto con il suo ambiente (perché è stato creato, in che relazione è con altri Contenuti) (p.es. altri O.I. nella stessa collezione, manifestazioni precedenti dello stesso Oggetto)
Provenienza (Provenance Information): documenta la storia del Contenuto e i cambiamenti da esso subiti, oltre che la catena di custodia (p. es. il formato originale dei dati, quale specifico processo ha permesso la creazione / trasformazione di un determinato oggetto informativo, chi è stato responsabile di quel processo)
Autenticazione (Fixity Information): documenta i meccanismi di autenticazione destinati ad assicurare l'integrità del Contenuto (p. es. l'impronta digitale calcolata con l'algoritmo MD5)
Trattamento dell’oggetto digitale un oggetto digitale entra nel sistema sotto forma di Submission
Information Package (SIP), comprendente l’oggetto e il set di metadati richiesto. La sua trasmissione in tale forma è responsabilità del Produttore
il SIP passa attraverso le procedure di Immissione (Ingest) nel quale viene trattato e reso conforme ai criteri e alle norme applicate nel sistema diventando un Archival Information Package (AIP). L’AIP comprende il contenuto di SIP più i metadati previsti dal sistema ai fini della conservazione. Ad ogni successivo trattamento di AIP corrisponde l’aggiunta di metadati.
oltre che delle procedure di Immissione, il Gestore è responsabile delle procedure di aggiornamento costante dell’AIP, nonché della consegna degli AIP agli utenti sotto forma di Dissemination Information Packages (DIP)
la distribuzione dei DIP presuppone l’esecuzione di diverse funzioni: Amministrazione, Gestione dei dati e Servizi comuni. Un sistema OAIS vi aggiunge due funzioni basilari: Archiviazione e Conservazione. Queste applicano le strategie necessarie a protrarre nel tempo la fruizione degli AIP sotto forma di consultazione, utilizzazione e comprensione
Metadata Encoding and Transmission Standard (METS)
sviluppato dalla comunità bibliotecaria, fornisce una struttura ai dati per consentire lo scambio, la visualizzazione e l’archiviazione di oggetti digitali
nel quadro di OAIS rappresenta un dispositivo utile al trasferimento di dati internamente ed esternamente all’archivio OAIS
qualunque comunità desideri implementare OAIS deve identificare o creare un formato di scambio che funga da information package. METS appare una soluzione ideale per la comunità delle risorse culturali. Esso incorpora i surrogati digitali – file immagini, audio, video – insieme ai metadati amministrativi e descrittivi in un unico documento XML.
il cuore di un oggetto METS è la mappa strutturale (structural map), che funge da indice dei contenuti per l’accesso da parte degli utenti. La gerarchia della mappa strutturale consente la navigazione tra i file incorporati o citati dall’oggetto METS. Consente di scorrere le pagine di un diario o puntare a specifici segmenti di un programma a tempo, come un frammento di videoclip
METS come formato di scambio
poiché METS raggruppa i dati sull’oggetto e le informazioni sul surrogato digitale e codifica tutte queste informazioni in XML, viene sempre più di frequente utilizzato per trasferire dati dai sistemi locali agli archivi centrali collettivi
nell’ambito della rete RLG una istituzione partecipante può conferire una collezione sotto forma di singoli oggetti METS e il programma di caricamento immette i dati in un database DB2, utilizzando le funzioni di METS come Pacchetto di informazioni per l’immissione (SIP)
METS come formato di gestione e di conservazione
le specifiche METS comprendo una sezione di metadati amministrativi che consentono all’oggetto digitale di portare con sé informazioni sul contesto amministrativo (diritti sulla proprietà intellettuale) o sull’ambiente tecnologico nel quale i surrogati digitali sono stati creati (metadati tecnici)
grazie alla presenza di metadati amministrativi, METS si presta a fungere da Paccheto di informazioni per l’archiviazione (AIP) nel quadro di OAIS
METS come formato di consegna
mediante il software di visualizzazione di METS il file XML produce uno slide show o un media player standard. Rendendo i file immagine, audio e video navigabili, METS consente la ricomposizione di un oggetto mutiparte in un insieme organizzato e coerente. La mappa strutturale consente la suddivisione di un file audio video in segmenti che possono essere eseguiti singolarmente eventualmente associati alle immagini. Secondo la logica di OAIS, METS si può configurare come un DIP (dissemination information package)
La struttura di METS (1/2)
un header descrive l’oggetto di METS stesso. Contiene informazioni del tipo “chi ha creato questo oggetto, quando, ecc.” L’informazione presente nell’header consente la corretta gestione del file METS
la sezione dei metadati descrittivi contiene informazioni che descrivono la risorsa informativa rappresentata dall’oggetto digitale. I metadati descrittivi consentono la ricerca della risorsa
la mappa strutturale rappresentata dai singoli fogli e dai dettagli organizza i file digitali dell’oggetto in una gerarchia che consente lo scorrimento
la sezione del file di contenuto rappresentato dalle immagini 1-5 dichiara quali file digitali costituiscono l’oggetto. I file possono essere annidati nell’oggetto o citati
La struttura di METS (2/2) la sezione dei metadati amministrativi contiene informazioni
sui file digitali dichiarati nella sezione dei file di contenuto. La sezione si divide in metadati tecnici: specificano le caratteristiche tecniche di un file metadati della fonte: specificano la fonte della riproduzione
(scansione, ecc.) metadati della provenienza digitale: specificano i cambiamenti
intervenuti sul file dalla sua creazione metadati dei diritti: specifica le condizioni di accesso e fruizione
la sezione con i metadati tecnici, fonte e della provenienza digitale contengono informazioni necessarie alla conservazione digitale
la sezione informazioni di comportamento associano all’oggetto METS programmi eseguibili (per esempio, filigrana digitale)
Caratteristiche di METS
i creatori di METS hanno combinato le specifiche W3C di XML e i Namespaces in XML per creare uno standard flessibile. lo schema XML consente di specificare le regole di un
documento XML valido. Lo schema può essere utilizzato per fare il parsing di un documento XML (verificare che la marcatura XML sia conforme allo standard formalizzato dallo schema)
l’uso dei Namespaces mette in grado METS di delegare alcuni compiti riguardanti i metadati ad altri schemi XML. Per esempio, lo schema METS non prescrive il modo di descrivere la risorsa rappresentata dall’oggetto digitale, non vi sono metadati descrittivi. Tuttavia può puntare ad uno schema di metadati esterno nel quale sia ospitata la descrizione
Vantaggi e opportunità (1/2) ciascuna comunità utenziale può introdurre gli elementi descrittivi
ritenuti utili, purchè formalizzati in uno schema. Nel caso di risorse audiovisive può essere utilizzato lo schema VRA Core. Per le risorse bibliografiche le biblioteche possono preferire il MARC o il Metadata Object Description Schema (MODS) prodotto dalla Library of Congress. In altri casi può essere più opportuno l’uso di Dublin Core (DC). La flessibilità e la ospitalità di METS consente l’implementazione di un ampio numero di standard, eventualmente anche contemporaneamente per descrivere il medesimo oggetto a beneficio di più comunità di utilizzatori
la medesima logica si applica a tutte le componenti dei metadati amministrativi. Ogni comunità può decidere quali siano i dati necessari per il trattamento dell’informazione, li formalizza in uno schema XML e usa questo schema come una estensione di METS
Vantaggi e opportunità (2/2)
l’alternativa consiste nel riferirsi a dati contenuti in un database esterno al quale l’oggetto METS può puntare
la possibilità di annidare i dati (embedding) o di fare riferimento a dati esterni (referencing) si applica fino al livello dei singoli file
vi è persino la possibilità di incorporare (wrapping) all’interno del documento XML il file digitale in forma di codifica binaria, ciò che potrebbe essere particolarmente utile ai fini dell’archiviazione di lunga durata
<?xml version="1.0" ?> <METS:mets xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance" xmlns:METS="http://www.loc.gov/METS/" xmlns:fedoraAudit="http://fedora.comm.nsdlib.org/audit" xmlns:uvadesc="http://dl.lib.virginia.edu/bin/dtd/descmeta/" xmlns:uvadigiprov="http://dl.lib.virginia.edu/bin/admin/digiprov/" xmlns:uvasource="http://dl.lib.virginia.edu/bin/admin/source/" xmlns:uvarights="http://dl.lib.virginia.edu/bin/admin/rights/" xmlns:uvatech="http://dl.lib.virginia.edu/bin/admin/tech/" xmlns:xlink="http://www.w3.org/TR/xlink" xsi:schemaLocation="http://www.loc.gov/standards/mets/ http://www.cs.cornell.edu/payette/mellon/fedora/mets-fedora.xsd" OBJID="uva-lib:1225" TYPE="FedoraObject“LABEL="Saskia/AICT Image Collection - Mycenae"
PROFILE="fedora:IMAGE-W">
Esempio di header
<METS:metsHdr ID="H1" CREATEDATE="2002-05-20T06:32:00" LASTMODDATE="2002-05-22T12:25:00" RECORDSTATUS="A">
<METS:agent ID="A1" ROLE="CREATOR“ TYPE="INDIVIDUAL"> <METS:name>Sandy Payette </METS:name> <METS:note>Digital Object based on Sakia image and created as the
official Fedora sample object</METS:note> </METS:agent> <METS:agent ID="A2" ROLE="CUSTODIAN“ TYPE="ORGANIZATION"> <METS:name>University of Virginia Library</METS:name> <METS:note>Object owned by UVA</METS:note> </METS:agent>
</METS:metsHdr>
Esempio di header
<dmdSec ID="dmd001"> <mdRef LOCTYPE="URN" MIMETYPE="application/xml" MDTYPE="EAD" LABEL="Berol Collection Finding Aid">urn:x-nyu:fales1735</mdRef> </dmdSec>
Esempio di metadati descrittivi esterni
Sezioni MD descrittivi
MD descrittiviesterni
dmdSecmdRef
dmdSecmdWrap
dmdSecmdRef
dmdSecmdWrap
mdWrap
Metadati descrittivi
<dmdSec ID="dmd002"> <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin
Core Metadata"> <dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator> <dc:date>between 1872 and 1890</dc:date> <dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </mdWrap> </dmdSec>
Esempio di metadati descrittivi interni
<dmdSec ID="dmd003"> <mdWrap MIMETYPE="application/marc" MDTYPE="MARC" LABEL="OPAC Record"> <binData>MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...
(etc.) </binData> </mdWrap>
</dmdSec>
Esempio di metadati descrittivi interni (dati binari)
amdSec
sourceMD
digiprovMD
rightsMD
Md Amministrativi
MD amminesterni
techMDmdRef
mdWrap
Metadati amministrativi
<amdSec ID="AMD001"> <mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG"
LABEL="NISO Img. Data"> <niso:MIMEtype>image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso:PhotometricInterpretation>8</niso:PhotometricInterpretation> <niso:Orientation>1</niso:Orientation> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </mdWrap> </amdSec>
Esempio di metadati amministrativi
ContenutoEsterno
fileSec
fileGrp
fileFlocat
FContent
file
file
Sezione dei File
<fileGrp> <fileGrp ID="VERS1"> <file ID="FILE001" MIMETYPE="application/xml" SIZE="257537" CREATED="2001-06-10"> <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.xml </FLocat> </file> </fileGrp> <fileGrp ID="VERS2"> <file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836" CREATED="2001-05-17" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.wav </FLocat> </file> </fileGrp> <fileGrp ID="VERS3" VERSDATE="2001-05-18"> <file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866" CREATED="2001-05-18" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.mp3 </FLocat> </file> </fileGrp> </fileGrp>
fileSec
fileGrp
file
amdSec
sourceMD
digiprovMD
rightsMD
Sezione file
Md Amministrativi
Md ammin.Esterni
techMDmdRef
mdWrap
Collegamenti File-Metadati Amministrativi
<structMap TYPE="logical"> <div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history"> <div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="INTVWBG" END="INTVWND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:00:00" END="00:01:47" BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:00:00" END="00:01:47" BETYPE="TIME" /> </fptr> </div>
<div ID="div1.2" LABEL="Family History" ORDER="2"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="FHBG" END="FHND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" /> </fptr> </div> <div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" /> </fptr> </div> </div></structMap>
structMap
ContenutoEsterno
Sezione File
Mappa Strutturale
fileSec
fileGrp
fileFlocat
div
areafptr
mptr
seq
area
areapar
area
areaFContent
file
file
file
Collegamento Struttura-Contenuto
structMap
div
Mappa StrutturaleMd Descrittivi
MD DescrittiviEsternidiv
dmdSecmdRef
dmdSecmdWrap
dmdSecmdRef
dmdSecmdWrap
div
Collegamento Struttura-Metadati descrittivi
structMap
div
fileSec
fileGrp
file
amdSec
sourceMD
digiprovMD
rightsMD
Sezione File
Md AmministrativiMappa Strutturale
MDAdminEsterni
techMDmdRef
mdWrap
Struttura e contenuto collegati a Metadati amministrativi
<METS:behaviorSec ID="DISS1.0" STRUCTID="S1“BTYPE="uva-bdef-image-w:101" CREATED="2002-05-25T08:32:00" LABEL="Watermark Behaviors" GROUPID="DISS1"
ADMID="AUDREC1" STATUS="A">
<METS:interfaceDef LABEL="Photo Watermark Behavior Definition" LOCTYPE="URN" xlink:href="uva-bdef-image-w:101"/> <METS:mechanism LABEL="Watermarking Behavior Mechanism for Images" LOCTYPE="URN" xlink:href="uva-bmech-image-w:112"/>
</METS:behaviorSec>
Esempio
Comitato Metadati Amministrativi Gestionali (MAG)
Nell’ambito delle attività del Comitato Guida della Biblioteca Digitale Italiana, è nata l’esigenza di avere un gruppo di riferimento di esperti per la definizione e implementazione di schemi di metadati nei progetti di digitalizzazione avviati nell’ambito delle biblioteche ed altre istituzioni culturali a livello nazionale.
Sulla base del lavoro svolto in questi anni dal Gruppo di studio sugli standard e le applicazioni di metadati nei beni culturali e delle esperienze acquisite nell’ambito dei programmi di digitalizzazione avviati dalla Direzione Generale per i Beni Librarisi è ritenuto che tale Gruppo fosse il riferimento qualificato per espletare l’attività di promozione e sviluppo di modelli e standard di metadati.
L’ICCU, quale responsabile della diffusione delle normative e degli standard bibliografici, ha pertanto formalmente costituito nel mese di luglio 2003 un Gruppo di lavoro permamente, il Comitato MAG, quale struttura di riferimento per le attività connesse alla promozione, supporto, gestione ed evoluzione dello standard di Metadati Amministrativi Gestionali, nonché all’assistenza e consulenza alla comunità bibliotecaria, archivistica e museale per la gestione e l’accesso alle informazioni sull’oggetto digitale. Tale Comitato pertanto prosegue le attività del precedente Gruppo di studio sugli standard e le applicazioni di metadati nei beni culturali, riprendendone i principali obiettivi ma dando la priorità ad attività connesse alla diffusione ed evoluzione del set di Metadati Amministrativi Gestionali
Membri del Comitato MAG Matilde Amaturo, Marco Lattanzi (Istituto Centrale per il Catalogo e la
Documentazione) Francesco Baldi (Discoteca di Stato) Giovanni Bergamin, Maria Grazia Pepe (Biblioteca Nazionale Centrale
di Firenze) Gianfranco Crupi (Università degli Studi La Sapienza di Roma) Gloria Cirocchi, Simona Gatta (Biblioteca della Camera dei Deputati) Claudio Leombroni (Rete Bibliotecaria di Romagna - Provincia di
Ravenna) Cristina Magliano, Patrizia Martini (ICCU) Maurizio Messina (Biblioteca Marciana di Venezia) Antonella Mulè (Direzione Generale per gli archivi) Antonio Scolari (Centro Servizio Bibliotecario della Facoltà di Ingegneria
- Università degli Studi di Genova) Marco Veneziani (CNR Roma) Paul Gabriele Weston (Università degli Studi di Pavia)
Obiettivi del Comitato MAG Diffusione dello schema MAG Completamento dello schema per le fasi AIP (Archival
information package) e DIP (Dissemination information package) dello schema MAG
Mantenimento ed evoluzione dello schema Produzione di manuali e linee guida Assistenza agli implementatori Formazione e promozione Rapporti con altri progetti e agenzie (Progetti europei, Dublin
Core, etc.) Sviluppo di schemi e profili di applicazione di metadati descrittivi
nei diversi settori della cultura
Attività avviate del Comitato MAG
Elaborazione del Manuale per l’utilizzo dello Schema MAG
Produzione di documentazione di supporto sia a carattere generale che specifico per le diverse tipologie di materiale sottoforma di Raccomandazioni e Linee guida
Produzione di un registro di link a schemi, modelli e reference tecnici di riferimento.
Schema MAG
Lo schema (vers. 2.0 – 10/02/2005) è stato elaborato sulla base delle indicazioni ("Appunti per la definizione di un set di metadati gestionali-amministrativi e strutturali per le risorse digitali" del 30/01/2001 e vers. 1.0 - 03/05/2002) del Gruppo di studio sugli standard e le applicazioni di metadati nei beni culturali
Descrizione dello schema
Lo schema generale è composto dalle sezioni: <gen> informazioni generali sul progetto e sul tipo di
digitalizzazione <bib> metadati descrittivi sull'oggetto analogico <stru> metadati strutturali <img> metadati specifici relativi alle immagini fisse <ocr> metadati specifici relativi al riconoscimento ottico del testo <doc> sezione utilizzata per descrivere ad esempio un file in
formato pdf o rtf <audio> metadati specifici per file audio <video> metadati specifici per file video <dis> metadati specifici per la distribuzione di oggetti
bibliografici
Metadati per la BDIMetadati descrittivi Si fa l'ipotesi che gli oggetti digitalizzati abbiano metadati descrittivi già presenti
in un archivio bibliografico standard. La presenza di tali metadati nello schema è garanzia del corretto collegamento con tale archivio. La sintassi definita fa riferimento alle specifiche del set di elementi Dublin Core.
Metadati strutturali Il rapporto tra l'insieme dei file trasmessi ed il record bibliografico è descritto dai
tag <piece>, <completeness> e <sequence_number> associato ad ogni immagine. I casi presi in considerazione sono: unità bibliografica e unità fisica coincidono (es monografia in un volume). pezzo fisico di un set (es. fascicolo di un periodico) parte componente che non coincide con una unità fisica (es. capitolo di un libro)
La sezione <stru> completa i metadati strutturali con un indice delle sezioni dell'oggetto digitalizzato. A tali metadati è possibile associare informazioni di rappresentazione.
Metadati amministrativi Per la definizione dei metadati relativi alle immagini fisse è stato preso in
considerazione lo standard NISO.
Siti di riferimento
METS: http://www.loc.gov/standards/mets
OAIS: http://www.rlg.org/longterm/oais.html
MAG: http://www.bncf.firenze.sbn.it/progetti/mag/
Dublin Core: http://dublincore.org/