VIII giornate CNBA
description
Transcript of VIII giornate CNBA
Metadati per la ricerca e la gestione degli oggetti digitali e
tipologie di documenti presenti nelle collezioni italiane di architettura e urbanistica :
a che punto siamo?
Laura ANSELMI
VIII giornate CNBA
Laura ANSELMI - VIII Giornate CNBA
2
gestione di archivi digitali :
sostenibilità del progetto
finanziamento nel tempo
gestione del flusso operativo
formati e tecnologie di archiviazione
metadati
Laura ANSELMI - VIII Giornate CNBA
3
metadati (Metadata)
sono “dati sui dati”
nel contesto documentario
i dati primari sono i documenti
i metadati sono le informazioni relative a tali documenti
Laura ANSELMI - VIII Giornate CNBA
4
…archivi in evoluzione…..
pubblicazione autogestita su siti individuali
archiviazione digitale off-line
sistema di deposito, archiviazione e pubblicazione
centralizzato
‘all archives at your desk’
Laura ANSELMI - VIII Giornate CNBA
5
iniziative di coordinamento degli archivi digitali (digital repositories)
INTERNAZIONALIDOI, DUBLIN CORE, OAI, …
NAZIONALIUSA-METS, IT-MAG, …
PER L’ADOZIONE DI REGOLE COMUNI
METADATIMETADATI
Laura ANSELMI - VIII Giornate CNBA
6
archivi digitali fattori chiave :
interoperatività
ARCHIVI ‘APERTI’ OAI affidabilità
GESTIONE PIANIFICATA OAIS
Laura ANSELMI - VIII Giornate CNBA
7
interoperatività l’adozione di un linguaggio standard di
markup dei metadati consente l’harvesting di oggetti digitali
repository
repositoryrepository
repository
repository
useruser
harvesterharvester
Laura ANSELMI - VIII Giornate CNBA
8
la logica del World-Wide Web
ogni sito è un nodo di una rete mondiale che “espone” le proprie informazioni sotto
forma di pagine web
le pagine web obbediscono a una logica di strutturazione comune
motori di ricerca internet lanciano ricerche contemporanee un grande numero di siti
Laura ANSELMI - VIII Giornate CNBA
9
l’esperanto di Internet
world wide web 1) un protocollo standard di scambio dati :
HTTP HyperText Transfer Protocol
2) un linguaggio standard di redazione : HTML HyperText Markup Language
che contrassegna funzionalmente i dati (tags)
e la loro struttura organizzativa (links)
in modo che le pagine web siano
ricercabili da un motore di ricerca internetpercorribili in modo universalmente condiviso
Laura ANSELMI - VIII Giornate CNBA
10
SGML Standard General Markup Language
include schemi DTD (Document Type Definition)• HTML• …..
XML eXtended Markup Language
più flessibile e personalizzabile (+ XSL + XLL)
include gli RDF (Resource Description Framework),
schemi ‘oggetto’ per la strutturazione di
sequenze complesse di metadati
mark-up = marcatura del dato con <metatag> (etichetta standard testuale che definisce il senso o funzione del dato)
linguaggi di mark-up
Laura ANSELMI - VIII Giornate CNBA
11
… ad esempio…
home page del sito CNBAhttp://www.cnba.it
Laura ANSELMI - VIII Giornate CNBA
12
metadati : una possibile definizione nell’ambito degli archivi digitali
– una sequenza strutturata di metadati identificativi, descrittivi, gestionali
– riguardanti documenti in formato digitale
– espressi in un linguaggio che ne consente lo scambio con tecnologie xml (spesso in ambiente www), neutrale rispetto ai vari sistemi operativi e ai programmi locali di gestione e accesso ai dati (ad es. OPAC)
Laura ANSELMI - VIII Giornate CNBA
13
… ad esempio…
sequenza di metadati descrittivi Dublin Core Metadata Initiative
home page CNBA interpretata da un motore di ricerca DCMI
b
a
Laura ANSELMI - VIII Giornate CNBA
14
DCDC Dublin Core Metadata Initiative
Inizialmente sviluppato
per catalogare risorse www esterne
unqualifiedunqualified
qualifiedqualified
identifier …segue…
title subject
creator description
contributor coverage
publisher language
date relation
type source
format rights
Laura ANSELMI - VIII Giornate CNBA
15
metadati
identificativi DOI
del documento e sua localizzazione
descrittivi DC
sul suo contenuto e responsabilità
gestionali MAG
tecnici (tipo, formato, struttura)
amministrativi (diritti, procedure)
Laura ANSELMI - VIII Giornate CNBA
16
per localizzare qualche sigla….
identifica DOIDOI Digital Object Identifier
HANDLE, PURL, ….
OAIOAI(US DLF)
descrive Dublin Core Dublin Core (DCMI)…….
Open Archive Initiative
METSMETS
Metadata Encoding &
gestione
tecn/ammMAG MAG (ICCU)
PMF (RLG)…….
…….
OAISOAISOpen Archive Information System
Transmission Standard
Laura ANSELMI - VIII Giornate CNBA
17
interoperatività
il motore harvester funziona davvero solo se i vari archivi produttori costituiscono nello stessostesso modo gli stessistessi metadati
O A IO A I Open Archive Initiative
Laura ANSELMI - VIII Giornate CNBA
18
gradi di interoperabilità l’interoperabilità fra le collezioni dipende da
quanto risultano standardizzati questi tre livelli ’linguistici’:
il linguaggioil linguaggio (xml/rdf) il protocolloil protocollo (sequenza standard di <metatag>
identificativi, descrittivi, gestionali)
il contenutoil contenuto ( (le le regole di redazioneregole di redazione del contenuto associato a ciascun metatag)
Laura ANSELMI - VIII Giornate CNBA
19
OAI – Open Archive Initiative Harvesting Protocol
header
oai
identificativo univoco del documento
date e status, collezione, sito produttore
metadata
oai
DUBLIN CORE 6 unqualified:
metadata …..
altre sequenze di metadati supplementari decise dal sito produttore
indirizzo permanente della descrizione
title
description
creator
subjecttype
identifier
Laura ANSELMI - VIII Giornate CNBA
20
limiti dell’interoperabilità
limiti della standardizzazioneflessibilità del linguaggio XMLflessibilità del protocollo OAIvariabilità del contenuto (lingua, regole)
contesto funzionale di ciascun archiviocaratteristiche dei documentifinalità dell’archiviocaratteristiche dell’utenza di riferimento
Laura ANSELMI - VIII Giornate CNBA
21
soluzione raccomandata : ridurre al minimo le personalizzazioni
stabilire regole condivise nel settore disciplinare cui ciascun repository partner contribuisce
mantenere in ogni caso una precisa documentazione accessibile via web cui indirizzare i motori di ricerca per chiarire il significato dei metadati utilizzati.
Laura ANSELMI - VIII Giornate CNBA
22
documenti digitali: architettura-urbanistica-design libri e riviste tesi multiformato progetti (prodotto e processo) piani (norma e processo) fondi documentari (corrispondenza,
relazioni, foto, tavole, modelli 3D, posters, files CAD, videi, …)
lezioni, conferenze: registrazioni AV cartografia ……
Laura ANSELMI - VIII Giornate CNBA
23
OAI - Harvesting Protocolheader
oai
identificativo univoco del documento,
date, status, collezione, sito produttore
metadata
oai
DUBLIN CORE 6 unqualified:
metadata
…..
??
EAD (SAA)– Encoded Archival Description
TEI - Text Encoding Initiative
CMI (RLG) Cultural Materials Initiative
CDWA Categories of Description for Works of Arts
VRA Core (Visual Resources Association
FMM (CEN) Framework for Metadata for Multimedia………….
title creator identifiertype subject description
Laura ANSELMI - VIII Giornate CNBA
24
criteri di selezione… compatibile con il linguaggio XML compatibile con il protocollo OAI ente sviluppatore molto autorevole già ampiamente adottato
(a livello nazionale / internazionale?) ben documentato e sempre aggiornato applicabile senza modifiche locali conforme alle necessità della disciplina
Laura ANSELMI - VIII Giornate CNBA
25
affidabilitàdell’archivio
gestione documentata
conforme agli standard tecnici
Laura ANSELMI - VIII Giornate CNBA
26
affidabilità tracciabilità e certificazione
dei processi:
deposito controllato
digitalizzazione ottimale
preservazione dalle alterazioni
conservazione pianificata
gestione dei diritti
Laura ANSELMI - VIII Giornate CNBA
27
OAIS Open Archive Information System
IMMISSIONEIMMISSIONEInformation package
identificazione descrizione, diritti
ARCHIVIAZIONEARCHIVIAZIONEInformation package
struttura, legami dati tecnici sul file
gestione dati amministrazione
Information package
gestione dei dati gest. dei processi
CONSERVAZIONECONSERVAZIONEInformation package piano di migrazione
ACCESSOACCESSOInformation package
descrizione, diritti modalità di fruizione
Laura ANSELMI - VIII Giornate CNBA
28
metadati gestionali e amministrativi
gen dati generali sulla collezione di cui il documento fa parte e sull’ istituzione responsabile
bib
se il documento è parte componente
stru se il documento ha una sottostruttura
dati tecnici sulla singola immagine
o pagina testo ottenuto da OCRimg ocr
fis
title creatoridentifier publisherDC
MAGMAG
Laura ANSELMI - VIII Giornate CNBA
29
documenti in formato digitaleoggetti digitali
ottenuti da originali non digitali? (pagine testo, tavole, foto, registrazioni audiovideo)
generati da un programma computer?
(‘born digital’)
archiviati off-line o accessibili on-line?
accessibili via Internet?
archiviati in più formati?
diritti di accesso diversi per i diversi formati?
solo leggibili o anche editabili? interattivi?
in un formato a rapida obsolescenza o no?
Laura ANSELMI - VIII Giornate CNBA
30
MAGMAG
lo sviluppo di uno standard nazionale di gestione e conservazione è essenziale;
per la documentazione di architettura risulta necessario contribuire al suo arricchimento:
nuove sezioni per altri tipi di oggetti digitali‘Born digital’ anche complessi (es. CAD)
riversamenti da registrazioni AV
definibilità articolata dei diritti
Laura ANSELMI - VIII Giornate CNBA
31
…a che punto siamo? i documenti digitali vanno documentati in
modo standard e gestiti sistematicamente la costituzione di protocolli standard di
metadati è il primo passo verso il sistema abbiamo un protocollo internazionale per
l’harvesting (OAI) identificaz+descrizione e un protocollo nazionale di gestione
(MAG) dati tecnici e amministrativi
Laura ANSELMI - VIII Giornate CNBA
32
…. mancano ancora…
metadati descrittivi standard per creare chiavi di ricerca specifiche per l’architettura nel protocollo OAI
un arricchimento del protocollo MAG per le tipologie non ancora trattate e per una più precisa definizione dei diritti (accesso e riproduzione)
33Laura ANSELMI - VIII Giornate CNBA
… e naturalmente manca ancora…
un quadro di coordinamento
disciplinare e operativo
fra i vari progetti italiani