Lezione 2

52
Linee Guida per la creazione Parte I progettazione, digitalizzazione, metadati

description

contenuti digitali

Transcript of Lezione 2

Page 1: Lezione 2

Linee  Guida  per  la  creazione  -­‐  Parte  I  progettazione,  digitalizzazione,  metadati  

Page 2: Lezione 2

2  

PROGETTAZIONE  • Gli  Standard  Tecnici  • Ciclo  di  vita  delle  risorse  digitali  • Flusso  del  lavoro    •  Identificazione  delle  risorse  digitali  

PRODUZIONE  • Preparazione  della  digitalizzazione  • Formazione  del  personale  • Trattamento  degli  originali  •  Il  Master  digitale  

PACKAGING  •  I  Metadati  

Page 3: Lezione 2

3  

Link  utili  e  risorse  

http://www.minervaeurope.org/  

Page 4: Lezione 2
Page 5: Lezione 2

5  

In  tutta  Europa  sono  finanziate  con  investimenti  considerevoli,  sia  pubblici  che  privati,  iniziative  finalizzate  a  promuovere  la  diffusione  di  risorse  culturali  accessibili  attraverso  i  canali  digitali.  

Gli  enti  che  sostengono  tali  programmi  intendono  massimizzare  il  valore  dei  propri  investimenti,  richiedendo  che  i  contenuti  culturali  digitali  prodotti  con  i  loro  finanziamenti  siano  il  più  possibile  orientati  all’utenza,  accessibili,  fruibili,  portabili  e  durevoli  nel  tempo.  

La  chiave  per  conseguire  l’interoperabilità  è  assicurare  un  approccio  coerente  al  ciclo  di  vita  delle  risorse  digitali    attraverso  un  uso  efficace  di  standard,  raccomandazioni  e  linee  guida  che  codificano  le  buone  pratiche.  

I  programmi  di  digitalizzazione  riconoscono  il  valore  degli  standard.  

Page 6: Lezione 2

6  

British  Standards  Institution  (BSI):  

«Uno  standard  è  una  specifica  pubblicata  che  determina  un  

linguaggio  comune,  contiene  una  specifica  tecnica  o  altri  criteri  

precisi  ed  è  concepito  per  essere  utilizzato  coerentemente,  

come  una  norma,  una  direttiva  o  una  definizione.  Gli  standard  

sono  applicati  a  vari  materiali,  prodotti,  metodi  e  servizi.  Essi  

contribuiscono  a  semplificare  la  vita  e  ad  accrescere  

l’affidabilità  e  l’efficacia  di  molti  beni  e  servizi  da  noi  utilizzati  »  

Page 7: Lezione 2

7  

Gli  standard  possono  essere:  

De  jure  -­‐  formalmente  riconosciuti  da  un  organismo  responsabile  della  definizione  e  diffusione  di  standard,  di  solito  sviluppati  attraverso  il  comune  accordo  di  un  certo  numero  di  parti  interessate.  Gli  standard  emanati  dall’ISO,  o  l’insieme  dei  protocolli  TCP/IP,  mantenuti    all’Internet  Engineering  Task  Force  (IETF),  ne  sono  esempio.  

De  facto  -­‐  standard  industriali,  privi  di  riconoscimento  formale  da  parte  di  un  organismo  di  standardizzazione,  tuttavia  largamente  diffusi,  utilizzati  e  riconosciuti  come  standard  dagli  utenti.  Per  fare  un  esempio,  può  trattarsi  di  un  formato  di  documento  generato  da  un  software  che  possiede  una  quota  ampia  o  prevalente  del  mercato  in  un  determinato  settore,  come  l’Adobe  Portable  Document  Format  (PDF).  

Page 8: Lezione 2

8  

La  scelta  di  uno  standard  aperto  (non  proprietario)  si  rivela  particolarmente  consigliabile,  se  si  prendono  in  considerazione  caratteristiche  fondamentali  quali:  

•   l’accesso  aperto  (open  access)  allo  standard  medesimo  e  alla  documentazione  prodotta  nel  corso  del  suo  sviluppo  

•   la  libera  utilizzazione  (open  use):  l’implementazione  dello  standard  comporta  costi  esigui  o  nulli  per  i  diritti  di  proprietà  intellettuale,  per  esempio  tramite  licenze  d’uso  

•   la  costante  assistenza  orientata  ai  bisogni  degli  utenti  piuttosto  che    agli  interessi  del  produttore  dello  standard.  

Page 9: Lezione 2

9  

Vantaggi  e  benefici  degli  standard  

Interoperabilità.  È  importante  che  gli  utenti  possano  accedere  direttamente  alla  più  ampia  gamma  di  contenuti,  indipendentemente  dal  fatto  che  questi  siano  stati  realizzati  da  progetti  e  programmi  di  finanziamento  diversi.    

Accessibilità.  È  importante  che  i  materiali  siano  accessibili  al  più  vasto  pubblico  e  che  vengano  messi  a  disposizione  attraverso  l’impiego  di  standard  aperti  e  formati  non  proprietari.    

Conservazione  a  lungo  termine.  La  costante  manutenzione  degli  standard  aiuta  a  garantire  il  futuro  a  lungo  termine  dei  materiali,  in  modo  tale  da  mantenere  la  risorsa  culturale  nella  sua  continuità  storica  e  diversità  di  formato  ed  elevare  al  massimo  la  rendita  dell’investimento.  

Sicurezza.  È  importante  poter  stabilire  con  certezza  l’identità  dei  contenuti  e  dei  progetti  

Page 10: Lezione 2

10  

•   Progettazione  

•   Preparazione  per  la  digitalizzazione  

•   Trattamento  degli  originali  

•   Processo  di  digitalizzazione  

•   Memorizzazione  e  conservazione  del  master  digitale  

•   Creazione  dei  metadati  

•   Pubblicazione  

•   Reperimento  

•   Riuso  

•   Diritti  di  proprietà  intellettuale  e  copyright  

Page 11: Lezione 2

11  

•   definizione  degli  obiettivi  •   definizione  dei  criteri  di  selezione  del  materiale  da  digitalizzare  •   individuazione  dei  diritti  di  proprietà  intellettuale  •   definizione  del  sistema  di  gestione  degli  oggetti  digitali  (DAMS)  •   individuazione  delle  risorse,  dei  costi  e  della  sostenibilità  •   individuazione  del  flusso  di  lavoro  

Page 12: Lezione 2

12  

•   catalogazione  dell'oggetto  da  digitalizzare  •   acquisizione  delle  immagini  digitali,  produzione  dei  file  con  nomenclatura  prestabilita,  produzione  dei  metadati  relativi  alle  immagini  

•   primo  controllo  di  qualità  delle  immagini  

•   archiviazione  dei  master  digitali  delle  immagini  

•   produzione  dei  metadati  amministrativi,  descrittivi  e  strutturali  

•   generazione  di  formati  per  la  pubblicazione  in  rete,  secondo  una  predefinita  strategia  di  fruizione  pubblica,  attraverso  una  procedura  automatizzata  

•   pubblicazione  nell’area  di  lavoro  interna  (Intranet)  per  eseguire  il  secondo  controllo  di  qualità  

•   pubblicazione  sul  Web  

•   collaudo  

Page 13: Lezione 2

13  

Le  risorse  digitalizzate  dovrebbero  essere  identificate  senza  ambiguità  e  dovrebbero  essere  puntabili  in  maniera  univoca  direttamente  dal  browser  web  di  un  utente.  È  importante,  per  esempio,  che  l’utente  finale  abbia  la  possibilità  di  citare  esattamente  e  in  modo  attendibile  una  singola  risorsa,  anziché  dover  indicare  il  collegamento  al  sito  web  di  un  intero  progetto.  

L’identificazione  univoca  di  una  risorsa  digitale  è  il  primo  obiettivo  degli  identificatori.  I  progetti  dovrebbero  far  uso  a  tale  scopo  dello  Uniform  Resource  Identifier  (URI)  e  dovrebbero  garantire  che  l’URI  sia  persistente  e  semplice  da  digitare.  

La  decisione  riguardo  le  scelte  di  nomenclatura  delle  risorse  digitali  e  delle  collezioni  digitali  deve  essere  prevista  già  nella  fase  di  pianificazione  della  digitalizzazione.  Dovrebbero  essere  evitate  nomenclature  generiche  di  singole  risorse  digitali  e  di  organizzazioni  di  collezioni,  come  “Immagine1.html”,  “Archivo1.html”,  

Page 14: Lezione 2
Page 15: Lezione 2

15  

Gli  oggetti  da  avviare  alla  digitalizzazione  devono  essere  catalogati;  in  mancanza  di  risorse  catalografiche  o  inventariali  preesistenti,  la  catalogazione  avverrà  nell’ambito  del  progetto  di  digitalizzazione.  La  catalogazione  consente  di  stabilire  un  legame  con  la  collezione  o  il  catalogo  esistente  ed  è  di  estrema  importanza  ai  fini  della  conservazione  dell’originale  e  della  fruizione.  

Esempio  di  caratteristiche  notevoli  per  il  bene  da  digitalizzare:  -­‐ Stato  di  conservazione  e  fragilità  -­‐ Maneggevolezza  -­‐ Ordinamento  -­‐ Legatura  -­‐ Supporto  -­‐ Dimensioni  -­‐ Cartulazione  -­‐ Presenza  di  altri  elementi  notevoli  quali  sigilli,  miniature,  annotazioni…  

Page 16: Lezione 2

16  

Nella  scelta  dell’hardware  e  del  software  per  la  digitalizzazione,  i  responsabili  dei  progetti  devono  tener  conto  delle  caratteristiche  degli  oggetti  originali  e,  in  particolare,  di  formato,  dimensioni,  stato  di  conservazione,  e  dovrebbero  essere  consapevoli  dell’importanza  di  una  fedele  registrazione  di  proprietà  quali  il  colore.  

Page 17: Lezione 2

17  

I  progetti  devono  garantire  che  il  personale  coinvolto  riceva  una  preparazione  adeguata  al  trattamento  corretto  degli  originali  e  all’uso  dell’hardware  e  del  software  da  impiegare  per  la  digitalizzazione.  Ciò  garantisce  l’efficacia  del  processo  e  riduce  qualunque  rischio  per  gli  originali.  

Gli  operatori  coinvolti  nelle  varie  fasi  del  piano  progettuale  devono  avere  una  formazione  adeguata.  Le  esigenze  di  formazione  devono  essere  identificate  rispetto  a:  

-­‐Tecnologie  adottate  -­‐Trattamento  degli  originali  -­‐Operazioni  di  catalogazione  -­‐Gestione  complessiva  dei  programmi  di  digitalizzazione  

Page 18: Lezione 2

18  

I  responsabili  del  progetto  devono  valutare  i  rischi  cui  vanno  incontro  gli  oggetti  originali  in  qualunque  processo  di  digitalizzazione,  a  maggior  ragione  quando  si  tratta  di  pezzi  unici,  preziosi  o  fragili.  

I  responsabili  del  progetto  devono  discutere  il  processo  e  concordare  le  modalità  di  lavoro  con  i  responsabili  della  conservazione  degli  originali.  

Le  problematiche  della  conservazione  riguarderanno  anche,  una  volta  creato,  l’oggetto  digitale  che  rappresenta  l’oggetto  fisico.  

Page 19: Lezione 2

19  

I  problemi  posti  dalla  conservazione  delle  risorse  digitali  devono  essere  considerati  come  parte  integrante  del  processo  di  produzione  digitale.  

I  responsabili  del  progetto  devono  comprendere  l’importanza  di  creare  un  master  digitale  di  alta  qualità  completamente  documentato,  dal  quale  potranno  derivare  tutte  le  altre  versioni,  quali,  per  esempio,  le  versioni  compresse  per  l’accesso  via  Web.  Il  master  digitale  documentato  sarà  di  grande  aiuto  per  la  migrazione  periodica  dei  dati  e  per  lo  sviluppo  di  nuovi  prodotti  e  risorse.  

Page 20: Lezione 2

20  

Formati  dei  file  

Quando  si  producono  delle  risorse  digitali  si  dovrebbero  impiegare  formati  standard  aperti,  per  massimizzarne  l’accesso.  

In  alcuni  casi  possono  non  esservi  specifici  standard  aperti,  oppure  questi  possono  essere  così  recenti  che  gli  strumenti  in  grado  di  gestirli  non  sono  ancora  disponibili.  In  tali  casi,  pertanto,  può  essere  accettabile  l’impiego  di  formati  proprietari.  

Page 21: Lezione 2

21  

Digitalizzazione  e  memorizzazione  del  testo  –  Codifica  dei  caratteri  

La  codifica  dei  caratteri  è  un  algoritmo  che  consente  di  rappresentare  i  caratteri  in  forma  digitale,  definendo  una  corrispondenza  tra  le  sequenze  di  codice  dei  caratteri  (i  numeri  interi  corrispondendo  a  dei  caratteri  in  un  repertorio)  e  sequenze  di  valori  di  8  bit  (byte  o  ottetti).  Per  poter  interpretare  i  byte  che  compongono  un  oggetto  digitale,  un’applicazione  richiede  l’indicazione  della  codifica  di  carattere  utilizzata  nel  documento.  

La  codifica  dei  caratteri  usata  nei  documenti  di  testo  dovrebbe  essere  segnalata  esplicitamente.  Per  i  documenti  XML,  la  codifica  dei  caratteri  dovrebbe  essere  registrata  nella  dichiarazione  di  codifica  della  dichiarazione  XML.  Per  i  documenti  XHTML,  la  dichiarazione  XML  può  essere  omessa,  ma  la  codifica  deve  essere  registrata  nel  valore  dell’attributo  http-­‐equiv  di  un  elemento  meta.  

Page 22: Lezione 2

22  

Digitalizzazione  e  memorizzazione  del  testo  –  Formati  

Il  contenuto  testuale  dovrebbe  essere  creato  e  gestito  in  un  formato  strutturato,  adatto  alla  generazione  di  documenti  HTML  o  XHTML  per  la  pubblicazione.  

Nella  maggior  parte  dei  casi,  l’opzione  più  opportuna  sarà  memorizzare  il  contenuto  testuale  in  un  formato  a  base  SGML  o  XML  che  si  uniformi  a  una  DTD  (Document  Type  Definition)  o  a  uno  schema  XML.  I  responsabili  del  progetto  possono  scegliere  se  memorizzare  questo  tipo  di  contenuto  in  semplici  file  oppure  all’interno  di  una  base  di  dati.  Tutti  i  documenti  dovrebbero  essere  convalidati  nei  riguardi  della  DTD  o  dello  schema  XML  appropriato.  

I  progetti  dovrebbero  dimostrare  di  conoscere  e  comprendere  le  finalità  dei  formati  standardizzati  per  la  codifica  dei  testi  e  dovrebbero  memorizzare  il  contenuto  testuale  in  tali  formati,  quando  opportuno.  

Page 23: Lezione 2

23  

Digitalizzazione  e  memorizzazione  di  immagini  fisse  

Le  immagini  fisse  digitali  si  dividono  in  due  categorie:  

le  immagini  a  matrice  di  punti  (raster  o  bit-­‐mapped);  hanno  la  forma  di  una  griglia  o  matrice  2D,  in  cui  ogni  elemento  dell’immagine  (pixel)  ha  una  collocazione  unica  all’interno  della  matrice  e  un  valore  (o  un  insieme  di  valori)  di  colore  indipendente,  che  può  essere  modificato  separatamente.  Il  processo  di  digitalizzazione  genera  solitamente  un’immagine  a  matrice  di  punti.  Rientrano  nella  categoria  delle  immagini  a  matrice  di  punti  anche  le  immagini  create  al  computer  (born  digital),  cosiddette  grafiche  non  vettoriali,  come  loghi,  icone,  disegni  al  tratto  ecc.  

-­‐  le  immagini  vettoriali  (objectoriented);  forniscono  un  insieme  di  istruzioni  matematiche  utilizzate  da  un  programma  di  disegno  per  costruire,  gestire  e  visualizzare  un’immagine  

Page 24: Lezione 2

24  

Digitalizzazione  e  memorizzazione  di  immagini  fisse  –  parametri  Le  immagini  fisse  digitali  dovrebbero  essere    tenuti  presenti  i  seguenti  parametri  di  acquisizione:  

La  densità  di  campionamento  spaziale,  riferita  anche  come  risoluzione  spaziale:  è  la  frequenza  spaziale  alla  quale  i  campioni  del  documento  originale  sono  acquisiti  dal  dispositivo  che  digitalizza  l’immagine.  

La  profondità  di  colore  (o  profondità  di  bit  =  bit  depth)  è  il  numero  di  bit  a  disposizione  per  rappresentare  tutti  i  livelli  di  luminosità,  utilizzabili  per  rappresentare  i  diversi  colori  (o  toni  di  grigio)  dell’originale.  

Le  immagini  dovrebbero  essere  acquisite  alla  maggior  densità  spaziale  e  profondità  di  colore  opportune  ai  fini  del  progetto,  purché  ne  risulti  un  costo  abbordabile  e  siano  funzionali  agli  usi  previsti.  Ogni  progetto  deve  identificare  il  livello  minimo  di  qualità  e  densità  informativa  di  cui  ha  bisogno.  

Page 25: Lezione 2

25  

Digitalizzazione  e  memorizzazione  di  immagini  fisse  –  formati  In  stretta  correlazione  con  i  parametri  di  acquisizione  è  il  formato  di  memorizzazione  dei  file  immagine  acquisiti,  e  in  particolare  il  tipo  di  compressione  che  può  essere  operata  sui  dati  digitali  dell’immagine.  Esistono  due  principali  tipologie  di  compressione  

-­‐  quella  reversibile  o  senza  perdita  (lossless)  -­‐ quella  con  perdita  (lossy)  

Le  immagini  a  matrice  di  punti,  sia  originate  da  operazioni  di  digitalizzazione,  sia  appartenenti  alle  immagini  grafiche  non  vettoriali  dovrebbero  perciò  essere  memorizzate  utilizzando  principalmente  formati  quali:       -­‐  Tagged  Image  File  Format  (TIFF)     -­‐  Portable  Network  Graphics  (PNG)  

Le  immagini  grafiche  vettoriali  dovrebbero  essere  create  e  memorizzate  in  un  formato  aperto  come  Scalable  Vector  Graphics  (SVG),  un  linguaggio  XML  per  la  descrizione  di  grafici  di  questo  tipo.  

Page 26: Lezione 2

26  

Digitalizzazione  e  memorizzazione  di  documenti  video  

I  documenti  video  dovrebbero  per  consuetudine  essere  memorizzati  nel  formato  non  compresso  derivante  dal  dispositivo  di  registrazione,  senza  ulteriori  trattamenti.  

Il  documento  video  dovrebbe  essere  memorizzato  nel  formato  non  compresso  RAW  AVI  (Audio  Video  Interleave),  senza  l’uso  di  alcun  codec  con  dimensioni  di  quadro  pari  a  720  x  576  pixels,  e  una  frequenza  di  25  quadri  al  secondo,  a  24  bpp.  Dovrebbe  essere  impiegata  la  codifica  colori  PAL.  

Ora  i  nuovi  standard  si  rivolgono  a  formati  HD.  

Un  documento  video  può  essere  creato  e  memorizzato  utilizzando  il  formato  MPEG  adeguato  (MPEG-­‐1,  MPEG-­‐2  o  MPEG-­‐4)  o  i  formati  proprietari  Microsoft  WMF,  ASF  o  Quicktime.  

Page 27: Lezione 2

27  

Digitalizzazione  e  memorizzazione  di  documenti  audio  

I  documenti  audio  dovrebbero  per  consuetudine  essere  memorizzati  nel  formato  non  compresso  derivato  direttamente  dai  dispositivi  di  registrazione,  senza  ulteriori  trattamenti,  come  ad  esempio  la  riduzione  del  rumore.  

I  documenti  audio  dovrebbero  essere  prodotti  e  memorizzati  in  un  formato  non  compresso.  

Page 28: Lezione 2

28  

I  supporti  di  memorizzazione  

Vi  sono  due  tipi  di  minacce  alla  continuità  di  accesso  aisupporti  digitali:  

•  il  deterioramento  fisico  o  il  danneggiamento  del  supporto  stesso  •  cambiamenti  tecnologici,  che  portano  all’obsolescenza  dell’infrastruttura  hardware  e  software  necessaria  per  accedere  al  supporto.  

Page 29: Lezione 2

29  

Strategie  di  conservazione  a  lungo  termine  Esistono  tre  approcci  tecnici  principali  alla  conservazione  digitale:  la  conservazione  della  tecnologia,  l’emulazione  della  tecnologia  e  la  migrazione  dei  dati.  

I  primi  due  approcci  si  concentrano  sulla  tecnologia  utilizzata  per  accedere  all’oggetto,  o  conservando  l’hardware  e  il  software  originali,  o  utilizzando  la  tecnologia  attuale  per  simulare  l’ambiente  originale.  Può  anche  essere  interessante  il  lavoro  sugli  archivi  persistenti,  basato  sull’articolazione  delle  caratteristiche  essenziali  degli  oggetti  da    conservare.  

Le  strategie  di  migrazione  si  concentrano  sul  mantenimento  degli  oggetti  digitali  in  un  formato  accessibile  tramite  tecnologia  corrente.  In  questo  scenario,  gli  oggetti  vengono  trasferiti  con  regolarità  da  un  ambiente  tecnico  a  un  altro,  più  recente,  conservando  il  contenuto,  il  contesto,  l’usabilità  e  la  funzionalità  dell’originale  nella  misura  del  possibile.  

Page 30: Lezione 2
Page 31: Lezione 2

31  

Cosa  sono  i  metadati  

Un  metadato  (dal  greco  meta-­‐  "oltre,  dopo"  e  dal  latino  datum  "informazione"  -­‐  plurale:  data),  letteralmente  "dato  su  un  (altro)  dato",  è  l‘informazione  che  descrive  in  maniera  strutturata  e  

standardizzata  un  insieme  di  dati.  

Page 32: Lezione 2

32  

Di  quali  Metadati  parliamo?  Dei  metadati  nell’ambito  di  progetti  di  creazione  e  gestione  di  contenuti  culturali  digitali.  

Tali  metadati  sono  finalizzati  alla  realizzazione  di:  •  Progetti  di  digitalizzazione  •  Portali  narrativi  di  contenuto  culturale  

 e  servono  come  strumenti  di  mediazione  per  agevolare  la  conoscenza  e  fruizione  di  contenuti  culturali,  da  valorizzare  nel  rispetto  degli  originali.  

Nel  nostro  ambito  specifico  di  interesse  i  metadati  possono  riferirsi  a  classi  di  risorse  diverse:  •  l’oggetto  fisico  digitalizzato  •  gli  oggetti  digitali  creati  durante  il  processo  di  digitalizzazione  (master  digitali)  •  gli  oggetti  digitali  derivati  dal  master  •  nuove  risorse  create  dagli  oggetti  digitali  originali  •  collezioni  varie  di  oggetti  sopracitati  

Page 33: Lezione 2

33  

A  cosa  ci  servono?  

Le  principali  operazioni  sui  metadati  per  le  risorse  digitali  che  vogliamo  supportare  sono:  

•  Individuazione  e  recupero  •  Gestione  e  controllo  •  Conservazione  a  lungo  termine  delle  risorse  digitali  

Per  supportare  ciascuna  di  queste  funzioni  possono  servire  schemi  di  metadati  diversi,  ma  pratica  accade  anche  che  molteplici  funzioni  vengano  supportate  da  uno  stesso  metadato.  

Page 34: Lezione 2

34  

Classificazioni  e  standard  

I  metadati  possono  essere  classificati  rispetto  a  diverse  categorie  funzionali  (Descrittivi,  Amministrativi  Gestionali,  Strutturali).  Esistono  vari  standard  studiati  per  diverse  istituzioni  culturali  

(Biblioteche,  archivi,  musei).  

Page 35: Lezione 2

35  

Descrittivi  per  l'identificazione  e  il  recupero  degli  oggetti  digitali;  sono  costituiti  da  descrizioni  normalizzate  dei  documenti  fonte  (o  dei  documenti  digitali  nativi)  e  si  trovano  generalmente  in  basi  dati  esterne  rispetto  agli  archivi  digitali,  linkabili  per  attivare  procedure  di  information  retrieval  

Amministrativi  Gestionali  per  le  operazioni  di  gestione  e  conservazione  degli  oggetti  digitali  all'interno  dell'archivio  

Strutturali  per  la  descrizione  della  struttura  interna  dei  documenti  (es.  introduzione,  capitoli,  indice  di  un  libro)  e  la  gestione  delle  relazioni  fra  le  varie  parti  componenti  gli  oggetti  digitali.  

Page 36: Lezione 2

36  

Metadati  Descrittivi  

Servono  al  reperimento  e  all’interpretazione  dell’oggetto  digitale  e  ne  permettono:  

•  l’identificazione  •  la  descrizione  •  la  caratterizzazione  •  l’accesso  tramite  responsabilità  intellettuale,  argomento  etc.  

Nei  progetti  che  riguardano  contenuti  culturali  digitali,  ormai  la  capacità  di  fornire  metadati  Dublin  Core  (DC)  semplici,  rappresenta  il  requisito  minimo  indispensabile  per  consentire  il  reperimento  dell’informazione.  

Page 37: Lezione 2

 37  

Metadati  Amministrativi  Gestionali  Metadati  necessari  alla  gestione  e  alla  conservazione  delle  risorse  digitali  che  permettono:  •  la  pubblicazione  •  l’acquisizione  •  la  vendita  •  la  fruizione  •  la  conservazione  

Comprendono:  •  Metadati  tecnici  -­‐>  che  descrivono  tecnicamente  le  risorse  digitali  (non  esiste  uno  standard  unico  –  es.  NISO  per  le  immagini  )  •  Metadati  per  la  conservazione  -­‐>  relativi  alla  fonte  (oggetto  da  cui  deriva)  e  alla  provenienza  (storia  delle  operazioni  fatte  sull’oggetto  digitale)  •  Metadati  per  la  gestione  dei  diritti  (ancora  privi  di  standard)  •  Metadati  per  la  conservazione  a  lungo  termine  (basati  sul  modello  OAIS)  

Page 38: Lezione 2

 38  

Metadati  Strutturali  Descrivono  le  relazioni  logiche  o  fisiche  che  collegano  le  parti  di  un  oggetto  composito.  

Esempi:  

•  Un  libro  “fisico”,  composto  da  una  sequenza  di  pagine  •  Un  documento  archivistico,  composto  da  un  gruppo  di  carte  eventualmente  raccolte  in  buste  organizzate  all’interno  di  fascicoli,  che  costituisco  le  serie  di  un  fondo.  

NOTA  BENE:  Ai  fini  del  loro  uso  e  della  loro  interpretazione,  è  essenziale  mantenere  memoria  della  sequenza  e  della  posizione  all’interno  struttura  multilivellare  più  o  meno  complessa  delle  singole  risorse  digitali  

Page 39: Lezione 2

 39  

Gli  standard  

Ciascun  contesto  culturale  di  riferimento  adotta  standard  descrittivi  diversi  per  le  proprie  risorse,  dei  quali  dobbiamo  tener  conto  nella  produzione  dei  metadati:  

•  Biblioteche  -­‐>  ISBD  per  la  descrizione  bibliografica,  da  cui  derivano  i  formati  MARC  

•  Archivi  -­‐>  ISAAD(G)  e  ISAAR(CPF),  per  la  descrizione  dei  documenti,  EAD  per  l’amministrazione  e  il  reperimento  delle  fonti  

•  Museale  -­‐>  ICCD  standard  per  la  descrizione  dei  reperti  artistici  e  dei  reperti  di  cultura  materiale.  

Page 40: Lezione 2

 40  

Dublin  Core  :  

E’  un  sistema  di  metadati  costituito  da  un  nucleo  (core,  in  inglese)  di  15  elementi  essenziali  ai  fini  della  descrizione  di  qualsiasi  risorsa  in  formato  elettronico.  Sviluppato  in  ambito  americano  a  partire  dal  1995,  si  è  posto  come  obiettivo  quello  di  consentire  agli  autori  di  effettuare  direttamente  la  descrizione  standardizzata  delle  risorse  rese  disponibili  sulla  rete,  senza  richiedere  la  mediazione  di  un'agenzia  catalografica.  Caratteristiche  del  Dublin  Core:  

•  semplicità  -­‐>  è  uno  strumento  utilizzabile  sia  da  parte  di  catalogatori  esperti  che  di  non  specialisti  •  interoperabilità  semantica  -­‐>  è  divenuto  il  mezzo  per  stabilire  un’infrastruttura  a  livello  internazionale  •  flessibilità  -­‐>  permette  di  integrare  e  sviluppare  la  struttura  dei  dati  con  significati  semantici  diversi  ed  appropriati  al  contesto  di  applicazione.  

Page 41: Lezione 2

 41  

Dublin  Core  :  

Elemento:  Titolo  Nome:  Titolo  Identificatore:  Title  Definizione:  Un  nome  dato  alla  risorsa  Commento:  In  particolare,  un  Title  sarà  un  nome  con  il  quale  la  risorsa  è  formalmente  conosciuta.  

Elemento:  Creatore  Nome:  Creatore  Identificatore:  Creator  Definizione:  Un’entità  che  ha  la  responsabilità  principale  della  produzione  del  contenuto  della  risorsa  Commento:  Esempi  di  Creator  includono  una  persona,  un’organizzazione  o  un  servizio.  In  particolare,  il  nome  di  un  Creator  dovrebbe  essere  usato  per  indicare  l’entità  

Elemento:  Soggetto  Nome:  Soggetto  e  Parole  chiave  Identificatore:  Subject  Definizione:  L’argomento  della  risorsa.  Commento:  In  particolare  un  Subject  può  essere  espresso  da  parole  chiave  o  frasi  chiave  o  codici  di  classificazione  che  descrivono  l’argomento  della  risorsa.    

Page 42: Lezione 2

 42  

Dublin  Core  :  

Elemento:  Descrizione  Nome:  Descrizione  Identificatore:  Description  Definizione:  Una  spiegazione  del  contenuto  della  risorsa  Commento:  Una  descrizione  può  includere  ma  non  è  limitata  solo  a:  un  riassunto  analitico,  un  indice,  un  riferimento  al  contenuto  di  una  rappresentazione  grafica  o  un  testo  libero  del  contenuto.  

Elemento:  Editore  Nome:  Editore  Identificatore:  Publisher  Definizione:  Un’entità  responsabile  della  produzione  della  risorsa,  disponibile  nella  sua  forma  presente  Commento:  Esempi  di  un  Publisher  includono  una  persona,  un’organizzazione  o  un  servizio.  Normalmente  il  nome  di  un  Publisher  è  usato  per  indicare  l’entità  stessa  

Elemento:  Autore  di  contributo  subordinato  Nome:  Autore  di  contributo  subordinato  Identificatore:  Contributor  Definizione:  Un’entità  responsabile  della  produzione  di  un  contributo  al  contenuto  della  risorsa  Commento:  Esempi  di  un  Contributor  includono  una  persona,  un’organizzazione  o  un  servizio.  

Page 43: Lezione 2

 43  

Dublin  Core  :  

Elemento:  Data  Nome:  Data  Identificatore:  Date  Definizione:  Una  data  associata  a  un  evento  del  ciclo  di  vita  della  risorsa  Commento:  Normalmente  Date  è  associata  alla  creazione  o  alla  disponibilità  della  risorsa.  Si  consiglia  di  usare  un  numero  di  8  caratteri  nella  forma  YYYY-­‐MM-­‐DD    

Elemento:  Tipo  Nome:  Tipo  di  risorsa  Identificatore:  Type  Definizione:  La  natura  o  il  genere  del  contenuto  della  risorsa  Commento:  Tipo  include  termini  che  descrivono  categorie  generali,  funzioni,  generi  o  livelli  di  aggregazione  per  contenuto.  Si  raccomanda  di  selezionare  un  valore  da  un  vocabolario  controllato  

Elemento:  Formato  Nome:  Formato  Identificatore:  Format  Definizione:  La  manifestazione  fisica  o  digitale  della  risorsa  Commento:  Normalmente  Format  può  includere  il  tipo  di  supporto  o  le  dimensioni  della  risorsa.  Format  può  essere  usato  per  determinare  il  software,  l’hardware  o  altro  apparato  necessario  alla  visualizzazione  o  all’elaborazione  della  risorsa.  

Page 44: Lezione 2

 44  

Dublin  Core  :  

Elemento:Identificatore  Nome:  Identificatore  della  risorsa  Identificatore:  Identifier  Definizione:  Un  riferimento  univoco  alla  risorsa  nell’ambito  di  un  dato  contesto  Commento:  Si  raccomanda  di  identificare  la  risorsa  per  mezzo  di  una  sequenza  di  caratteri  alfabetici  o  numerici  secondo  un  sistema  di  identificazione  formalmente  definito.  Esempio  l’International  Standard  Book  Number  (ISBN)  

Elemento:  Fonte  Nome:  Fonte  Identificatore:  Source  Definizione:  Un  riferimento  a  una  risorsa  dalla  quale  è  derivata  la  risorsa  in  oggetto  Commento:  La  risorsa  può  essere  derivata  dalla  risorsa  Source  in  tutto  o  in  parte.  

Elemento:  Lingua  Nome:  Lingua  Identificatore:  Language  Definizione:  La  lingua  del  contenuto  intellettuale  della  risorsa  Commento:  Per  i  valori  dell’elemento  Language  si  raccomanda  di  utilizzare  quanto  definito  dal  RFC  1766  [RFC1766]  che  include  un  codice  di  lingua  su  due  caratteri.  Ad  esempio,  "en"  per  l’inglese,  "fr"  per  il  francese,  "it"  per  l’italiano  o  "en-­‐uk"  per  l’inglese  usato  nel  Regno  Unito  

Page 45: Lezione 2

 45  

Dublin  Core  :  Elemento:  Relazione  Nome:  Relazione  Identificatore:  Relation  Definizione:  Un  riferimento  alla  risorsa  correlata  Commento:  Si  raccomanda  di  far  riferimento  alla  risorsa  per  mezzo  di  una  sequenza  di  caratteri  alfabetici  o  numerici  in  conformità  ad  un  sistema  di  identificazione  formalmente  definito  

Elemento:  Copertura  Nome:  Copertura  Identificatore:  Coverage  Definizione:  L’estensione  o  scopo  del  contenuto  della  risorsa  Commento:  Normalmente  Coverage  include  la  localizzazione  spaziale  (il  nome  di  un  luogo  o  le  coordinate  geografiche),  il  periodo  temporale  (l’indicazione  di  un  periodo,  una  data  o  un  range  di  date)  o  una  giurisdizione  (ad  esempio  il  nome  di  un’entità  amministrativa).  

Elemento:  Gestione  dei  diritti  Nome:  Gestione  dei  diritti  Identificatore:  Rights  Definizione:  Informazione  sui  diritti  esercitati  sulla  risorsa  Commento:  Normalmente  un  elemento  Rights  contiene  un’indicazione  di  gestione  dei  diritti  sulla  risorsa,  o  un  riferimento  ad  un  servizio  che  fornisce  questa  informazione.  

Page 46: Lezione 2

46  

Metadati  MAG  

I  Metadati  Amministrativi  Gestionali  (MAG)  rappresentano  lo  standard  ICCU  per  l’amministrazione  dei  dati  relativi  alle  risorse  

digitali.  

Page 47: Lezione 2

 47  

Metadati  Amministrativi  Gestionali  In  Italia  nasce  lo  schema  MAG  a  cura  di  un  Gruppo  di  studio  sugli  standard  e  le  applicazioni  di  metadati  ai  beni  culturali  costituti  dall’ICCU.  In  particolare,  lo  schema  MAG  fornisce  specifiche  formali  per  le  fasi  di  raccolta  e  archiviazione  dei  metadati  utili  a:  

Esempi:  

•  identificare  in  maniera  univoca  gli  oggetti  digitali  •  certificare  l'autenticità  e  integrità  dei  contenuti  •  documentare  la  catena  di  custodia  degli  oggetti  digitali  •  documentare  i  processi  tecnici  eseguiti  per  la  conservazione  permanente  degli  oggetti  digitali  •  informare  sulle  condizioni  e  i  diritti  di  accesso  agli  oggetti  digitali  da  parte  degli  utenti  finali  

Page 48: Lezione 2

 48  

Metadati  Amministrativi  Gestionali  

Il  set  di  metadati  MAG  viene  definito  per  tipologie  di  oggetti  digitali  (es.  immagini  statiche,  testi  prodotti  con  tecnologia  OCR,  suono,  audiovisivi  etc.).  

I  MAG  sono  espressi  nella  sintassi  XML.  

I  MAG  si  presentano  come  uno  standard  aperto,  documentato,  liberamente  disponibile  e  del  tutto  indipendente  da  specifiche  piattaforme  hardware  e  software,  al  fine  di  favorirne  un  impiego  generalizzato  

Di  norma  i  MAG  vanno  associati  alla  risorsa  digitale  nel  suo  complesso,  e  comprendono  informazioni  generali  sul  progetto  e  sul  metodo  di  digitalizzazione  ed  altre  informazioni  relative  all'unità  elementare  dell'archivio  digitale,  cioè  al  singolo  oggetto  digitale  

Page 49: Lezione 2

 49  

Metadati  Amministrativi  Gestionali  

I  MAG  comprendono  una  quantità  limitata  di  metadati  descrittivi,  ereditati  dagli  applicativi  di  catalogazione  ed  espressi  in  formato  Dublin  Core.  Di  norma  tali  metadati  descrittivi  sono  funzionali  a  operazioni  gestionali  interne  all'archivio  degli  oggetti  digitali  

Di  norma,  con  poche  eccezioni,  i  MAG  vanno  raccolti  o  prodotti  con  procedure  automatizzate  nel  corso  del  processo  di  digitalizzazione  o  trattamento  (postprocessing)  dell'oggetto  digitale.  

Page 50: Lezione 2

 50  

Metadati  Amministrativi  Gestionali  

Lo  standard  MAG,  articolato  in  diverse  sezioni,  rappresenta  una  completa  e  capillare  carta  d’identità  delle  collezioni  digitali.  Le  sezioni  del  MAG  e  il  loro  contenuto:  

•  <gen>  informazioni  generali  sul  progetto  e  sul  tipo  di  digitalizzazione  •  <bib>  metadati  descrittivi  sull’oggetto  digitalizzato  •  <stru>  dati  sulla  struttura  logica  dell'oggetto  digitalizzato  •  <img>  metadati  specifici  delle  immagini  digitalizzate  •  <ocr>  metadati  relativi  al  riconoscimento  ottico  del  testo  •  <doc>  metadati  relativi  ai  files  di  testo  correlati  •  <audio>  metadati  relativi  a  un  file  contenente  una  traccia  audio  •  <video>  metadati  relativi  a  uno  stream  video  •  <dis>  dati  sulla  disseminazione  degli  oggetti  digitali  e  la  loro  fruibilità  

Page 51: Lezione 2

 51  

Metadati  Amministrativi  Gestionali  –  Struttura  

Schema  

Page 52: Lezione 2

 52  

Metadati  Amministrativi  Gestionali  –  Struttura  

Il  MAG  minimo