Normalizzare per condividere. Esigenze di ricerca, reperimento e catalogazione flessibile

Post on 10-Feb-2017

205 views 2 download

Transcript of Normalizzare per condividere. Esigenze di ricerca, reperimento e catalogazione flessibile

Normalizzare per condividere.Esigenze di ricerca, reperimento e catalogazione flessibile

Fabio Venuda

MilanoArchivio Storico Civico e Biblioteca Trivulziana

26 novembre 2015

Dati, informazioni, conoscenza

• dato– un singolo elemento informativo: il nome di un file, la

data di edizione, il titolo di un libro ...• informazione

– un insieme di dati collocato in un contesto di riferimento: la voce di un’enciplodedia, una notizia bibliografica (insieme di dati)

• conoscenza– il saper usare e produrre informazioni: saperle selezionare

e valutare, il saperle gestire e utilizzare per produrre nuove informazioni, ad esempio per un lavoro di ricerca, per scrivere un libro o una tesi

I Metadati

• Termine e uso sembrano non chiari e destinati ai tecnici

• In realtà sono molto comuni e vengono usati ogni giorno

• Anche ora - Le informazioni sulla giornata di studi... non sono la giornata

• Differenti tipi di metadati - Descrittivi ... il vostro nome

– Che consentono di navigare nello spazio fisico ...

– Prendere delle decisioni ...• se venire o no alla giornata di studi• se girare a sinistra per prendere il

Traghetto o entrare nel parcheggio

I Metadati

• Nel mondo fisico per oggetti fisici

• Ma particolarmente importanti per le risorse digitali e online ... che usiamo ogni giorno– Foto digitali

Cosa sono ...

• Dati che descrivono altri dati• Informazioni strutturate o meno che

– Descrivono– Spiegano– Localizzano– Permettono di reperire, identificare, usare o gestire una

risorsa fisica o informativa, analogica o digitale (NISO, 2004)

• Metadati differenti, per usi differenti, per differenti comunità– ICOM – Geografici – Biblioteche digitali -

• Oggi vengono riferiti a dati e informazioni leggibili dai computer, oppure per registrazioni che descrivono ERs

Metadati per descrivere, organizzare, gestire

• Descrittivi– descrivono una risorsa allo scopo di trovarla e identificarla,

selezionarla,ottenerla, navigarla ... • descrizione e accessi, abstract

• Strutturali– indicano come oggetti compositi vadano organizzati e

rimessi insieme• le pagine di un libro in una biblioteca digitale

• Gestionali - Amministrativi– danno informazioni su come gestire una risorsa– quando e come è stata creata, tipo di file, – hanno diversi sottoinsiemi – I due più comuni

• Gestione dei diritti (Rights management metadata)• Conservazione (Preservation Metadata)

Motori di ricerca e metadati

• Motori di ricerca – Trovano le informazioni indicizzando più o

meno automaticamente i documenti presenti in rete

– Catturando e analizzando le pagine Web presenti in Rete (Harvesting) con degli spider

– Estraendo e indicizzando le parole signifcative presenti nel documento

– Oppure interpretando le parole già inserite nel documento (MetaTag) che ne descrivono il contenuto

– Più precise sono le parole inserite, maggiore è la precisione delle informazioni recuperate

Motori di ricerca e metadati

• MetaTag– Informazioni sul documento e

sulle sue cratteristiche per poterlo

• Trovare, Identificare e Ottenere (come una scheda di catalogo)

• HTML – Prevede degli elementi

descrittivi nell’intestazione <HEAD> della pagina web<head>

<meta name="description" content="Free Web tutorials"><meta name="keywords" content="HTML,CSS,JavaScript"><meta name="author" content="Hege Refsnes"></head><body>

Dublin Core

• 1995 a Dublin (Ohio) Workshop tra NCSA e OCLC• 15 semplici elementi per consentire all’autore o

all’editore di un oggetto digitale di– Fornire una descrizione corretta e completa dell’oggetto– Integrata nell’oggetto stesso– Senza conoscere regole di catalogazione

CreatoreCreatore sec.EditoreDiritti

DataFormatoLinguaIdentificatore

Contenuto Responsabiltà ManifestazioneTitoloSoggettoDescrizioneCoperturaFonteRelazioneTipo di risorsa

In realtà

• I metadati sono utilizzati da sempre – lista dei rotoli manoscritti conservati nelle capsae – le informazioni registrate nei tituli– bibliografie

• Considerati dati su altri dati– dati che informano su altri dati– dati che descrivono altri dati– che consentono di trovare

usare gestire altri dati o risorse ...

Metadati descrittivi nell’ambito bibliotecario

• Indicano qualsiasi schema per la descrizione delle risorse

• Sono applicati a qualsiasi tipo di oggetto digitale o non digitale

• La catalogazione è una forma di Metadati

• Le informazioni che tradizionalmente i bibliotecari utilizzano nei cataloghi

Metadati nell’ambito bibliotecario

Metadati descrittivi nell’ambito bibliotecarioSistema di metadati

Bisogno di normalizzazione

Charles C. Jewett (1816-1868)Smithsonian & Boston Public Library

1851

1876 – Melvil Dewey e A.L.A.

1851-1931Amherst College

«nothing can be more annoying than to do work which one knows is done by others over and over in all our libraries, and which might be done once for all»

Otis Hall Robinson (1835-1912), Rochester University Librarian

La prima conferenza e la Cooperative cataloguing

• Come riprodurre le schede• Come farle arrivare alle biblioteche americane• Quale istituzione avrebbe dovuto farsene carico

Come riprodurre ... • Eliotipia alla Boston Public Library• Inchiostro tannico• Stampa di 70.000 schede anno

(1831-1897) Boston PL – Harvard libraries – 1. ALA president

La prima conferenza e la Cooperative cataloguing• Come far arrivare le schede alle biblioteche – PW 1878

Il bisogno di normalizzare: il Co-operative Committee e il Library Bureau

• 8 report tra 1877-78

• Normalizzazione delle schede, cataloghi, etichette e scaffali

Normalizzare: le regole

• Panizzi 1841• Jewett 1952• Cutter 1876

• Dewey 1877«is to know how the title are to be prepared»

catalogazione centralizzata

• A.L.A. 1878• A.L.A. 1941-

1949

• LoC 1901 servizio distribuzione schede

E i formati? Hermann Hollerith (1860 –1929)

• Columbia Univ.• US census 1880• Quesiti

156 (1870) 13.010 (1880) • US census 1890

– ...• 1889 tabulating

machine

Scheda perforata di Hollerith a 288 posizioni:12 verticali per 24 orizzontali

Pantografo

Spazzola di lettura

1934

Herman HollerithTabulating Machine

Dal 1924

NY State Library - 1956

Book catalog at Stanford Univ. 1966

FerUT – 1952 UoToronto

ONULP – Univ. Toronto 1963

I formati di scambio dei dati bibliografici• Dal 1876 USA record-sharing environment• Spinta per la normalizzazione dei formati

• Focus Automazione LoC potenziare la circolazione delle schede

• Library of Congress – 1964 Henriette Avram MARC project MARC II 1967-68 ...

• IFLA – 1973 – ISBD (M)• IFLA – 1974 - Universal Bibliographic Control• IFLA – 1977 - UNIMARC

E i manoscritti?

Descrizione Ricerca Scientifica in ambito storico, bibliografico, filologico, storico-artistico, paleografico, archeologico – necessariamente fluida – di un oggetto unico

FRBR – Functional Requirements for Bibliographic Records – Entity Relationship - 1998

• Circolazione dei dati catalografici – Ridurre i costi della catalogazione– Uniformità e coerenza nelle scelte catalografiche

• FRBR – Semplificare la catalogazione– Livello minimo di elementi per record bibliografico– Punto di vista di chi utilizza i record– Ampliare la condivisione all’esterno delle biblioteche

FRBR ER

• Modello Entity Relationship • Fornisce una visione statica delle collezioni

– Come prodotti nello stato in cui si trovano al momento della descrizione

• Non considera esplicitamente i processi produttivi• Non considera eventi subiti da quando sono stati

creati• Materiale librario, un conglomerato di 4 strati

distinti:– Opera Espressione ed Esemplari che appartengono

alla stessa Edizione (Manifestazione)(Patrick Le Boeuf BNF)

CIDOC-CRM – 1996Comitato Internazionale per la Documentazione – Conceptual Reference Model

• Realizzato per la rappresentazione di oggetti museali

• Visione dinamica degli oggetti– Considera gli eventi subiti da quando sono

creati a quando vengono distrutti

• Al centro del modello la nozione di fenomeno temporale (Temporal entities)– Contestualizzazione storica– Da dove proviene– Quando è stato creato– Quali modificazioni ha subito e quando– Cosa ha determinato le sue caratteristiche

attuali– 80 classi e più di 130 proprietà

FRBRoo - object oriented

• IFLA e ICOM-CIDOC - 2003 – International Working Group on FRBR/CIDOC-CRM Harmonisation

• Mantiene la distinzione fra Opera ed Espressione, e fra Manifestazione e Item– Espressa però nello stesso formalismo del CIDOC-CRM

• Mantiene le nozioni Temporali e di Evento di CIDOC-CRM

• Più adatto per la descrizione di documenti unici e rari conservati nelle biblioteche– Rende possibile registrare la storia dei documenti– Chiarisce la questione Manifestazione e Item per

documenti unici

FRBRoo – object oriented

• Dichiara due strutture distinte– Documenti unici – Documenti prodotti in n esemplari

• Manoscritto come un’istanza di una Manifestation singleton – Item non menzionato in questa classe

• Per le opere in n esemplari– Struttura simile a FRBRer W E M I

Catalogazione flessibile

Library linked data

vi ringrazio per l’attenzione

fabio.venuda@unimi.it