RDA e Linked data: un binomio naturale

27
Convegno delle Stelline 20ᵃ edizione RDA e Linked data: un binomio naturale. Linee guida e tecnologie per gli ILS di nuova generazione Tiziana Possemato @Cult

Transcript of RDA e Linked data: un binomio naturale

Convegno delle Stelline – 20ᵃ edizione

RDA e Linked data: un binomio naturale. Linee guida e tecnologie

per gli ILS di nuova generazione

Tiziana Possemato @Cult

Copyright 2008 @CULT. All rights reserved

I dati delle biblioteche nel web semantico

Necessità del cambiamento affinché i dati del catalogo siano del web e non solo

nel web: formulata in varie forme e occasioni, la più significativa delle quali è

On the record, il report della Library of Congress Working Group on the

Future of Bibliographic Control, del 2008, in cui si richiama alla necessità di:

• trasformare la descrizione testuale in set di dati usabili per processi ed

elaborazioni automatiche da parte di macchine;

• rendere gli elementi di dati univocamente identificabili;

• assicurare la compatibilità dei dati con le tecnologie e gli standard del web;

• usare un linguaggio trasversale e interoperabile nella realtà del web.

Copyright 2008 @CULT. All rights reserved

Nuovi modelli catalografici e linked data

Adozione delle logiche e delle tecnologie del web semantico nel contesto

delle biblioteche:

• ripensamento profondo del modello del catalogo finora conosciuto;

• rifondazione dei principi, degli standard e delle normative catalografiche;

RDA (Resource Description and Access): standard internazionale

per la metadatazione delle risorse nell’era digitale => le linee guida si

muovono all’interno della filosofia del web semantico e dei linked data

Copyright 2008 @CULT. All rights reserved

Nuovi modelli catalografici e linked data

Riflessione sul futuro del controllo bibliografico universale:

• Il formato piatto del record MARC è inadeguato ad esprimere le relazioni

tra entità bibliografiche che il modello FRBR e lo standard RDA considerano

fondamentali (MARC must die!)

• Maggio 2011: la Bibliographic Framework Transition Iniziative dichiara:

«The new bibliographic framework project will be focused on the Web

environment, Linked Data principles and mechanisms, and the Resource

Description Framework (RDF) as a basic data model»

21 novembre 2012: Bibliographic Framework as a Web of Data: Linked

Data Model and Supporting Services – BIBFRAME –

Copyright 2008 @CULT. All rights reserved

BIBFRAME

BIBFRAME: il primo passo nella definizione di una road map che dovrebbe

proporre un nuovo ambiente bibliografico, con l’enunciazione di un nuovo

ecosistema bibliografico:

• alto livello di analisi e identificazione del dato

• enfatizzazione delle relazioni

• impiego diffuso dei vocabolari controllati

• accurato dettaglio descrittivo delle risorse

• ampia flessibilità nella gestione delle voci controllate

Copyright 2008 @CULT. All rights reserved

BIBFRAME

BIBFRAME: modello di dati ispirato a FRBR ma semplificato; distingue il contenuto

concettuale (opera) e la manifestazione fisica (istanza); identifica un’entità

in maniera non ambigua; evidenzia le relazioni tra le entità mostrando la natura

della correlazione.

Il modello è strutturato in 4 classi principali:

• Opera: essenza concettuale della risorsa catalogata, il cui concetto è assimilabile

all’opera e all’espressione di FRBR.

• Istanza: materializzazione individuale dell’opera.

• Authority: entità che hanno una relazione con l’opera o con l’istanza, per

esempio persone, famiglie, enti, concetti, luoghi.

• Annotazioni: ciò che decora o arricchisce la risorsa con informazioni aggiuntive,

per esempio dati di esemplare, immagini di copertina, recensioni, TOC

Copyright 2008 @CULT. All rights reserved

BIBFRAME – Modello dati

Copyright 2008 @CULT. All rights reserved

BIBFRAME - Esempio

Il rapporto FRBR ha 3 istanze associate a 2 diversi editori

Copyright 2008 @CULT. All rights reserved

BIBFRAME – Linee guida

BIBFRAME definisce alcune linee guida generali, tra cui:

• la prospettiva che gli ILS di nuova generazione si orientino su una architettura a

risorsa, dove cioè l’oggetto catalogato sia il singolo elemento, non l’intero record;

• la possibilità che ciascuna risorsa possa essere collegata ad altre risorse;

• la possibilità che nella metadatazione il catalogatore possa attingere da

informazioni nel web, senza creare ogni volta oggetti nuovi;

• l’impiego di liste controllate di termini e, quindi, l’accesso ai vocabolari e alle

liste di termini pubblicate, per esempio, sull’Open Metadata Registry.

• la possibilità di definire in configurazione del sistema la logica di creazione degli

URI e di permettere, dunque, che a ogni nuova risorsa creata sia attribuibile

automaticamente un URI.

Copyright 2008 @CULT. All rights reserved

BIBFRAME Editor

BIBFRAME editor: http://bibframe.org/tools/editor/#

Copyright 2008 @CULT. All rights reserved

RIMMF – RDA in Many Metadata Formats

RIMMF: un primo esempio di sistema orientato a RDA. È uno strumento illustrativo

e didattico, di editing e visualizzazione dei dati, nato per aiutare i catalogatori a

pensare in RDA e, dunque, in FRBR, anziché in AACR e MARC. RIMMF non è,

quindi, un ILS, né un modulo di catalogazione.

Le funzioni disponibili in RIMMF sono:

• creazione di nuovi modelli di catalogazione;

• creazione di nuove registrazioni catalografiche;

• import di dati da database esterni;

• creazione di relazioni tra entità;

• visualizzazione della struttura gerarchica (ad albero) creata dalle relazioni tra le

varie risorse.

Copyright 2008 @CULT. All rights reserved

RIMMF Editor

RIMMF: http://www.marcofquality.com/wiki/rimmf3/doku.php?id=rimmf

Copyright 2008 @CULT. All rights reserved

RIMMF Editor

Particolarmente interessante è la possibilità di visualizzare o importare dati

provenienti da banche dati esterne: database bibliografici e OPAC (per

esempio, quello della Library of Congress), authority file (per esempio,

VIAF), enciclopedie e repertori online (per esempio, Wikipedia).

Il meccanismo ha un duplice scopo:

• facilitare le operazioni di condivisione dei dati;

• consentire, già in fase di strutturazione del dato, di anticipare l’attività di

creazione di collegamenti esterni.

Copyright 2008 @CULT. All rights reserved

RIMMF Editor

Ricerca dell’entità

Umberto Eco in Wikipedia

Ricerca dell’entità Umberto Eco in VIAF con visualizzazione in MARC21 e importazione in RIMMF

Copyright 2008 @CULT. All rights reserved

RIMMF Editor

Import di record in MARCXML dalla Library of Congress, con mappatura e visualizzazione secondo la struttura RDA

Copyright 2008 @CULT. All rights reserved

Evoluzione degli ILS nel panorama italiano

I software di nuova generazione devono tener conto di RDA, producendo

strumenti che facilitino il passaggio dall’epoca dominata dalla strutturazione

dei dati in formato MARC, a una nuova era che, con BIBFRAME, lascia

intendere che andrà nella direzione dei linked open data, e che esprime

anche nel linguaggio l’evoluzione verso nuovi modelli di metadatazione.

WeCat => il modulo di metadatazione dell’ILS OliSuite:

• assimila integralmente tutti gli aggiornamenti di MARC21

• consente di strutturare i dati secondo RDA

• in una modalità orientata ai linked open data.

Copyright 2008 @CULT. All rights reserved 17

WeCat: MARC21 updates 9-18 per RDA

WeCat assorbe tutti i cambiamenti del MARC21, compresi gli

aggiornamento 9-18, che includono le novità previste per RDA

approvate fino al giugno 2014, e che riguardano:

• Contenuto, media e supporto delle risorse (tipi e

caratteristiche)

• Attributi dei nomi e delle risorse

• Relazioni

• Varie

Copyright 2008 @CULT. All rights reserved

OliSuite/WeCat

WeCat propone codici specifici per identificare le entità FRBR: la

metadatazione parte con la selezione di modelli che propongono al

catalogatore gli attributi previsti da

FRBR per ciascuna specifica entità.

Copyright 2008 @CULT. All rights reserved

OliSuite/WeCat

Il potenziamento delle funzioni per il controllo d’autorità esprime la

necessità, comune a RDA e ai principi dei linked open data, di descrivere

l’entità che si sta analizzando con un alto numero di attributi, creando così

un oggetto perfettamente identificabile e riutilizzabile in molteplici ambiti.

Copyright 2008 @CULT. All rights reserved 20

WeCat – Relazioni nome-risorsa

Relazioni tra nome e risorsa assorbite da RDA – Appendice I: lista di

possibili relazioni tra una risorsa e una persona, famiglia e ente (es.:

autore, editore, artista, cartografo)

Copyright 2008 @CULT. All rights reserved 21

WeCat – Relazioni risorsa-risorsa

Relazioni tra risorsa e risorsa assorbite da RDA – Appendice J: sono

previste più di 400 relazioni che possono esistere tra opere, espressioni,

manifestazioni e item (es.: drammatizzato come opera, sequel di, filmato

come manifestazione, riproduzione dell’item).

Copyright 2008 @CULT. All rights reserved 22

WeCat – Relazioni nome-nome

Relazioni tra nome e nome assorbite da RDA – Appendice K: relazioni

che possono esistere tra persone, famiglie e enti (es.: impiegati, sponsor,

discendenti, predecessori)

Relazione tra l’ente FIAT (gruppo automobilistico) e la persona Giovanni Agnelli

Copyright 2008 @CULT. All rights reserved 23

WeCat – Vocabolari e liste di termini

Le liste di termini provengono da vocabolari controllati, per lo più pubblicati

in RDF sull’Open Metadata Registry: WeCat condivide la finalità di utilizzare

un linguaggio formulato in set di dati e in ontologie comprensibili alle

macchine.

Copyright 2008 @CULT. All rights reserved 24

OliSuite/WeCat – Interlinking

Funzione di ricerca e cattura, a partire da un’entità, degli identificativi

utilizzati per la medesima entità su altri dataset e siti esterni:

predisposizione del meccanismo d’interlinking, che consente ai dati di

acquisire la quinta stella prevista dal sistema di valutazione di Tim

Berners-Lee.

Ricerca e cattura degli identificativi dell’entità persona Collodi, Carlo su tre fonti di dati differenti: SBN, VIAF, Wikipedia

Copyright 2008 @CULT. All rights reserved

RDA come istruzione Linked data come realizzazione

• FRBR: fortemente riconosciuto in tutti i progetti di pubblicazione dei dati;

con l’introduzione di RDA è diventato modello di riferimento anche nella fase

di strutturazione dei dati, determinando un corso nuovo nella evoluzione

degli ILS;

• paradigma dei linked data e del web semantico: la filosofia che

sottende il trattamento del dato in fase di creazione e in fase di

pubblicazione;

• realizzazione di linked open data: ancora di pertinenza della

pubblicazione;

• predisposizione del dato per semplificare il processo di identificazione

delle risorse, di creazione di collegamenti e, quindi, di conversione in linked

open data attiene alla nuova generazione di ILS.

Copyright 2008 @CULT. All rights reserved

RDA come istruzione Linked data come realizzazione

La qualità dei risultati dipende dalla quantità di investimenti economici e

umani:

• identificare e collegare i dati attiene alla teoria della catalogazione,

acquisita e consolidata;

• la traduzione delle realizzazioni in progetti di fruizione, attiene al grado

e alla quantità di investimenti di risorse finanziarie e umane.

RDA e linked data rappresentano un binomio naturale: le linee guida e

la tecnologia sono state pensate per gli ILS di nuova generazione.

RDA è, pertanto, la faccia normativa di ciò che i linked open data

realizzano concretamente.

Copyright 2008 @CULT. All rights reserved

Grazie

Tiziana Possemato – @CULT

[email protected] Cel.: 3485810489

www.atcult.it