Le prospettive del riuso dei dati bibliografici con Wikibase / Cristian Bacchi - Giovanni Bergamin

download Le prospettive del riuso dei dati bibliografici con Wikibase / Cristian Bacchi - Giovanni Bergamin

If you can't read please download the document

Transcript of Le prospettive del riuso dei dati bibliografici con Wikibase / Cristian Bacchi - Giovanni Bergamin

Le prospettive del riuso dei dati bibliografici con Wikibase

245 $aIl MARC morto?$cKaren Coyle260 $c2000

il problema principale che il MARC non un formato largamente diffuso (mainstream format): usato dalle biblioteche e solo dalle biblioteche. Non esistono applicazioni di uso comune (per esempio un browser) in grado di leggere il MARC

questo un grosso problema? no, dato che rispetto ad altre istituzioni abbiamo grazie al MARC un enorme insieme di informazioni codificate

http://www.kcoyle.net/marcdead.html

200 $aIl MARC deve morire$fRoy Tennant210$c2002

quando il MARC stato creato, i Beatles erano un gruppo innovativo e quelli che di noi allora cerano facevano sfoggio di vestiti e pettinature imbarazzanti

il MARC un anacronismo: stato pensato quando le tecnologie informatiche erano totalmente diverse da quelle di ora

(anche se let non sinonimo di obsolescenza tecnologica: per esempio la tecnologia della matita non molto cambiata negli ultimi 40 anni)

http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die

La LC annuncia un nuovo formato per i dati bibliografici - Il post nel blog di Karen Coyle 2011

http://kcoyle.blogspot.it/2011/11/future-format-goals-and-measures.html

RDF in Wikpedia

web: dei documenti, dei dati, semantico

Il web si sta arricchendo: oltre a documenti fruibili dallessere umano vengono pubblicati anche dati fruibili da applicazioni (si parla di web dei documenti e web dei dati)

i dati nel web possono diventare grazie a RDF leggibili dalla macchina

web semantico = web che ospita dati leggibili dalla macchina

molte le iniziative in questo campo delle biblioteche

Un anno fa: una proposta di sperimentazione per ..

rivedere criticamente standard / pratiche / strumenti di produzione della informazione bibliografica (IB) alla luce di modelli di successo emergenti (Wikidata/Wikibase)

evitare la tentazione del n+1 standard

gestire una IB multilingue e multistandard (=punti di vista differenti, sedimentazione storica dei cataloghi)

contribuire al nuovo inglese dei dati (Baker)

Questanno: una nuova ipotesi di lavoro

il modello di dati Wikidata pu:ospitare lattuale IB (UNIMARC, MARC21 ecc) senza perdite di informazioni

facilitare levoluzione dellattuale IB verso il formato bibliografico del futuro

Cosa sono WikiData e WikiBaseWikiData una Knowledge-Base collaborativa (collaboratively edited knowledge base o free linked database), mantenuta dalla WikiMedia Foundation e aperta in consultazione e modifica a utenti e robot automatizzati.

WikiData svolge una funzione di archiviazione centrale dei dati puntuali (structured data, come date o luoghi) contenuti in altri progetti WikiMedia quali Wikipedia, Wikivoyage, Wikisource ed altri.

La centralizzazione dei dati comuni mirata a facilitare la loro manutenzione, in modo indipendente dalle specificit dei diversi progetti Wikimedia (per esempio le diverse lingue)

ed il loro ri-utilizzo in nuovi contesti, con un'impostazione Linked Open Data.

L'iniziativa stata avviata da un gruppo di ricercatori di Wikimedia Deutschland, con il supporto della Paul Allen Institute for Artificial Intelligence, dal Gordon and Betty Moore Foundation e da Google.

WikiBase il software libero con il quale il servizio viene gestitoIl funzionamento di WikiData dal punto di vista dell'utenzaGli articoli nelle differenti lingue di Wikipedia riguardanti Leonardo...

...puntano al medesimo Item WikiData, dove sono raccolti i dati puntuali

Il WikiBase data-modelL'Item di WikiData identificato da un Item Identifier: un numero preceduto da una QNell'esempio: Q762...e dal Fingerprint: cio Label, Alias e Description nelle diverse lingue

I puntatori alle diverse pagine dei progetti WikiMedia sono gestiti nella sezione Link dell'Item

Gli Item sono descritti mediante una serie di Statement

Gli Statement fanno uso di Property, come avviene di consueto nelle triplette del web-semanticoLe Property, come gli Item, sono identificate con Fingerprint e descritte con Statement

..ma gli Statement di WikiBase integrano la tripletta semantica con Qualifierdescritti anch'essi con Property e Target: qualificano l'informazionee Source (Reference)anche questi descritti con Property e Target: indicano la fonte dell'informazione

Tutte le revisioni dell'Item sono conservate nella cronologia, e rimangono sempre accessibili

Test di caricamento MARC in WikiBase: il caso UNIMARC proveniente da SBNReplica in WikiBase di tutto il dettaglio informativo del record bibliografico unimarcLa sperimentazione qui descritta mirava ad ottenere, come base per futuri ri-utilizzi dei dati, una replica in WikiBase di tutto il dettaglio informativo del record bibliografico UNIMARC (cos come esposto dall'Indice-2).

I campi MARC sono archiviati come Statement, gli indicatori ed i sotto-campi come Qualifier

Tutti gli elementi MARC (campi, indicatori e sottocampi) sono mappati con specifiche Property

Il Fingerprint di ciascun Item contiene il BID del recordIn questo modo i record/Item potranno essere individuati in base all'identificativo assegnato nel sistema di origine.

Ciascun campo (Statement) contiene la fonte (Source, Reference) da cui proviene il datoVengono registrati, con apposite Property:l'istituzione da cui proviene il record, con un puntatore ad un Item a s

il puntatore al record originale, con permanent URL alla fonte

Un apposito campo/Qualifier registra l'esatto ordine dei sottocampi di origineNella sperimentazione, i Target testuali degli Statement (campo) contenenti Qualifier (sottocampi) sono compilati semplicemente con l'elenco dei sottocampi (esclusi quelli contenenti codici) con un separatore. In prospettiva si potrebbe implementare l'inserimento della punteggiatura ISBD.I campi MARC contenenti voci di autorit sono gestiti con puntatori ad Item esterniNell'Item del record bibliografico, per gestire le intestazioni ai nomi si registrano il puntatore all'Item esterno (si noti che WikiBase espone automaticamente la Label dell'Item collegato)

e i dati specifici come il Relator-code dell'intestazione al nome

La voce della lista di autorit diventa un Item separatoL'identificativo della voce di autorit (in questo caso il VID) viene registrato nel Fingerprint dell'Item.I sottocampi descrittivi del nome sono registrati come Statement, sempre con apposite Property

WikiBase gestisce il reindirizzamento nel caso di sostituzioni (schiacciamenti) di Item

Viene conservata la cronologia di tutte le versioni degli Item (con il riferimento agli autori delle modifiche)

L'esposizione dei dati in RDF puro, utilizzando WikiBase si ottiene for-free

WikiBase pu gestire molteplici modelli descrittivi nel medesimo Item: ogni elemento qualificato

WikiBase pu gestire molteplici flussi di modifica: il protocollo si basa su API pubbliche e documentate

Perch una sperimentazione su larga scala potrebbe essere interessante. Questi i punti da considerare

le potenzialit di collaborazione del modello Wiki;

organizzazione dei dati pronta per RDF/Linked data;

organizzazione dei dati multistandard (fonte e qualificatori);

capacit nativa di trattare i dati in ambiente multilingua;

forte integrazione con il web;

disponibilit dei dati (in lettura e in scrittura) con protocolli aperti (SPARQL, API Wiki*, ecc);

disponibilit di software e di programmi di utilit aperti con una larga base di sviluppo/sperimentazione a livello mondiale;

Le prospettive del riuso dei dati bibliografici con Wikibase Giovanni Bergamin, Cristian Bacchi Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 /