La digitalizzazione tra sfide e opportunità. DigitUniTO ... · progetti di digitalizzazione delle...

Post on 18-Feb-2019

223 views 0 download

Transcript of La digitalizzazione tra sfide e opportunità. DigitUniTO ... · progetti di digitalizzazione delle...

La digitalizzazione tra sfide e opportunità. DigitUniTO: interoperabilità, metadati, aspetti legali

Cristina Ferrus, Giulia Scarcia

GdP “Digitalizzazione”, SBA Università di Torino

Paola Laguzzi Direzione Studenti e Servizi Web, Università di Torino

Strategie di digitalizzazione all’Università di Torino

2010: si costituisce un Gruppo di Progetto sulla digitalizzazione, conservazione e progetti europei in seno alla Divisione SBA

Obiettivi: Definire politiche organiche, linee guida, linee di indirizzo per i

progetti di digitalizzazione delle biblioteche di Ateneo

Formare un set di competenze

Aggregare progetti significativi realizzati in Ateneo e risorse digitalizzate di varie tipologie in un’unica piattaforma di accesso

Individuare soluzioni per la conservazione a lungo termine delle risorse digitalizzate

Aspetto cruciale della digitalizzazione e della fruizione delle collezioni digitali

2011 (set.): Università di Torino e Città di Torino firmano una Convenzione nell’ambito del progetto Museo Torino

Fase di selezione delle risorse dal vasto e ricco patrimonio bibliografico dell’Ateneo > frammentazione Sviluppo di strategie di cooperazione: Grazie all’accordo con MT vengono digitalizzate circa 50 opere relative

alla città di Torino appartenenti alle biblioteche e parte dell’Annuario Conservazione e accesso in collaborazione con la Divisione Sistemi

Informativi UniTO

Come nasce DigitUniTO

http://www.omeka.org/

Omeka is a free, flexible, and open source web-

publishing platform for the display of library, museum,

archives, and scholarly collections and exhibitions.

La scelta open source

Open source (in inglese “codice sorgente aperto”) indica un software i cui autori (più precisamente i detentori dei diritti) ne permettono e favoriscono il libero studio e l'apporto di modifiche da parte di altri programmatori indipendenti. Questo è realizzato mediante l'applicazione di apposite licenze d'uso. (da Wikipedia)

3 parole chiave di Omeka (2008)

Open: supporto immediato team di sviluppo molto attivo forum

interoperabilità

Free: tutti possono contribuire (anche UniTo l’ha fatto con un plug-in), tutti possono utilizzarlo e migliorarlo (Licenza Pubblica Generica GNU è intesa a garantire la libertà di condividere e modificare tutte le versioni di un programma per assicurarsi che rimanga software libero per tutti i suoi utenti. Dal sito Omeka)

Flexible: flessibile e personalizzabile

Temi (aspetto fisico della piattaforma) – Plug-in

6

Plug-in

Installati

Collection Tree CSV Import Dropbox Hide Elements Oai‐PMH Repository Simple Contact Form Purl Simple Pages

Disponibili

Commenting User Profiles Reports and Barcodes Embed Codes Zotero Import Social Bookmarking BeamMeUp to SoundCloud …

Lato amministratore

• Sono istituzionalmente orientate

• Sono estensibili

• Sono ad accesso aperto

• Possono raccogliere oggetti digitali di natura diversa:

Monografie, seriali

Materiale di archivio

Immagini digitali di mostre, esposizioni permanenti, ecc.

Video

Le collezioni in DigitUniTo:

Il lavoro di postproduzione

Il Gruppo di Progetto si è occupato di: Personalizzazione Omeka OCR (controllato o no)

Creazione Indici (ove necessario) Metadatazione (DC)

Caricamento in rete tramite piattaforma DigitUnito

Licenze e diritti

Il Dublin Core e le ragioni di un successo

• SEMPLICE = concepito per una descrizione semplice e veloce. Permette anche a non specialisti di creare record descrittivi.

• FLESSIBILE = si adatta agevolmente a tutte le tipologie di materiale. Inoltre permette di integrare e sviluppare la struttura dei dati con significati diversi ed appropriati al contesto di applicazione

• ESTENSIBILE = consente di estendere l’insieme degli elementi per le esigenze di ricerca

• SEMANTICA CONDIVISA = è composto da un insieme di elementi comuni la cui semantica è facilmente comprensibile da diverse comunità professionali e di ricerca. La convergenza su un insieme di elementi comuni accresce la visibilità e l’accessibilità delle risorse

• E’ orientato INTERNAZIONALMENTE. Nato in inglese, ma tradotto in moltissime lingue; dal febbraio 2009 è standard ISO 15836: 2009

• Omeka supporta il DC Simple

Traduzione ad hoc dei campi DC Simple

Creato un “profilo di applicazione” per l’utilizzazione del DC Simple per il materiale bibliografico Utilizzata mappatura UNIMARC/ DC realizzata dall’ICCU

E’ allo studio un “profilo di applicazione” per l’utilizzazione del DC Simple per il materiale di archivio (tipo documento)

Mappatura Library of Congress DC /EAD

• Necessità di modificare il Plug-in OAI-PMH per esportare un set di metadati più ricco del solo DC Simple

• Omeka consente l’esportazione

automatica in XML dei 15 elementi DC

I metadati

Il DC Simple in DigitUnito: alcune scelte

• Collegamento al record del catalogo UniTO: campo DC Relation

• Soggetti nel campo DC Subject desunti dal Soggettario di Firenze

• Note e descrizione fisica: campo DC Description

• Biblioteche che possiedono l’opera: campo DC Source

Le scelte sono state pensate in funzione dell’integrazione con il discovery tool

Le schede descrittive in DigitUniTo

15

Licenze e diritti L’incertezza è il peggior nemico della riutilizzazione

Quali licenze utilizzare per il materiale digitalizzato? Quali diritti garantire? Opere in pubblico dominio (Public Domain calculation (Europa); Copyright term calculator (US)

Opere ancora protette da copyright Opere orfane (Direttiva 2012/28/UE del 25 ottobre 2012) Materiale d’archivio

Direttiva 2013/37/UE > riutilizzo dell’informazione del settore

pubblico esteso anche alle biblioteche universitarie Libro bianco per il riutilizzo dell’informazione del settore pubblico

(progetto EVPSI (Extracting Value from Public Sector Information, http://www.evpsi.org), finanziato dalla Regione Piemonte e attivo tra il 2009 e il 2012)

Accesso – riutilizzo

Le licenze non sono obbligatorie, ma servono a chiarire agli utenti quale utilizzo dei materiali possono fare

Creative commons (italia: http://www.creativecommons.it/)

L’adozione di licenze è opportuna e fortemente consigliata per un servizio istituzionale come DigitUnito

Tutte le licenze Creative Commons condividono molte importanti caratteristiche. Ogni licenza: e' valida in tutto il mondo; dura per la durata del diritto d'autore connesso all'opera; non e' revocabile. Per DigitUnito, tra le 6 licenze abbiamo scelto come base > CC-BY 3.0 che richiede un'attribuzione. Ma: Collezioni diverse possono richiedere licenze diverse

Creative commons: libro moderno a stampa e documenti d’archivio

OCR = Optical Character Recognition “I sistemi di OCR sono programmi dedicati alla conversione di un'immagine contenente testo, solitamente acquisite tramite scanner, in testo digitale modificabile” (da wikipedia) L’OCR è la possibilità di estrarre del TESTO (editabile e ricercabile) da un’IMMAGINE. I documenti digitalizzati sottoposti ad OCR diventano leggibili con un lettore automatico di sintesi vocale (dislessia). Le percentuali di accuratezza dell’OCR vanno dal 72% al 98% (risultati di uno studio effettuato su periodici del XIX e XX secolo)

L’uso dell’ OCR

controllo accurato di: Annuario dell’Università (sono stati verificati e, dove necessario, corretti tutti i nomi di persone presenti in tutte le annate dell’Annuario);

tutti i testi con rilevante importanza dei nomi propri (nomi di persone e di luoghi negli almanacchi o in altri repertori storici, nomi di piante e minerali nei testi storico-geografici, ecc.)

OCR in DigitUnito

Il Plug-in del PURL per DigitUniTo

E’ possibile aggiungere funzionalità ad Omeka installando plug-in ad hoc

È possibile scaricare e installare plug-in sviluppati dalla Community Omeka

E’ possibile creare plug-in secondo proprie e specifiche esigenze

Omeka quindi è del tutto personalizzabile e interoperabile

Estensione funzionale di Omeka

Plug-in

Installati

Collection Tree CSV Import Dropbox Oai‐PMH Repository Simple Contact Form

Purl

“A persistent uniform resource locator (PURL) is a uniform resource locator (URL) that is used to redirect to the location of the requested web resource” (wikipedia) I PURL introducono un livello di indirezione: la risorsa viene puntata mediante un identificativo persistente. Il PURL è un indirizzo web (URL) che punta ad un altro indirizzo web (URL)

Cosa è il PURL

Se una risorsa cambia percorso Web (e quindi URL), un PURL che punta ad esso può essere aggiornato (ma URL per l’utente non cambia…)

Occorrono componenti software per costituire e mantenere l’insieme dei PURL assegnati alle risorse e fare in modo che i PURL siano risolti quando richiesti. I PURL non vivono in Omeka ma all’interno di un server detto PURLZ. Il server PURLZ attualmente utilizzato è OCLC (purl.org). Nel server PURLZ di OCLC è stato creato un dominio /unito/digitunito

Perché utilizzare il PURL

Il PURL plugin per Omeka aggiunge ad Omeka la capacità di creare e gestire, per ciascuno degli item pubblici memorizzati in Omeka, un PURL. I PURL non vivono in Omeka ma all’interno di un server detto PURLZ. Il server PURLZ attualmente utilizzato è OCLC (purl.org). Nel server PURLZ di OCLC è stato creato un dominio /unito/digitunito Il PURL plugin per Omeka è un progetto Open Source https://github.com/aemilius77/omeka-purl-plugin

PURL – Plugin per Omeka

Ringraziamenti

• Ai componenti del Gruppo di Progetto Maria Cassella (coordinatore) Oriana Bozzarelli Mosè Conte Cristina Ferrus Alessandro Leccese Amelia Margiotta Donatella Mutti Paola Novaria Claudio Ruggeri Giulia Scarcia Lorella Spertino

• Museo Torino • Biblioteca civica centrale: Davide Monge, Valeria Calabrese • Direzione Studenti e Servizi Web: Angelo Saccà, Paola Laguzzi, Emilio

Remogna • Accademia di Medicina dell’Università di Torino