SERVIZI DIGITAL LIBRARY - Benvenuto su Cineca | Cineca · collaborazione con il centro Digilab...

14
SERVIZI DIGITAL LIBRARY Il Digital Library Management System CINECA in collaborazione con Sapienza Università di Roma Rel. 1.0 White Paper Maggio 2013

Transcript of SERVIZI DIGITAL LIBRARY - Benvenuto su Cineca | Cineca · collaborazione con il centro Digilab...

SERVIZI DIGITAL LIBRARY Il Digital Library Management System CINECA in collaborazione con Sapienza Università di Roma Rel. 1.0

White Paper Maggio 2013

Il Digital Library Management System CINECA

97

UN ESEMPIO: UN PROGETTO DI MUSEO VIRTUALE

Il progetto MuVir

Introduzione Il tema della valorizzazione di patrimoni storici, artistici e culturali italiani attraverso l’utilizzo delle tecnologie che la rete, le moderne soluzioni nell’ambito della ICT e le tecniche più avanzate di digitalizzazione sono in grado di fornire, è sicuramente un tema caldo da diversi anni per i ministeri competenti, per la Pubblica Amministrazione sia centrale che locale e, più in generale, per gli enti ed associazioni culturali sia pubblici che privati. Tra le varie soluzioni adottate, quelle che sicuramente rivestono un maggior interesse sono i cosiddetti Musei Virtuali. Benchè in quest’ambito una definizione univoca non sia stata ancora coniata, si potrebbe citare quella riportata all’interno del progetto V-Must, progetto Europeo nato nell’ambito delle iniziative che fanno capo al VII Programma Quadro, coordinato dal CNR e del quale CINECA è uno dei partner principali, che si propone di fornire “the heritage sector with the tools and support to develop Virtual Museums that are educational, enjoyable, long-lasting and easy to maintain”. Secondo il progetto V-Must un museo virtuale è una “personalized, immersive, interactive experiences that enhance our understanding of the world around us. The term 'VM' is a general one that covers various types of digital creations including virtual reality and 3D. Although the concept of VMs is not new, they have recently become very popular and widespread: online, in museums and on heritage sites.”.

Proprio in linea con quanto espresso nel manifesto del progetto V-Must, il CINECA ha avviato, in collaborazione con il centro Digilab dell’Università La Sapienza di Roma, un progetto per la progettazione di un’infrastruttura dedicata all’allestimento di un museo virtuale del patrimonio pittorico, musivo e numismatico appartenente a fondazioni private italiane. Nodo centrale dell’infrastruttura che andrà a realizzare questo museo è il Digital Library Management System (DLMS) sviluppato dal CINECA in collaborazione con la Sapienza; in queste note si intendono descrivere gli ambiti del progetto e le sue linee progettuali, con particolare attenzione agli aspetti di integrazione tra il DLMS e l’ambiente di virtualizzazione utilizzato per implementare il museo vero e proprio.

Caratteristiche generali del progetto

Il progetto MuVir si baserà su un impianto tecnologico caratterizzato da una struttura su due livelli:

a) la Digital Library delle opere, che rappresenta l’ambiente di base e di visualizzazione standard del materiale digitale. Questo livello verrà realizzato partendo dalla piattaforma già disponibile di SDL (Sapienza Digital Library), con il vantaggio di portare direttamente il Museo Virtuale all’interno di Europeana (progetto gestito dall’Unione Europea), e di renderlo interoperabile con i portali del MIBAC (Ministero dei Beni e delle Attività Culturali);

b) il Museo virtuale, livello che dovrà garantire un accesso efficace e d’effetto alle riproduzioni digitali delle opere d’arte in possesso delle banche oltre a permettere a esperti del settore ed a semplici utenti una facile implementazione di: esposizioni tematiche; esposizioni di singole collezioni; esposizioni collegate ad eventi in luoghi reali.

Ricadute in positivo che il progetto dovrebbe garantire sono quello permettere ai singoli utenti finali – il “pubblico”, i prosumer – di creare proprie esposizioni, anche attraverso iniziative quali quella, ad esempio, di un concorso per architetti virtuali relativo alla progettazione del museo virtuale e del suo allestimento.

Il Digital Library Management System CINECA

98

Funzionalità del portale

Il MuVir del CINECA si baserà su un grande archivio digitale, disponibile per accogliere gradualmente un complesso di circa 300.000 copie digitali di opere d’arte, e su una musealizzazione virtuale con effetti di spettacolarizzazione, in grado di esporre le opere delle quali l’archivio abbia incamerato almeno una foto digitale ad alta risoluzione, ovvero un modello 3D acquisito tramite specifici scanner tridimensionali.

Questo progetto vedrà, per la creazione dell’archivio, un completo riuso della piattaforma di digital library sviluppata da DigiLab Sapienza e da Cineca, attraverso il suo riadattamento alle esigenze di funzionalità aggiuntive ed identità visiva richieste dal progetto. Si vuole evidenziare come l’intervento sull’architettura del progetto SDL avverrà solo per ciò che concerne lo strato di digital library, dal momento che le funzionalità ed i servizi esposti dallo strato di digital library management system rimarranno di fatto inalterati. Altro elemento che contraddistinguerà il progetto sarà legato all’utilizzo di software opensource, di good practice acclarate e su un approccio di integrazione di sistemi. In questo senso il MuVir si caratterizzerà per essere una realizzazione avanzata a livello internazionale.

L’accesso al portale ed ai suoi servizi sarà possibile anche attraverso device mobili (tablet e smartphone). La mobilitazione dei contributi attivi di diversi tipi di soggetti (curatori delle raccolte designati dalle banche, esperti accreditati come creatori o selezionatori di contenuti, prosumer – soprattutto studenti – che offrono contenuti informativi, tagging e servizi) permetterà al MuVIr di funzionare come una struttura vivente, in continua implementazione e in sinergia con i centri specializzati del mondo dell’università e della cultura.

Partire da una architettura

Sul piano visivo, fin dalla home page il portale del MuVir si presenterà basato su una “architettura” di museo virtuale. La vitalità del sito potrà essere esaltata da eventuali concorsi nazionali lanciati per la progettazione degli allestimenti di “sale” e di mostre virtuali di particolare impatto.

Possibile struttura della home page del portale

Per offrire un’idea generale di come il pubblico dovrebbe accedere al MuVir si può immaginare la seguente architettura logica delle sue pagine.

In Home Page

Testata: Il MuVir / Gli eventi / Le collezioni delle banche

Il Digital Library Management System CINECA

99

Base: Il catalogo / Nuove acquisizioni / Le opere del mese / Il concorso / Login (curatori, esperti, prosumer, utenti) / Blog: progetta il MuVir

Al centro: Pianta o modello 3D del museo, con porta di entrata, da cui si accede al piano superiore o al piano inferiore

L’accesso alle sezioni espositive ed all’archivio

Il piano superiore: le collezioni

Da un ingresso virtuale si accede a “sale” che vengono generate dal sistema. Una sala può essere generata per contestualizzazione automatica a partire da una singola opera (se il numero delle opere contestuali eccede il limite della sala vengono generate altre sale); oppure può essere generata per contestualizzazione personale gestita dal visitatore.

Le scelte del visitatore (scelta dell’opera di partenza, del tipo di contestualizzazione automatica, o della procedura di contestualizzazione personale) sono gestite attraverso un tool accessibile nell’ingresso, che “filtra” le opere da selezionare catturandole dall’archivio digitale del MuVir.

La contestualizzazione può avvenire per autore, per “temi” , per “stili e correnti”, per luoghi, per tipologia (quadri in primis, ma in seguito sculture, monete, anfore, ecc.), e per collezione. Singoli visitatori, o comunità virtuali, possono allestire sale che ritengono compiute come percorso espositivo e chiederne l’”adozione”, vincolata al consenso di curatori esperti riconosciuti dal sistema. Le sale adottate rimangono permanentemente visibili.

L’archivio del MuVir

Vi si accede dall’ingresso, aprendo il tool di gestione, ed è naturalmente sempre richiamabile, come le altre voci fisse in home page. L’archivio costituisce la base per la generazione del museo.

Le opere sono catalogate e descritte da metadati in più lingue che rappresentano la collezione dei cui fanno parte e che descrivono il singolo oggetto reale e la sua copia digitale.

Un elemento importante per la corretta impostazione del progetto sarà l’attività preliminare di costituzione del Deposito digitale del MuVir, ottenuto dalla puntuale ricognizione della tipologia di risorse documentarie (libri, quadri, sculture, reperti archeologici, ecc.) possedute dalle banche consociate in ABI.

Il Digital Library Management System CINECA

100

Tale attività è finalizzata all’individuazione dei set di metadati (tra gli standard internazionali e nazionali esistenti) più idonei a descrivere le collezioni e le singole risorse documentarie. I metadati sono infatti il mastice che tiene insieme le informazioni sugli oggetti digitali, garantendone la qualità e l’accesso, e, al contempo, rappresentano la struttura logica che consente flussi di informazioni e nuove relazioni tra le risorse digitali, favorendo l’identificazione univoca, l’individuazione e la localizzazione di una risorsa, l’aggregazione e l’organizzazione di risorse con caratteristiche comuni.

La scelta dei set di metadati è dunque finalizzata alla fruizione, “amichevole” e disintermediata, da parte degli utenti, a garantire la conservazione a lungo termine delle rappresentazioni digitali delle risorse documentarie e a consentire al MuVir di aggregare dinamicamente la contestualizzazione di opere e collezioni.

Pur nel rispetto dei principi enunciati, per ogni collezione e oggetto si applicherà una metadatazione leggera dal punto di vista descrittivo e conservativo (com’è quella attualmente operativa nel progetto Sapienza Digital Library), arricchita tuttavia da metadati semantici (soggetti, temi, generi, stili, ecc.), generati utilizzando schemi di classificazione e vocabolari controllati (authority file, ontologie, thesauri), a seconda del dominio disciplinare di appartenenza dei singoli oggetti e delle aggregazioni per collezioni.

L’architettura del sistema prevede inoltre la possibilità di applicare le tecnologie di social tagging alla descrizione semantica degli oggetti, consentendo agli utenti accreditati di assegnare loro descrittori e, pertanto, di aumentare il potenziale di aggregazione reticolare e associativa tra concetti, temi e oggetti. Ai metadati relativi a un singolo oggetto vanno collegate le immagini (in HD, o a bassa definizione, o in 3D, o in video).

Gradualmente, attraverso i servizi “attività in collaborazione”, le opere vengono corredate di una scheda, che comparirà nella sala, e che a sua volta conterrà link.

Il piano inferiore: le mostre

Le mostre al piano inferiore possono essere realizzate con allestimenti speciali, e da curatori autorizzati dal sistema. Possono anche funzionare come promozione di esposizioni reali organizzate dalle banche nelle loro sedi.

I servizi

Comprendono le attività in collaborazione, il bookshop, i servizi stampa e altri servizi. Attività istituzionali in collaborazione:

a) Per curatori autorizzati: autorizzazione di singole sale allestite dai visitatori, autorizzazione di promovideo relativi a eventi, a collezioni, a operazioni di divulgazione.

b) Per esperti autorizzati: classificazione di singole opere, scrittura delle schede, autorizzazione del carico dell’immagine, autorizzazione del carico dei file audio, audio video, in lingua dei segni o testuali di arricchimento dell’apparato divulgativo sulle singole opere.

c) Per architetti digitali: progettazione di allestimenti

Bookshop

a) Picture gallery; b) Oggetti e libri prodotti dalle banche

Servizi stampa

a) cartella stampa in corso; b) archivio delle cartelle stampa; c) newsletter

Il Digital Library Management System CINECA

101

Altri servizi

a) Crowdsourcing per foto digitali, tagging e altre attività; Contatti

L’impianto tecnologico

La soluzione MuVir si baserà sull’infrastruttura di Digital Library Management System sviluppata da Digilab e CINECA, per la quale si è partiti dalla definizione, progettazione e realizzazione di una architettura service-oriented organizzata su tre livelli completamente separati, così come rappresentato in figura.

Architettura dell’infrastruttura Digital Library

Analizzando l’architettura individuata, il Livello di Integrazione, rappresentato in figura e denominato Digital Library Service Delivery Platform (SDP), costituisce il cuore della soluzione: realizza un modello astratto e semantico delle entità e delle loro relazioni nella Digital Library e al tempo stesso permette sia la comunicazione interna tra tutte le componenti e i servizi integrati al livello inferiore, che l’accesso da parte del layer applicativo a tutte le funzionalità – in primis il repository - esposte verso utenti o applicazioni esterne (ad esempio aggregatori OAI-PMH). Tale strumento potrà essere di sicuro ausilio per la disseminazione dei contenuti del portale verso aggregatori generalisti, quali quello rappresentato da Europeana. L’uso di quest’architettura modulare rende semplice l’integrazione di applicazioni eterogenee, capaci di sfruttare i servizi web resi disponibili da una interfaccia Digital Library (API RESTful) omogenea e stabile, unico punto di accesso verso tutti i servizi, che integra, semplifica e rende trasparente l’utilizzo del repository e dei sistemi e servizi ad esso connessi. E’ proprio questo livello di integrazione che verrà sfruttato per permettere il colloquio tra l’area di repository degli oggetti digitali e lo strato di visualizzazione 3D (la cosiddetta Personal Virtual Gallery) ideato per l’allestimento del museo virtuale.

Il Digital Library Management System CINECA

102

Macro-funzioni Digital Library

L’ambiente di Personal Virtual Gallery verrà sviluppato in stretta sinergia con l’impianto di DL grazie a specifiche API esposte da quest’ultima per l’harvesting dei metadati delle opere e delle loro copie digitali. La struttura generale della soluzione che verrà implementata per questo progetto è riassunta nel seguente schema a blocchi, che evidenzia il livello di interazione tra le sezioni dedicate all’ingestion ed all’archiviazione (repository) degli oggetti digitali e quella di interfaccia verso l’utente (realizzata attraverso la personal virtual gallery, PVG).

Schema a blocchi logico-funzionali della soluzione proposta

Di seguito si passerà ad una descrizione di maggior dettaglio per questi tre elementi.

Ingestion Il processo di Ingestion è il meccanismo attraverso il quale le collezioni di opere digitalizzate ed i loro metadati verranno caricati in piattaforma. Nel progetto SDL di è deciso di aderire ad un modello internazionale basato sulla struttura proposta dall’Open Archive Information Systems. La figura sottostante descrive le componenti e le interazioni coinvolte durante il processo di Ingestion.

Il Digital Library Management System CINECA

103

Processo di Ingestion

La fase di ingestion è strettamente legata all’organizzazione (verrà quindi adattato alle esigenze del progetto MuVir), alla definizione di specifiche e standard per la descrizione e la trasmissione dei contenuti e delle loro descrizioni, al deposito e più in generale alla gestione del ciclo di vita dell’oggetto digitale. Una fase importante sarà quindi quella dell’analisi dei materiali esistenti e dei criteri decisi per la loro metadatazione, individuando dei campioni rappresentativi delle diverse tipologie, a cui poter applicare degli specifici content model. La preparazione dei campioni con la costruzione dei file di metadatazione, la rinomina dei file e il riordino degli oggetti digitali verrà realizzata facendo diverse prove di ingestion fino al raggiungimento della forma più opportuna che permetta al sistema di effettuare il caricamento del campione e di attivarvi i servizi previsti per la sua disseminazione verso l’ambiente di Personal Virtual Gallery (PVG). Per ogni campione verranno pertanto stati stabiliti dei vincoli sulla struttura informativa, che permetteranno l’attivazione dei servizi adeguati alle caratteristiche peculiari dei campioni, come ad esempio la fruizione del contenuto attraverso specifico visualizzatore utilizzato nell’ambiente PVG. La metodologia adottata in SDL prevede l’individuazione di un prototipo di workflow per la lavorazione di una collezione completa e per le singole risorse. In parallelo viene sviluppato un software specifico per la creazione di una procedura automatica che crea, raccoglie, integra e codifica i metadati secondo il modello di contenuto informativo, in conformità all’infrastruttura definita e in coerenza con i vincoli stabiliti dalla procedura di ingestion. Il workflow si conclude con l’impacchettamento automatico di ogni singola risorsa che viene così trasferita nel deposito digitale e con la creazione dei metadati di livello collezione, ovvero con le informazioni di indirizzamento e di sintesi descrittiva delle risorse, appartenenti alla collezione specifica. Questo lavoro si traduce quindi in un servizio, non solamente di tipo informatico, ma di gestione di processo, che è possibile fornire, sia come fase di progetto che come progetto a sé stante, da integrare nell’ipotesi di future estensioni del Servizio Digital Library a nuovi contesti ai quali il progetto MuVir dovrà far fronte (ad esempio nel caso in cui si decida di inserire oggetti digitali provenienti da scansioni 3D). Per quanto riguarda la funzionalità di ingestion, quanto già sviluppato nell’ambiente della DLMS permetterà di conferire le risorse digitali (già codificate e strutturate) nel Repository del portale MuVir; queste stesse risorse, in base alla complessità del progetto, potranno essere eventualmente oggetto

Il Digital Library Management System CINECA

104

di una serie di attività che possono essere raggruppate in una fase di pre-ingestion, secondo gli standard di metadati e i vincoli definiti in fase di analisi. L’ingestion all’interno della repository del MuVir verrà inoltre dotata di un backend e di una interfaccia che permetteranno il monitoraggio puntuale di tutti gli step di lavorazione previsti per l’ingestion di una risorsa digitale o di una collezione di risorse. La fase di ingestion, sempre sfruttando la Service Delivery Platform, verrà integrata con il motore di transcodifica per permettere il calcolo dei derivati digitali in base alla tipologie di oggetto conferite. Durante questa fase, in conformità con le migliori pratiche derivanti dalla conservazione a lungo termine e dal modello OAIS, verranno seguiti i seguenti step:

• validazione del pacchetto SIP di ingestion (container, file METS e risorse referenziate, specifiche interne)

• controlli sul naming del pacchetto e delle risorse

• controlli di integrità sui file

• file characterization

• controlli antivirus sui contenuti

• controllo dell’intero processo di ingestion con possibilità di rollback

Il processo sarà inoltre esteso per permettere di utilizzare l’ingestion di pacchetti SIP contenenti i soli metadati descrittivi delle risorse in modo da sfruttare il meccanismo per aggiornare i metadati di risorse già presenti nel repository senza doverne ricaricare i contenuti digitali associati. Con l’ingestion di un SIP potranno infine essere stabilite, oltre che le relazioni con le collezioni di afferenza, le autorizzazioni di accesso preventivamente stabilite sulle risorse esposte.

Repository Per quanto riguarda l’archiviazione e la conservazione dei contenuti digitali, il sistema si baserà sull’utilizzo di un Digital Repository realizzato attraverso il middleware open source Fedora Commons. La scelta di questo sistema di gestione è indubbiamente strategica e vincolante ai fini della gestione a lungo termine dei materiali. Fedora Commons fornisce un ambiente articolato ed orientato alle integrazioni con web services e tecnologie del web semantico e alla conservazione a lungo termine. Inoltre, permette l’applicazione di diversi content model che sono più rispondenti alle esigenze di gestione delle peculiarità dei materiali, che il sistema dovrà gestire. Il repository fornirà anche i servizi di base (ad esempio versioning, audit trailing, fixing) per supportare le fasi di monitoraggio, controllo, migrazione e conservazione sul lungo termine che saranno affrontate nelle prossime evoluzioni del servizio. Le risorse che devono essere conservate a lungo termine al fine di poter garantire la loro autenticità, integrità e possibilità di accesso nel lungo periodo devono essere conferite al sistema opportunamente costruito per garantire la conformità agli standard previsti in questo ambito. Per quanto riguarda la Digital Preservation il modello di riferimento adottato è l’OAIS Reference Model9 (ISO:14721:2003) e in conformità verrà adottato lo schema di metadati di conservazione PREMIS. Il sistema di repository attualmente in uso nel progetto SDL è stato ingegnerizzato per acquisire qualsiasi tipo di schema di metadati, ovvero anche schemi XML non previsti dalla struttura core di

9 Open Archival Information System, http://www.iso.org/iso/catalogue_detail.htm?csnumber=24683

Il Digital Library Management System CINECA

105

metadati e considerati dal sistema di deposito come estensioni a suddetta struttura. Il deposito è inoltre integrabile con i più diffusi sistemi di persistent identifier. Il Progetto intende quindi ingegnerizzare le soluzioni prototipali già implementate sul repository in termini di servizi integrati e modelli. La modellazione dei contenuti nel repository si baserà su un approccio completamente “atomistico” e sull’utilizzo di relazioni RDF. Questo approccio, esemplificato dalla figura sottostante, oltre che garantire flessibilità ed estendibilità dei modelli realizzati, permette di definire servizi di dissemination specifici e riutilizzabili e di applicare regole di accesso granulari. I metadati descrittivi, amministrativi e strutturali delle risorse verranno codificati in conformità agli standard più diffusi a livello internazionale e arricchiti dai riferimenti a vocabolari controllati e a specifici thesauri laddove possibile o necessario.

Esempio di modellazione atomistica

Standard di metadati tecnici specifici per le tipologie di materiale, come anche quelli previsti per la gestione dei diritti e la conservazione a lungo termine, verranno resi disponibili per il progetto MuVir, fermo restando il principio per cui la struttura di contenimento permette in qualsiasi momento di integrare altri standard più adatti alle esigenze future.

Il Digital Library Management System CINECA

106

Infrastruttura di Metadati

Il Progetto MuVir inoltre prevede l’integrazione di una applicazione Image Server per l’elaborazione ed il caching delle immagini presenti nel repository. Questa applicazione sarà basata su software open source e permetterà di fornire i derivati delle immagini al Portale evitando di dover effettuare una interazione diretta con il repository per l’erogazione delle immagini agli utenti finali. Per garantire l’affidabilità del servizio per il repository si andrà a progettare e realizzare un modello leader – follower in cui un nodo del repository agirà da master e un nodo verà mantenuto sincronizzato. Il secondo nodo verrà utilizzato per effettuare l’erogazione del servizio mentre il primo sarà dedicato alle operazioni di ingestion. In questo modo otre a garantire replicazione intrinseca dei dati e affidabilità si potranno attuare politiche di load-balancing sui due nodi durante la fase di dissemination.

La Personal Virtual Gallery La Personal Virtual Gallery (PVG) rappresenta la modalità di navigazione virtuale delle risorse costituite dalle collezioni nell’ambito del progetto MUVIR. E’ parallela e autonoma rispetto all’esplorazione delle opere attraverso una più classica attività di browsing delle stesse da parte dell’utente (che utilizza strumenti di selezione e di ricerca per filtrare dinamicamente le opere mediante un’interfaccia web semplice e flessibile). La PVG permetterà all’utente di gestire visualmente un elevato numero di items digitalizzati - costituiti dalle opere provenienti dalle collezioni – per collocarli automaticamente in uno spazio virtuale generato in real-time. Ad ogni opera è associato un contenuto informativo che deriva dai metadati di riferimento. Una volta che l’ambiente simulato viene generato l’utente è in grado di esplorarlo in real-time e in “soggettiva” (first-person), cioè attraverso una modalità che simula il punto di vista del visitatore per consentirgli un’esperienza il più possibile coinvolgente e spettacolare. In generale lo sviluppo di un’applicazione avanzata di grafica virtuale costituita da una piattaforma museale 3d ha l’obiettivo non solo di spettacolarizzare la semplice fruizione delle collezioni ma anche di rappresentare un valido strumento utile a diversi profili di utenti nelle varie fasi del processo di valorizzazione del bene culturale. L’utilizzo di tale tecnologia può indubbiamente semplificare, dal punto di vista della gestione e del project management di una mostra o di una collezione museale, operazioni e attività specifiche al fine di favorire anche un risparmio sia in termini di tempo che di risorse impiegate. In particolare i profili coinvolti riguardano, oltre all’utente assimilabile al visitatore

Il Digital Library Management System CINECA

107

classico di una mostra, le figure del curatore, dell’esperto d’arte, dello storico e più in generale dello studioso, coinvolti fin dall’inizio di un allestimento museale in operazioni di design espositivo e di progettazione dei possibili percorsi tematici e concettuali per una visita. In un’ottica collaborativa la piattaforma virtuale che il progetto MUVIR intende sviluppare rappresenterebbe inoltre la possibilità per i detentori delle collezioni di rappresentare contemporaneamente non solo una singola proposta di allestimento ma anche la molteplicità delle sue varianti dando all’utente–visitatore la possibilità di fruire secondo una modalità fortemente immersiva il percorso museale simulato, anche attraverso le componenti “immateriali” dei beni culturali esposti (documenti e materiali di diversa natura e formato – come testi e documenti audio e video - correlati alle opere esposte). Si tratta sostanzialmente di una nuova strategia espositiva interessante anche nell’ottica di attrarre nuovi utenti al fine di rafforzare il target tradizionale in ambito museale. La PVG sarà progettata per essere il più possibile espansibile e modulare, in un’ottica che risponde a esigenze pratiche relative alla possibilità nel futuro di inserire nuove risorse e funzionalità. La tecnologia individuata per sviluppare un workflow produttivo utile alla costruzione di un modello di navigazione virtuale assimilabile alla PVG progettata è il tool di Unity3d, un ambiente di sviluppo che consente la costruzione di applicazioni virtuali potenti, versatili e usabili, garantendo inoltre prestazioni elevate in termini di resa grafica. La logica applicativa della PVG che implementa le funzionalità e le interazioni utente sarà sviluppata in Javascript; verranno utilizzate librerie di tipo .NET per le funzionalità inerenti alla parte di networking. La PVG infine verrà implementata per un utilizzo multipiattaforma per essere fruito sia su dispositivi mobili sia da postazioni desktop: in entrambi i casi (app mobile e desktop application) si tratta di applicazioni standalone che si installano sui device nativamente.

Portale MuVir Il portale MuVir verrà realizzato sfruttando un insieme di moduli Drupal che si andranno a sviluppare durante il Progetto. Questi moduli saranno progettati come componenti configurabili - integrati con il modulo principale già sviluppato nel contesto del progetto SDL - che permetteranno la costruzione modulare di interfacce DL del portale. Il Progetto prevede moduli per la visualizzazione di collezioni, la visualizzazione di aggregazioni, il browsing ed il search, la visualizzazione di singole risorse digitali (primo piano), il faceting, l’integrazione con servizi esterni.

Search & Browsing Le funzionalità di ricerca e browsing avanzato permetteranno di navigare e ricercare gli oggetti della Digital Library sulla base delle informazioni contenute nei metadati descrittivi. Il Progetto prevede di indicizzare i metadati MODS, le relazioni tra gli oggetti presenti nel repository e i contenuti testuali originali e derivati da trascrizioni automatiche o da analisi semantiche. La funzionalità faceting permetterà il browsing “a faccette” delle risorse digitali presenti nella Digital Library. La classificazione a faccette permette di catalogare un singolo asset digitale sotto più categorie (le faccette), ciascuna descrittiva di una aspetto (o faccia) particolare dell’asset. Il servizio permetterà il browsing di strutture organizzative, collezioni e tipologie di contenuti e la modellazione e descrizione delle strutture organizzative e delle collezioni di oggetti digitali. Entrambe le tipologie di entità possono essere organizzate in modo gerarchico o combinate tramite l’uso di relazioni espresse in RDF. Queste stesse relazioni saranno utilizzate per modellare aggregazioni ad-hoc e personalizzate di entità. Il Progetto prevede di sfruttare le funzionalità del motore di ricerca per permettere, dati i metadati descrittivi di una risorsa digitale, di individuare le risorse “vicine” rispetto a un subset definito di metadati (funzionalità MLT).

Il Digital Library Management System CINECA

108

Faceting e full-text search Sfruttando il motore di indicizzazione Lucine/SOLR integrato nella per il browsing avanzato, la funzionalità full-text search permetterà la ricerca full text all’interno dei testi, eventualmente associati alle opere esposte (commenti critici; analisi storico artistiche, etc.). La ricerca full-text potrà essere applicata a contenuti testuali o alla trascrizione in testo di immagini derivanti da processi di digitalizzazione (ad esempio libri moderni) quando disponibile. Le due attività principali saranno quella di integrare il motore di ricerca SOLR sia in fase di indexing che di dissemintation. Dovranno infatti essere identificati i metadati oggetto di indicizzazione, definendo per ognuno la modalità di indicizzazione (ad esempio tokening, stemming) e il peso che il motore di ricerca dovrà assegnare rispetto all’algoritmo utilizzato per il calcolo della rilevanza. Infine dovranno essere individuati i metadati che saranno utilizzati per il faceting.

Visualizzatori Il Progetto prevede l’aggiornamento dei viewer già in uso per recepire e sfruttare le nuove funzionalità realizzate durante le fasi precedenti del progetto (ad esempio full-text indexing) e l’integrazione di nuovi visualizzatori di seguito descritti.

Immagini ad alta risoluzione IIPImage è un player avanzato ad alte prestazioni per la visualizzazione web-based in streaming e lo zoom di immagini ad alta risoluzione. È stato progettato per essere veloce ed efficiente anche in condizioni di banda limitata e di basse prestazioni del client (sia in termini di meoria che di capacità di calcolo). Il sistema può gestire immagini di dimensioni nell’ordine di gigapixel così come immagini con caratteristiche avanzate come profondità a 8 e 16 bit, le immagini CIELAB colorimetriche e immagini scientifiche multispettrali. Lo streaming è tile-based, che consente di visualizzare, esplorare e ingrandire in tempo reale porzioni di immagine mantenendo il sistema scalabile indipendentemente dalla dimensione dell'immagine di origine. Le immagini sorgente possono essere in formato TIFF o formato JPEG2000. Nel Progetto si prevede di utilizzare quest’ultimo formato, anche se potenziali estensioni verso altri formati, quali il FITS, potranno essere valutate ed eventualmente implementate. Questo viewer verrà utilizzato in alternativa all’ambiente PVG o qualora si necessiti di un dettaglio maggiore.

Gestione degli utenti e delle autorizzazioni La gestione degli accessi al Portale MuVir si baserà su considerazioni e sull’analisi dello stato dell’arte dei sistemi di gestione delle identità e di autenticazione attualmente utilizzati in rete. La definizione delle classi di utenza verrà fatta a seguito di un analisi preliminare degli obiettivi che il portale intende raggiungere. Il sistema di gestione delle autorizzazioni si baserà su un approccio misto basato su ruoli e capabilities. Dato un ruolo, a livello di collezione si avrà la possibilità di definire se un utente ha la possibilità di accedere o meno (e quindi di ricercare) a una risorsa. Queste autorizzazioni saranno memorizzate all’interno del repository Fedora Commons, espresse secondo lo standard XACML. Un utente che può accedere ad una risorsa potrà infine accedere alle rappresentazioni digitali in base alle capabilities definite sui suoi ruoli e sulla particolare tipologia di risorsa digitale. Queste capabilities saranno memorizzate nel backend del Livello di Integrazione, il quale si occuperà anche della loro risoluzione a run-time. Per permettere l’integrazione con il Portale SDL vi sarà una associazione biunivoca tra i ruoli del portale e i ruoli utilizzati nelle regole XACML. Il repository, attraverso una integrazione con il backend del portale Drupal, avrà quindi la possibilità di determinare il ruolo di ogni utente.

Il Digital Library Management System CINECA

109

Conclusioni Il progetto MuVir rappresenta un evidente esempio delle caratteristiche di flessibilità e versatilità offerte dall’architettura del DLMS progettato da Digilab-Sapienza e da CINECA. In particolare l’aver optato in questo progetto per un’architettura aperta e modulare, basata sull’utilizzo di standard di comunicazione inter-processo e sull’esposizione dei servizi applicativi dall’ambiente di repository a quello di visualizzazione (la Personal Virtual Gallery in questo caso), avrà un sicuro impatto sulle tempistiche e sulle economie del progetto MuVir, che di fatto potrà fornire un utile strumento di raffronto delle evolutive che il DLMS potrà garantire in futuro in altri e più svariati contesti.