Presentazione Laurea Picariello Vincenzo Matr. 450334

14
Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche Relatore: Chiar.mo Prof. Semeraro Giovanni Corelatore: Chiar.mo Dott. Iaquinta Leo Laureando: Picariello Vincenzo matr. 450334 1

description

Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche

Transcript of Presentazione Laurea Picariello Vincenzo Matr. 450334

Page 1: Presentazione Laurea Picariello Vincenzo Matr. 450334

Servizio di popolamento automatico per una piattaforma semantica di

gestione di biblioteche elettroniche

Relatore: Chiar.mo Prof. Semeraro GiovanniCorelatore: Chiar.mo Dott. Iaquinta Leo

Laureando:

Picariello Vincenzo matr. 450334

1

Page 2: Presentazione Laurea Picariello Vincenzo Matr. 450334

Outline

Biblioteca digitale FEDORA(Flexible Extensible Digital

Object Repository Architecture) Popolamento automatico di un repository

2Outline

Page 3: Presentazione Laurea Picariello Vincenzo Matr. 450334

Biblioteca digitale Biblioteca digitale

è la biblioteca della società dell’informazione; si basa sulla connettività e su una disponibilità organizzata in rete

dell’informazione; è una realtà virtuale che produce servizi reali; richiede tecnologia per connettere risorse di molti; è un sistema informativo organizzato e integrato; è un servizio di accesso ai contenuti delle varie collezioni; ha per obiettivo l’accesso universale.

Biblioteca digitale 3

Page 4: Presentazione Laurea Picariello Vincenzo Matr. 450334

La biblioteca digitale può essere definita in termini di:

contenuti: le risorse, oggetti digitali veri e propri (ossia le sequenze di bit che li rappresentano) e i metadati associati ad essi, i quali includono i metadati descrittivi (Dublin Core);

servizi: consentono la fruibilità degli oggetti digitali da parte degli utenti, avvalendosi delle informazioni veicolate dai metadati;

utenti: tutti i soggetti che hanno accesso alla rete possono essere definiti “utilizzatori delle risorse digitali”;

tecnologie: che consentono la conservazione e l'archiviazione a lungo termine, la diffusione degli strumenti per il commercio elettronico, e la definizione di standard per la gestione digitale dei diritti (Digital Rights Management).

Biblioteca digitale 4

Biblioteca digitale

Page 5: Presentazione Laurea Picariello Vincenzo Matr. 450334

Metadati Metadati

La componente della biblioteca digitale in cui l’interoperabilità è influenzata nel modo più evidente e decisivo è quello dei metadati, ovvero di quelle informazioni, generalmente strutturate e scandite in campi, relative a documenti primari, che ne permettono una più efficiente organizzazione, gestione e recupero.

Dublin Core È un sistema di metadati costituito da un nucleo d’elementi essenziali ai

fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica; si propone come uno standard di descrizione delle risorse in formato elettronico.

È stato concepito allo scopo di descrivere risorse informative generiche che potessero essere recuperate in una sola sessione di ricerca, trattando i documenti come oggetti forniti d’etichette (tag) che ne evidenziano determinate caratteristiche.

5Biblioteca digitale

Page 6: Presentazione Laurea Picariello Vincenzo Matr. 450334

Fedora Repository Fedora è un software open source della “University of Virginia Library and

Cornell University”.

Modello di oggetto digitale flessibile ed estensibile

Oggetto digitale (Digital Object D.O.) contenuti di tipo eterogeneo Behavior Definition e Behavior Mechanism Object

Caratteristiche principali: è open source; accetta dati in un qualsiasi tipo di formato digitale; utilizza per metadati lo standard DublinCore; gestione di relazioni tra oggetti; sfrutta l’inserimento e l’archiviazione dei metadati nello standard XML.

6Fedora

Page 7: Presentazione Laurea Picariello Vincenzo Matr. 450334

Fedora 7

Modello Digital Object

Identificatore Digital Object

Service view: metodi per disseminare contenuto

Internal view: metadati necessari a gestire l’oggetto

Content view: insieme di dati e metadati

identificativo unico e persistente dell’oggetto

elemento che associa un servizioesterno con lo scopo di fornire una vista estensibile dell’oggetto o del contenuto

è il componente dell’oggetto digitale che rappresenta il vero e proprio contenuto multimediale(immagine, testo, video)

è un file in formato FOXML(Fedora Object XML) che facilita la gestione dell’oggetto e in cui sono descritte tutte le proprietà dell’oggetto

Page 8: Presentazione Laurea Picariello Vincenzo Matr. 450334

Il FEDORA Object Model permette di asserire delle relazioni tra gli oggetti archiviati, in modo che un certo numero d’oggetti collegati tra loro possano andare a costituire gli items di una collezione, i componenti di un oggetto più grande oppure un insieme di risorse con un qualcosa in comune.

Relazioni tra DO RELS-EXT ("RELationShips-External")

Oggetti digitali identificati tramite URI (Uniform Resource Identifiers) ottenuta

concatenando il PID alla stringa "info:fedora/“ Il Fedora relationship ontology

rappresenta un insieme di relazioni; le relazioni possono essere ridefinite o estese; le relazioni sono dichiarate dalla prospettiva di un oggetto ad un altro

come il seguente pattern:

<subjectFedoraObject> <relationshipProperty> <targetFedoraObject>

Fedora 8

Fedora Relationship ontology

Page 9: Presentazione Laurea Picariello Vincenzo Matr. 450334

9

Movie Domain Internet Movie Database (http://www.imdb.com)

EachMovie Dataset 72.916 utenti 1.628 film Valutazione degli utenti scala 0 e 5

Informazioni principali: Titolo, Regista, Cast, Genere, Trama e Keywords.

Si sono definite le seguenti tipologie di DO: coll:FilmsCollection coll:ActorsCollection film:nomefilm act:nomeattore

Ingest

Page 10: Presentazione Laurea Picariello Vincenzo Matr. 450334

Automatic ingesting Ingesting di Digital Objects di tipo collezione (coll:nomecollezione)

Si è pensato di definire DO per le collezioni Films e Actors, al fine di creare oggetti concettualmente intesi come classe di oggetti, dove i singoli film e i singoli attori rappresentano istanze di queste due classi.

Sui singoli membri delle collezioni sono stati definiti i seguenti Datastream, oltre a quello indispensabile relativo al DublinCore:

MemberQuery MemberList ViewStylesheet

Ingest 10

Page 11: Presentazione Laurea Picariello Vincenzo Matr. 450334

Automatic ingesting Ingesting di Digital Objects di tipo non-collezione (film:nomefilm)Sui singoli membri della collezione FilmsCollection sono stati definiti i seguenti Datastream:

DC RELS-EXT Photo Rating Trailer Trama

Sono stati definiti due Disseminator per rendere fruibili l’immagine e il video associati al DO e dei meccanismi tali da legare essi alla particolare risorsa definita.

Ingesting di Digital Objects di tipo non-collezione (act:nomeattore)Sui singoli membri della collezione ActorsCollection sono stati definiti i seguenti Datastream:

DC Photo RELS-EXT

Ingest 11

Page 12: Presentazione Laurea Picariello Vincenzo Matr. 450334

RDF Il Resource Description Framework (RDF) è un framework per la

descrizione della conoscenza nel web. È lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati; è alla base del web semantico e permette la condivisione d’informazioni sul web.

L’RDF si basa su tre principi chiave: qualunque cosa può essere identificata da un URI; the least power: utilizzare il linguaggio meno espressivo per definire qualunque

cosa; qualunque cosa può dire qualunque cosa su qualunque cosa.

Il data model RDF è semplice, ed è basato su tre tipi di oggetti: Risorsa: qualunque cosa descritta da una espressione RDF viene detta risorsa; una risorsa

può essere una pagina Web o un elemento XML all’interno del documento sorgente; Proprietà: è un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata

per descrivere una risorsa; Espressione: una risorsa, con una proprietà distinta da un nome, e un valore della

proprietà per la specifica risorsa, costituisce un’espressione RDF.

Ingest 12

Page 13: Presentazione Laurea Picariello Vincenzo Matr. 450334

Relazioni RDF

Ingest 13

isMemberOf

isCostituentOf

isMemberOf

Graficamente, le relazioni tra Risorse, Proprietà e Espressioni vengono rappresentate mediante grafi etichettati orientati, in cui le Risorse vengono identificate come nodi (graficamente delle ellissi), le Proprietà come archi orientati etichettati, e i valori come rettangoli. Una rappresentazione grafica della descrizione RDF utilizzata nel nostro dominio è la seguente:

film:ToyStory

coll:FilmsCollection

act:TomHanks

act:TimAllen

act:DonRickles

coll:ActorsCollection

Page 14: Presentazione Laurea Picariello Vincenzo Matr. 450334

Grazie per l’attenzione…

14End