Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile...

23
Open Archives Open Archives Initiative Initiative e e Metadata harvesting Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze

Transcript of Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile...

Page 1: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Open Archives InitiativeOpen Archives Initiativeee

Metadata harvestingMetadata harvestingICCU

Seminario nazionale sui Metadati

Roma 3 aprile 2001

Dr. Valdo Pasqui

Università di Firenze

Page 2: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

2

Contesto Sviluppare e promuovere standard di

interoperabilità per facilitare la disseminazione efficiente dei contenuti

Trae origine nell’ambito della comunicazione accademica (scholarly) per favorire l’accesso agli archivi e-print

Si sta estendendo oltre questi limiti perché è indipendente dai contenuti e dai modelli economici circostanti

Page 3: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

3

Comprende

il framework di riferimento costituito da due componenti: Data Provider Service Provider

il protocollo per l’harvesting dei metadatihttp://www.openarchives.org/openarchivesprotocol.html

Page 4: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

R

e

p

o

s

i

t

o

r

y

Data Provider Service Provider

OAI harvesting protocol

metadata

metadata

Utentidei

servizi

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

4

Page 5: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

5

Data Provider e Repository

Un Data Provider gestiste un (o più) repository (archivio) che: supporta il protocollo OAI per consentire

l’accesso ai metadati sul suo contenuto va inteso in senso esteso: non solo e-print

ma un ampio spettro di collezioni di oggetti digitali

Page 6: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

6

Service Provider

Sono servizi che: interrogano i repository dei data provider

usando le richieste del protocollo OAI ricevono (catturano) i metadati esposti dai

data provider usano questi metadati per costruire servizi

a valore aggiunto (es. indicizzazione ed interfaccia di ricerca)

Page 7: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

7

Protocollo di Harvesting

Item del repositoryRecord restituiti dal repository Identificatori uniciMetadatiRichiesteTrasporto e codifica

Page 8: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

8

Protocollo: Item del repository

Gli “oggetti” che fanno parte del repository sono chiamati item

Si tratta di un concetto astratto e il protocollo non si occupa né della natura dell’item, né di quali metadata sono associati e se sia incluso il “full content”

Ogni item può disseminare metadata in molteplici formati

Gli item possono essere raggruppati per insiemi (es. per soggetto, istituzione etc.)

Page 9: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

9

Protocollo:Record

Quando un repository riceve una richiesta (del protocollo OAI) per ottenere i metadati di un item, restituisce una sequenza di byte codificata in XML che viene chiamata record

I record OAI hanno tre parti: header metadata about

Page 10: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

10

Protocollo:Record header, composto da:

identificatore unico datestamp (data di creazione, cancellazione o ultima modifica del record)

metadatauna singola manifestazione(formato) dei metadati dell’item - almeno Dublin Core deve essere supportato dal repository

about opzionale e non specificatousato per contenere informazioni sui diritti e le condizioni d’uso dei metadati

Page 11: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

<record>

<header>

<identifier>oai:eg:001</identifier>

<datestamp>2001-03-30</datestamp>

</header>

<metadata>

<dc xmnls=http://purl.org.dc/elements/1.1/”>

<creator>……..</creator>

<title>……</title>

<identifier>http://…….</identifier>

</dc>

</metadata>

<about>

<ea xmnls=“http://www.arXiv.org/ea”>

<usage>No restrictions</usage>

</ea>

</about>

</record>

protocollo

Metadata del formatospecifico

(almeno Dublin Core)

definiti nell’ambitodi specifiche comunità

Page 12: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

12

Protocollo: Identificatori

Sono le chiavi uniche che servono ad estrarre un record (i metadata di un item) da un repository

Il formato segue la sintassi URI:

oai:identificatore_archivio:identificatore_recordes:

oai:arXiv:hep-th/9901001

oai:unifi:unifi00000010

Registrato presso OAI Univoco nel repository

Schema(fisso)

Page 13: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

13

Protocollo: Metadati Supporta harvesting di molteplici formatidi metadati a

cui devono essere associati: un metadata schema = uno schema XML di validazione

pubblicamente accessibile tramite URL http://www.openarchives.org/OAI/dc.xsd http://www.openarchives.org/OAI/rfc1807.xsd http://www.openarchives.org/OAI/oai_marc.xsd

un metadata prefix = un nome che ogni repository mappa nello schema supportato e che è usato come argomento di alcune richieste oai_dc è riservato per indicare lo schema Dublin Core senza

qualificatori (obbligatorio)

Page 14: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

14

Protocollo: Richieste

GetRecord : per ottenere uno specifico record (metadati) da un item del repository

ListIdentifiers: per ottenere gli identificatori dei record che possono essere catturati dal repository

ListRecords: per ottenere un insieme di record Identify: per ottenere informazione sul repository ListMetadataFormats:per ottenere i formati di

metadati resi disponibili dal repository ListSets: per ottenere la struttura dei set (partizioni)

Page 15: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

GetRecord•identifier•metadataprefix

Record•header

•identifier•datestamp

•metadata•[about]

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

15

Page 16: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

ListIdentifiers•until [o]•from [o]•set [o]

Identifier [*]

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

16

Page 17: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

ListRecords•until [o]•from [o]•set [o]•metadataPrefix [=oai_dc]

Record [*]•header

•identifier•datestamp

•metadata•[about]

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

17

Page 18: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

Identify

•repositoryName•baseURL•OAIprotocolVersion•adminEmail•descriptionContainer[*]

•content•metadataPolicy•dataPolicy•submissionPolicy•comment

e-prints

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

18

Page 19: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

ListMetadataFormats•identifier [o]

•metadataFormat [*]•metadataPrefix•schema•metadataNameSpace

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

19

Page 20: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

Harvester

Service Provider

Repository

Data Provider

ListSets•identifier [o]

•set [*]•setSpecification•setName

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

20

Page 21: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

21

Metadati gestionali

OAI non definisce né prescrive alcun schema di gestione dei diritti

La definizione (e pubblicazione) di restrizioni sull’accesso e di vincoli per la gestione della proprietà intellettuale nei metadati esposti è lasciata ai data provide

Il protocollo consente lo scambio di metadati gestionali in vari modi:

Page 22: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

description Container nella risposta alla richiesta Identity, può contenere informazioni sul:

contenuto del repositorypolitiche di accesso ai metadatipolitiche di accesso ai dati

about nella risposta alla richiesta GetRecord, può contenere informazioni su:

diritti di accesso ai metadati del recordtermini e condizioni d’uso dei metadati del record

metadata nella risposta alle richieste GetRecord e ListRecords, può contenere formati di metadati cheprevedono informazioni di tipo gestionale sia sui diritti (es. elemento “rights” in Dublin Core) che di altro tipo

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

22

Page 23: Open Archives Initiative e Metadata harvesting ICCU Seminario nazionale sui Metadati Roma 3 aprile 2001 Dr. Valdo Pasqui Università di Firenze.

3 Aprile 2001 Valdo Pasqui Open Archives Initiative e harvesting dei metadati

23

Implementazione del protocollo OAI

Richieste espresse con i metodi Get o Post di HTTP

Risposte HTTP con: Content-Type:text/xml Codifica con rappresentazione UTF8 di

Unicode il root element ha lo stesso nome della

richiesta e fa riferimento al relativo XML schema definito da OAI