Post on 25-Jul-2015
Europeana e CulturaItalia per lo sviluppo del Semantic Web e dei Linked Open Data
Roma , Università di Roma La Sapienza – Dipartimento di Scienze documentarie, linguistico-filologiche e geografiche
Ciclo di conferenze a.a. 2014-15: 13 aprile 2015
Sara Di GiorgioIstituto Centrale per il catalogo unico delle biblioteche italianeresponsabile gruppo tecnico CulturaItalia
- La politica per il patrimonio culturale digitale del MiBACT
- Che cosa è CulturaItalia?- Che cosa è Europeana?- Linked Open Data
Indice
● 1 Segretariato Generale● 9 Direzioni Generali● 17 Direzioni Regionali● 12 Centri di competenza nazionali (tra cui l’ ICCU)● 100 Soprintendenze territoriali● 1,517 Archivi/biblioteche/musei/siti archeologici, monumenti
etc.● Circa 19,000 dipendenti
Il Ministero dei beni, delle attività culturali e del turismo (MiBACT) in pillole
1. Servizio Amministrativo
2. Servizio per la promozione culturale
ICCU è un Istituto Centrale del MiBACT strutturato in2 servizi e 6 dipartimenti
Progetti:
Internet Culturale CulturaItalia Europeana (partico italiana.) Mondiale Digital Library (partico italiana.) progetti europeiGoogle Books (partico italiana.)
1. Norme standard per la catalogazione e digitalizzazione
2. Servizio Bibliotecario Nazionale (SBN)
3. Attività di informazione e bibliografiche, Registry della Biblioteca italiana
4. Digitalizzazione e l'accesso ai documenti
5. Attività di bibliografia, catalogazione e censimento del libro antico
6. Censimento e gestione della bibliografia italiana di manoscritti
Le Istituzioni della memoria gestiscono una grande massa di contenuti digitali che deve essere:– immagazzinata e conservata a lungo termine in modo sicuro– accessibile in modo permanente– facilmente riutilizzabile nel tempo da diverse comunità di
ricerca e gruppi di utenti
L’obiettivo è di adottare una Infrastruttura digitale comune per i beni culturali che porterà alla riduzione dei costi e al miglioramento dell'interoperabilità attraverso:– l’adozione di procedure comuni– nuovi flussi di lavoro e metodologie di ricerca– sviluppo di nuove competenze e abilità
Il quadro del patrimonio culturale digitale
E’ necessario stabilire politiche e strategie comuni, che tengano conto di processi, servizi, strumenti e protocolli condivisi, per lo sviluppo di una e-Infrastructure per il patrimonio culturale che permetterà alle organizzazioni DCH di:
• accedere ai servizi delle infrastrutture digitali• creare dei Virtual Research Environment (VRE) in
grado di soddisfare le esigenze delle moderne forme di collaborazione scientifica.
La visione
EUROPEANA The European Portal
DIGITAL CULTURAL HERITAGE e-Infrastructure
The European portal for accessing digital collections (MLA)
NATIONAL & REGIONAL INITIATIVES
Linked Heritage
RECOMMENDATIONS & GUIDELINESNetwork of experts (hundreds) from 27
European MS, Russia and Israel
2002 2005 2008 2009 2011 2014 2015
European projects coordinated by the Italian ministry
Harmonization of EU Member statesNational Digitisation Programmes
ATHENA
Esperienze europee del MiBACT
ATHENA Plus
Conferenza internazionale ‘Il riuso dei contenuti culturali digitali per l’istruzione, il turismo e il tempo libero: un’opportunità per le istituzioni culturali e le industrie creative, un investimento per il futuro’, Roma Biblioteca nazionale centrale, 2 ottobre 2014, organizzata in collaborazione con la Commissione europea, la Fondazione Europeana e il progetto europeo AthenaPlus, rete europea di buone pratiche coordinata dall’ICCU.
Durante la conferenza sono state presentate le Raccomandazioni‘Patrimonio culturale e turismo’rivolte alle istituzioni culturali per promuovere il loro patrimonio attraverso il digitale e lo sviluppo di iniziative e servizi turistici innovativi.
Le Raccomandazioni hanno contribuito alla elaborazione del documento ‘Europeana for Tourism Policy Recommendations’
http://www.athenaplus.eu/getFile.php?id=428
Conferenze internazionali durante la presidenza italiana della UE: 2 ottobre sul turismo e il riuso
Conferenza internazionale sulle Infrastrutture di ricerca e infrastrutture digitali per il patrimonio culturale, Roma, Biblioteca Nazionale Centrale, 13-14 Novembre 20’14
La conferenza si è concentrata su come la collaborazione avviata tra le i fornitori di Infrastrutture digitali e le Infrastrutture di ricerca, operanti nel settore dei Beni Culturali possa rispondere alle sfide globali attraverso una maggiore integrazione delle infrastrutture di dati e a nuove metodologie di ricerca nel campo del patrimonio culturale
Speaker da ESFRI, Commissione EU,, Parlamento Europeo, Géant,, e-IRG, DARIAH, ARIADNE, CLARIN, CHARISMA, CENDARIIl programma e le presentazioni sono on-line:http://www.otebac.it/internationalconference/index.php?en/1/home
Durante la conferenza è stato presentato un Vision document,consultabile on-linehttp://www.otebac.it/internationalconference/getFile.php?id=16
Conferenze internazionali durante la presidenza italiana della UE: 13-14 novembre sulle infrastrutture
Le infrastrutture europee della ricerca nel settore del patrimonio culturale
ARIADNE, Advanced Research Infrastructure for Archaeological Dataset Networking in Europe www.ariadne-infrastructure.eu/
DARIAH, Digital Research Infrastructure for the Arts and Humanities www.dariah.eu/
CLARIN, Common Language Resources and Technology Infrastructure,www.clarin.eu/
Le infrastrutture europee della ricerca nel settore del patrimonio culturale
CHARISMA, Cultural Heritage Advanced Research Infrastructures, Synergy for a Multidisciplinary Approach to Conservation/Restoration
www.charismaproject.eu/
CENDARI, Collaborative European Digital Archive Infrastructure
www.cendari.eu/
EUROPEANA, the European aggregator
www.europeana.eu/
CulturaItalia in pillole
Nella presentazione parleremo di:
• Cosa è CulturaItalia
• Chi fornisce i contenuti a Europeana
• L’interoperabilità dei contenuti
• Procedure tecniche
«Uno standard è una specifica pubblicata che determina unlinguaggio comune, contiene una specifica tecnica o altri criteri
precisi edè concepito per essere utilizzato coerentemente, come una norma,
unadirettiva o una definizione. Gli standard sono applicati a vari
materiali,prodotti, metodi e servizi. Essi contribuiscono a semplificare la vita
e adaccrescere l’affidabilità e l’efficacia di molti beni e servizi da noiutilizzati» (definizione della La British Standards Institution )
L’uso appropriato di standard nella digitalizzazione contribuisce determinare la compatibilità delle risorse, che ne consente l’interoperabilità
Standard e interoperabilità
“Per gli utenti non è importante se le fonti per la conoscenza del patrimonio sono conservate da archivi, biblioteche e musei, ma avere l'accesso alle fonti dati che desiderano ed essere in grado di utilizzare queste fonti in modo interdisciplinare.”
CulturaItalia
MissionCulturaItalia: l’interoperabilità
2,4 M record da +35 partner tra cui portali tematici
990.536 r. Musei851.686 r. Bibliteche 485.466 r. Archivi+ 556.852 in arrivo
dal SAN1.3 M record in CC0
in Europeana20.000 Contenuti
editorialinel 2014 780.448
visitatori unici; visite 1.073.456
Versione inglese
CulturaItalia, l’aggregatore nazionale di contenuti
http://www.culturaitalia.it
CulturaItalia
Che cosa è
PERCHE’
Per rendere possibile lo svolgimento di ricerche nel complesso del patrimonio culturale digitale italiano on line distribuito su tutto il territorio (vale a dire, conservato in luoghi differenti da organismi differenti)
Accelerare la digitalizzazione del patrimonio culturale nazionale pubblico e privato secondo standard condivisi
Integrare la cultura italiana nel più ampio circuito europeo
CHE COSA E’
Un punto di accesso integrato al patrimonio culturale italiano diffuso sul territorio: archivi, biblioteche, musei, materiali audiovideo, etc. attraverso l’INTEROPERABILITA’tra le singole banche dati
Un e-magazine aggiornato quotidianamente per essere informati su notizie e eventi culturali in tutte le regioni italiane.
CulturaItalia
Obiettivi
CulturaItalia
CulturaItalia raccoglie ed organizza milioni di informazioni sulle risorse che compongono il ricco universo culturale del paese, mettendole a disposizione degli utenti della Rete.
Gli obiettivi di CulturaItalia sono in linea con quelli di Europeana
Europeana Stragic plan 2011 - 2015
CulturaItalia si basa sugli stessi standard e tecnologie di Europeana
CulturaItalia: obiettivi
CulturaItalia
Nuova funzione di ricerca
I risultati sono presentati in quattro gruppi principali. Il motore di ricerca interrooga ‘on the fly’ il Catalogo SBN tramite protocollo Z3950 e tramite API il portale Europeana
CulturaItalia: risultati di una ricerca
CulturaItalia
Nuova funzione di ricerca
RICERCA PARAMETRICA
Fonte dati -> seleziona in base al nome del fornitore
Categoria -> i risultati classificati in base ad un Thesaurus, un vocabolario controllato progettato per gestire e organizzare informazioni eterogenee, provenienti da sistemi di catalogazione differenti.
Tipo -> le risorse sono raggruppate in base alla loro tipologia.
Ambito geografico -> seleziona le risorse in base al luogo.
Ambito cronologico
Data di creazione
Autore
Soggetto
CulturaItalia: risultati di una ricerca
Nuova funzione di ricerca
SCHEDA DELLA RISORSA (METADATO)
Anteprima della risorsa-> quando è resa disponibile dal fornitore
Fonte dati -> Link al sito web del fornitore
Consulta la scheda esterna -> Link alla pagina del sito web del fornitore relativa alla risorsa
Documenti simili -> Presentazione di risorse simili a quella selezionata
CulturaItalia: risultati di una ricerca
CulturaItalia: il processo di ingestion dei contenuti
→ Via EXCEL, CSV, XML per l’interoperabilità tra CulturaItalia e la banca dati del fornitore
→ Via MuseiD-Italia per fornire le collezioni digitali museali e automaticamente renderle interoperabili con CulturaItalia
CulturaItalia organizza in un solo INDICE i metadati provenienti da banche
dati diverse per tema e distribuite sul tutto territorio nazionale
grazie ai seguenti standard internazionali:
Dublin Core (DCMI) per la descrizione dei metadati
inter-disciplinari
OAI-PMH per l’interoperabilità dei sistemi informativi XML per la rappresentazione dei dati
CulturaItalia promuove l’interoperabilità delle risorse digitali adottando un profilo applicativo interdisciplinare (PICO AP), basato sulle linee guida del DCMI.
I contenuti e i diritti su di essi rimangono sotto la responsabilità di chi licrea, gestisce e aggiorna.
CulturaItalia
Standard
I metadati costituiscono il linguaggio della biblioteca digitale, sono informazioni strutturate che descrivono, localizzano e rendono rintracciabili le risorse. I metadati sono spesso chiamati dati sui dati. (definizione NISO 2004).
CulturaItalia: aggregazione
CulturaItalia realizza l’interoperabilità delle risorse digitali adottando un profilo applicativo interdisciplinare denominato PICO AP dall’acronimo di progetto (Portale Italiano della Cultura On-line), basato sulle linee guida del DCMI.
Il PICO AP è stato elaborato dalla SNS Gruppo di lavoro: I.Buonazia – M. E. Masci - D. Merlitti – U.ParriniLa scelta del Dublin Core come standard di metadati descrittivi perché
offre:
Elementi semplici da comprendere e adoperare Opzionali e ripetibili Internazionali e trasversali tra le discipline Possibilità di qualificare gli Elementi per descrizioni più specifiche e
ricche Costituisce una base per l’interoperabilità semantica dei contenuti
Il DC è ISO Standard 15836 – 200
CulturaItalia: Application Profile
Analisi del dominio di CulturaItalia
Il patrimonio tangibile beni architettonici e paesaggistici opere mobili e loro collezioni beni librari, compresa l’attuale
produzione letteraria beni archivistici beni archeologici e demo-etno-
antropologici arte e architettura contemporanea
Il patrimonio intangibile la musica la danza, il teatro, gli spettacoli il cinema le scienze umane la cultura scientifica
La complessità del dominio del Portale e delle risorse esistenti ha condotto a definire un metadata schema che estende ulteriormente il Qualified DC, con ulteriori estensioni che meglio consentono di gestire i vari contenuti previsti per il Portale.
CulturaItalia: Application Profile
PICO ThesaurusItaliano-English
Chi – I protagonisti della vita culturale:• Persone• Famiglie• Enti pubblici e privati
Cosa – I beni culturali, le risorse documentarie, i servizi, le aree disciplinari, le azioni per lo sviluppo e la conservazione del patrimonio culturale:
• Giacimenti culturali• Opere d’arte in tutti i settori• Arte applicata• Ricerca scientifica e formazione• Eventi, servizi, normativa
Dove – I luoghi
Quando – La periodizzazione
ES dc:subject – pico:thesaurus
Tutte le risorse sono classificatenell’Indice di CulturaItalia grazieal PICO Thesaurus, un vocabolariocontrollato gerarchico, sviluppatoin formato SKOS.
Il Thesaurus è disponibile nellelingue italiana e inglese.
CulturaItalia
Funzionamento – L’Indice
http://www.culturaitalia.it/pico/thesaurus/4.1/thesaurus_4.1.0.skos.xml
CulturaItalia: Thesaurus
Documentazione tecnica pubblicata on-line
Diffusione standard per l’interoperabilità, la digitalizzazione, la qualità dei contenuti in rete
Supporto tecnico
Download SW applicativo Data provider
Download validatore XML dei record in formato PICO
CulturaItalia Facilitare
Gruppi di lavoro a cui partecipano esperti dei vari settori del patrimonio culturale
CulturaItalia propone uno spazio comune per la diffusione di standard aperti,dell’ interoperablità dei contenuti e per facilitare la partecipazione degli istituti culturali al dibattito internazionale sulla conoscenza come bene comune .
CulturaItalia: attività tecnico-operative
CulturaItalia
FASE 1
FASE 1
CulturaItalia individua e seleziona le banche dati segnalate
FASE 2
FASE 2
CulturaItalia prende accordi con i fornitori responsabili della loro gestione
FASE 3
CulturaItalia concorda il livello di completezza delle risorse da pubblicare
FASE 3
FASE 4
CulturaItalia fornisce il supporto per rendere interoperabile la banca dati
FASE 4
FASE 5
CulturaItalia pubblica le risorse del fornitore sul portale della cultura e su Europeana
FASE 5
CulturaItalia: attività tecnico-operative
Il fornitore che intende rendere interoperabile con CulturaItalia (e Europeana) i
propri contenuti organizzati in banche dati, svolgerà le seguenti attività:
Concordare e pubblicare il documento di mapping tra il PICO AP e lo schema di catalogazione delle risorse del fornitore
Scegliere il modulo “Data Provider” compatibile con il profilo software della banca dati
Installare e configurare il modulo “Data Provider” sul server della banca dati
Estrazione dei dati e popolamento del repository OAI-PMH (componente del Data Provider)
Verifica della qualità dei metadati tramite interrogazione diretta del repository e tramite un validatore automatico
Harvesting dei metadati e pubblicazione su CulturaItalia Selezione risorse da inviare a Europeana Verifica metadati e pubblicazione sul portale Europeo
CulturaItalia
Aderire a CulturaItalia: Banche datiCulturaItalia: attività tecnico-operative
CulturaItalia
Criticità
Le criticità che spesso emergono:
poca comprensione dei vantaggi offerti dall’interoperabilità delle basi dati (più efficace reperibilità delle risorse in rete, maggiore visibilità del fornitore di contenuti)
scarsa adesione alla filosofia dell’Accesso aperto difficoltà nella definizione degli accordi con i fornitori di
contenuti problematica dei diritti d’autore: licenze d’uso
diversificate con i singoli istituti
CulturaItalia: attività tecnico-operative
CULTURAITALIANational cross-
domain aggregator
INTERNET CULTURALEThematic aggregator
for Libraries
CulturaItalia e il sistema di aggregazione
SANThematic
aggregator for Archives
MUSEID-ITALIAThematic
aggregator for Museums
EUROPEANAEuropean cross-
domain aggregator
Regional aggregator
s
Private archives Universities
ArtPastaggregatore
SANaggregatore
Regioniaggregatore
Università
Internet Culturaleaggregator tematico
CulturaItalia aggregatore nazionale vs
Europeana
Interoperabilità
Aggregazione
Diffusione
Servizi per gli utenti e gli stakeholders
Musei
Le risorse non vengono duplicate. I contenuti e i diritti su di essi rimangono sotto la responsabilità di chi li crea, gestisce e aggiorna.
CulturaItalia: obiettivi
MuseiD-Italia <project>
MuseiD-Italia / CulturaItalia verso Europeana
L’utente è guidato da un
link al sito web del fornitore
L’utente è guidato da un
link al sito web del fornitore
Europeana in pillole
Nella presentazione parleremo di:
• Cosa è Europeana
• Cosa offre Europeana
• Chi fornisce i contenuti a Europeana
• La licenza di distrubuzione dei dati
• Accesso e ri-uso dei dati aggregati da Europeana
La mission di Europeana
– Europeana è un catalizzatore di iniziative nell’ambito del patrimonio culturale digitale
– Europeana rende accessibile il patrimonio culturale attraverso canali digitali per promuovere lo scambio di idee e informazioni. E’ una risorsa importante per comprendere meglio la diversità culturale europea, e dà un contributo allo sviluppo dell’economia della conoscenza
32M record da +3000 gallerie, musei, biblioteche e archivi europei
Libri, giornali, lettere, diari, documenti d’archivio
Dipinti, mappe, disegni, fotografie
Musica, interviste, radio
Film, cinegiornali, televisione
Mostre virtuali31 lingue
Europeana, il portale del patrimonio culturale d’Europa
http://www.europeana.eu
Storia di Europeana Aprile 2005: Jacques Chirac scrive al presidente della Commissione
europea José Manuel Barroso, che raccomanda la creazione di una biblioteca digitale europea
La Società per l'informazione e la Direzione media della CE sostengono i progetti europei per lo scambio di informazioni sul digitale da 15 anni
Settembre 2005: pubblicazione della strategia i2010 della CE sulle biblioteche digitali
2007: European Digital Library Network - EDLnet – inizia a costruire Europeana, finanziata nell'ambito dell'iniziativa i2010
Novembre 2008: Lancio del prototipo di Europeana
Estate 2010: il prototipo è diventato un servizio operativo finanziato nell'ambito del CIP ICT-PSP (Competitiveness and Innovation Framework Programme)
Gennaio 2011: Viene pubblicato un nuovo rapporto ‘Rinascimento digitale’ in cui si riconosce Europeana come ‘il punto di riferimento per la cultura europea online'
Settembre 2012: I metadati aggregati da Europeana vengono rilasciati sotto licenza CC0, per renderli liberamente disponibili per il riutilizzo
Come acquisisce i contenuti Europeana?
Attraverso il suo sistema di aggregazione, Europeana rappresenta 2.200 organizzazioni in tutta Europa
Da 150 aggregatori
• Promuove gli aggregatori nazionali
• E’ più efficiente piuttosto che lavorare con ogni singolo fornitore di contenuti
• Aiuta a sviluppare un processo internazionale di standardizzazione
Contenuti generati dagli utenti
Progetti di crowdsourcing come Europeana 1914-1918 e Europeana 1989
Aggregatori tematici Iniziative nazionali
Collezioni audio-visive
Aggregatori nazionali
Aggregatori regionali
Archivi
Banche dati tematiche
Bibioteche
e.g. Musées Lausannois
e.g. CultuiraIt
alia Culture.fr
e.g. The European Library
e.g. APEX
e.g. EUScreen, European Film Gateway
e.g. Judaica Europeana, Europeana Fashion
Chi fornisce i dati a Europeana?
Piano Strategico 2011-2015
Coinvolgere – Europeana propone modi nuovi di partecipazione dei cittadini alla loro eredità culturale
Aggregare – Europeana sviluppa una fonte dati aperta e autorevole di contenuti culturali europei
Facilitare – Europeana offre un supporto al settore dei beni culturali favorendo il trasferimento delle conoscenze, e l'innovazione
Distribuire – Europeana mette il patrimonio culturale a disposizione delle persone ovunque si trovano e quando vogliono
In che modo gli utenti accedono a Europeana?
Europeana si propone di fornire i contenuti aggregati agli utenti dove vogliono e quando vogliono attraverso:
Il portale Europeana
• ad es.: con la ricerca, mostre virtuali, contenuti in primo piano
Portali legati ai progetti/mostre virtuali
• ad es.: BHL- Poisonous Nature, Europeana Fashion
Siti web e app che utilizzano Europeana API – realizzati grazie ad hackathon o autonomamente
Social media/blogs
• e.g. Facebook, Twitter, Pinterest, Retronaut
Il profilo applicativo di Europeana (EDM)
– EDM is a cross-community development, involving library, archive and museum experts, plus academic partners
– A data model that re-uses several existing Semantic Web-based models
Europeana è un enorme dataset culturale aperto per il ri-uso
– A partire da settembre 2012, i metadati di Europeana sono disponibili senza restrizioni sotto i termini della licenza Creative Commons Zero Public Domain Dedication - CC0.
– Una buona opportunità per gli sviluppatori• API
– Hack4Europe! è una serie di giornate di hack tenute in diverse località in tutta Europa, dove gli sviluppatori utilizzano l’API e in due giorni per creano una nuova App.
– Search widgets per siti web, es.. CulturaItalia, Partage Plus
– Sviluppo indipendente – chiunche può richiedere API-keys
• Linked Open Data – un subset di dati è disponibile per iniziative LOD
Licenza per la distribuzione dei dati
Per i metadati Europeana prevede:
che vengano forniti in linea con l’Europeana Data Model – i dati in formato EDM tutti i metadati forniti a Europeana saranno pubblicato secondo i termini della Creative Commons 0 (licenza relativa al Pubblico Dominio) per permettere il riuso dei dati sotto forma di Linked Open Data Europeana presenterà sempre l’attribuzione dei dati al fornitore Europeana pubblicherà sempre un collegamento ai dati sul sito web del fornitore È sempre possibile richiedere Europeana di rimuovere o aggiornare i metadati
• I partner di CulturaItalia scelgono il tipo di licenza da applicare ai metadati che mettono a disposizione del portale
• Per inviare i dati ad Europeana, CulturaItalia include nell’accordo la liberatoria per il Pubblico Dominio, Creative Commons CC0, per i metadati, mentre per le risorse digitali (immagini, audio o video) la possibilità di esprimere altre licenze o condizioni d’uso. Generalmente viene utilizzato Rights reserved-Free access
• Oggi sono pubblicati su CulturaItalia:– 1.626.745 record /metadati in CC0
– 293.170 in CC-BY-NC
– 276.301 diritti riservati
Accordi e licenze
Europeana chiede agli aggregatori di ottenere il permesso dai loro fornitori di dati, compresa una copia del DEA
Licenza per la distribuzione dei dati
La licenza distingue tra:
Metadati: Informazioni testuali (inclusi i collegamenti ipertestuali) utili per individuare, interpretare e/o gestire il Contenuto
Anteprima: Una rappresentazione visiva e/o sonora dei Contenuti in dimensioni ridotte, sotto forma di una o più immagini, file di testo, file audio e/o file di immagini in movimento.
EDM:rights
CulturaItalia/Europeana
Un'opera è nel pubblico dominio se è liberamente utilizzabile da chiunque per qualunque scopo senza restrizioni dovute al diritto d'autore (copyright).
Gli enti titolari dei dati che desiderano rinunciare ai diritti sull'Opera al contribuiscono alla realizzazione di un patrimonio comune di opere creative, culturali e scientifiche definiti "Commons“, ‘beni comuni.
Il pubblico potrà sviluppare ulteriormente, modificare, inserire in altre opere, riutilizzare e ridistribuire del tutto liberamente, in qualsiasi forma e per ogni finalità, inclusi e senza alcun limite anche scopi commerciali
I metadati sotto CC0 possono essere ri-utilizzato senza restrizioni in diverse giurisdizioni, ricadendo sotto il Pubblico Dominio
Licenza per la distribuzione dei dati
CC0: per attribuire un'opera al pubblico dominio è possibile utilizzare lo strumento CC0.
La Creative Commons Zero deve essere preceduta da una dichiarazione relativa alla provenienza del documento.
Comunità Europea Riutilizzo delle risorse
•
Le licenze Creative Commons
http://www.aliprandi.org/manuale-cc/
Il pubblico dominio è un commons, un bene comune di inestimabile valore, un bene indispensabile che - come il nostro ambiente naturale e il patrimonio fisico - merita di essere conosciuto, protetto e apprezzato.
Ogni anno decine di autori (e le loro opere) – uscendo dai termini di protezione del copyright – entrano in questo territorio libero dove le produzioni intellettuali sono liberamente fruibili e condivisibili senza restrizioni e possono concorrere alla costruzione di nuova conoscenza.
Il pubblico dominio è un Commons
Dal 2015 sono nel public domain :Il Piccolo Principe di Antoine de Saint-Exupery, Il Manifesto del futurismo italiano di Marinetti, i romanzi su 007 di Ian Fleming , ’Urlo di Munch, le registrazioni di Cole Porter, alcune opere di Mondrian Kandinsky
Layer #1: Digital objects (on the site of the provider)
Layer #2: Previews (lower quality versions of #1)
Layer #3: Metadata (descriptive object information)
EDM:rights
Il Data Exchange Agreement (DEA) distingue:
CC0
Il quadro delle licenze previste nella DEA: statement previsti per le risorse digitali (EDM:rights)
Public domainThe Public Domain Mark (PDM)Out of copyright - non commercial re-use (OOC-NC)The Creative Commons CC0 1.0 Universal Public Domain Dedication (CC0)Creative commons licencesCreative Commons - Attribution (BY)Creative Commons - Attribution, ShareAlike (BY-SA)Creative Commons - Attribution, No Derivatives (BY-ND)Creative Commons - Attribution, Non-Commercial (BY-NC)Creative Commons - Attribution, Non-Commercial, ShareAlike (BY-NC-SA)Creative Commons - Attribution, Non-CommercialNo Derivatives (BY-NC-ND)Rights reservedFree access - no re-usePaid access - no re-useUnknown rightsOrphan workUnknown
61
F. Morando, Interoperabilità giuridica: rendere i dati (pubblici) aperti compatibili con imprese e comunità online
L’interoperabilità giuridica
62
• Open Knowledge Foundation Public Domain Calculator
http://publicdomain.okfn.org/calculators/
• Europeana Public Domain Calculator http://www.outofcopyright.eu/
• EDM Rights Selection Tool http://pro.europeana.eu/web/guest/edm-rights-selection-tool
• Creative Commons ha predisposto un procedimento interattivo guidato per la scelta e
l’applicazione della licenza più vicina alle esigenze del licenziante:
http://creativecommons.org/choose/
Alcuni strumenti utili
Vi parlerò di:
• Definizione di Open Data
• Che cosa sono i Linked open data
• dati.culturaitalia.it
• I vantaggi dei LOD
Definizione di dato / contenuto aperto Open Knowledge Foundation.
«un contenuto o un dato si definisce aperto se chiunque è in grado di utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla richiesta di attribuzione e condivisione allo stesso modo» Open Knowledge Foundation.
•il dato deve essere accessibile, preferibilmente via Internet e in un formato modificabile;•deve essere libero da vincoli tecnologici che ne limitino di fatto la più ampia diffusione; •eventuali vincoli legali non devono pregiudicare la possibilità di distribuzione e riuso.
Maggiori informazioni: http://www.opendefinition.org/okd/italiano/
14 April 2023 Event 68
Open by default
A partire dal 18 marzo 2013, scadenza dei novanta giorni previsti dalla Legge, dati e documenti pubblicati online dalle amministrazioni titolari - senza una esplicita licenza d’uso che ne definisca le possibilità e i limiti di riutilizzo – sono da intendersi come dati aperti, quindi dati che possono essere liberamente acquisiti da chiunque e riutilizzabili anche per fini commerciali.
La norma è il cosiddetto Decreto Crescita 2.0 (http://www.altalex.com/index.php?idnot=59517). Decreto Legge 18 ottobre 2012, n. 179 recante "Ulteriori misure urgenti per la crescita del Paese" (c.d. Decreto Crescita 2.0), coordinato con la legge di conversione 17 dicembre 2012,n. 221 e pubblicato in Gazzetta Ufficiale 18 dicembre 2012, n. 294.
I principi dei LOD
La disponibilità e il rilascio di Open Data è un patrimonio prezioso per la società civile e per le imprese, ma affinché si possa valorizzare del tutto l'informazione, l’apertura da sola non basta.
Linked Open Data mostrano interessanti opportunità per superare le limitazioni dei modelli Open Data. Se gli Open Data abbattono le barriere culturali, legali ed economiche al riuso, il movimento Linked Data si concentra piuttosto sulla messa a punto di strumenti che permettono di dare ai dati (aperti o non) un'identità e di renderli collegati tra loro e interoperabili.
14 April 2023 Event 70
La classificazione delle 5 stelle del W3C1. i propri dati siano ‘aperti’ disponibili sul web (in qualsiasi formato jpg, doc, );
2. il materiale messo sul web sia disponibile come dato strutturato (per esempio, in excel anziché come scansione dell’immagine di una tabella);
3. siano stati scelti formati non proprietari (per esempio, in csv invece che excel);
4. siano stati utilizzati URL per identificare gli oggetti, in modo gli utenti possano puntare a questi oggetti;
5. i propri dati siano stati collegati a dati prodotti da altri in modo da definire un contesto.
CulturaItalia/EuropeanaLinked Open Data
Linked Open Data è:
• una tecnologia in grado combinare le informazioni tra di loro
• un modo per condividere i dati con le altre parti• un modo per offrire agli utenti un’esperienza di ricerca
migliore possibile
Sei vuoi saperne di più vai alla sezione di CulturaItalia dedicata ai LOD e all’iniziativa di Europeana
Definizione di Linked Open Data
Le quattro regole dei Linked Data
1. Utilizzare URI come nomi per le cose2. Utilizzare URI HTTP in modo che le
persone possono cercare questi nomi.3. Quando qualcuno cerca di un URI,
fornire informazioni utili, utilizzando gli standard RDF (*, SPARQL)
4. Includere link ad altri URI. in modo che si possano scoprire più cose.
Considerando la rete come un ipertesto, la rete di dati è costruito dai documenti pubblicati sul web. Tuttavia, a differenza del web come ipertesto, dove i collegamenti sono relazioni date dai link nei documenti ipertestuali scritti in HTML, per il web dei dati i link tra le risorse sono descritti attraverso l’ RDF.
Gli URI identificano qualsiasi tipo di oggetto o concetto.
Semantic WebCon il termine Web Semantico, termine coniato dal suo ideatore, Tim
Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) sono associati ad informazioni e dati (metadati) che ne specificano il contesto semantico in un formato adatto all'interrogazione e l'interpretazione (es. tramite motori di ricerca) e, più in generale, all'elaborazione automatica.
Il Web Semantico è un movimento collaborativo guidato da W3C. Attraverso l'inserimento di contenuto semantico nelle pagine web, il Web Semantico mira a convertire l'attuale web, dominato da documenti in una "rete di dati". Il Semantic Web è basato sul W3C Resource Description Framework (RDF).
14 April 2023 Event 76
Cosa sono i Linked Open Data
I LOD sono dati pubblicati sul web in modalità leggibile, interpretabile da una macchina il
cui significato è esplicitamente definito grazie allo standard RDF Resurce Description
Framework
RDF (triple)
soggetto – predicato – oggetto
Dante ha scritto La Divina Commedia
Dante ha scritto La Divina Commedia
http://dbpedia.org/page/Dante_Alighieri
http://dbpedia.org/ontology/writer
http://dbpedia.org/page/Divine_Comedy
http://dbpedia.org/ontology/movement
http://dbpedia.org/page/Dolce_Stil_Novo
Standard e LOD
RDF è uno standard W3C per la modellazione e la condivisione della conoscenza distribuita sulla base di un assunto open-world decentralizzato. Qualsiasi conoscenza può essere scomposto in triple (3-tuple), comprensiva di soggetto, predicato, e l'oggetto; in sostanza, RDF è il minimo comune denominatore per lo scambio di dati tra sistemi.
la tripla contiene due concetti collegati da una relazione
RDF è un linguaggio semplice per esprimere modelli di dati, che si riferiscono ad oggetti ("risorse web") e le loro relazioniOWL aggiunge più il vocabolario per descrivere le proprietà e classiSPARQL è un linguaggio di protocollo e di query per le origini dati web semantico
RDF è l’acronimo di Resource Description Framework
RDF è un framework per la descrizione delle risorse sul web
RDF è progettato per essere letto e compreso da computer
RDF non è progettato per la visualizzazione di persone
RDF è scritto in XML
RDF è una parte del W3C Semantic Web Activity
RDF è una raccomandazione W3C
Il linguaggio RDF fà parte del Semantic Web del W3C in cui:
- le Informazioni Web hanno significato esatto- le Informazioni Web possono essere comprese e trattate da computer- i computer possono integrare le informazioni dal web
Standard e LOD
14 April 2023 Event 79
Linked Open Data: i dataset
Dante Alighieri
Divina Commedia
DB Opere
DB Personeè autore di
Ciascuna risorsa che compone la tripla può appartenere a un diverso dataset disponibile sul web. Il meccanismo consente di collegare i dati presenti in una fonte dati (link interni) con dati presenti in una fonte diversa (link esterni).
Web di dati
Le collezioni culturali non sono silos, sono nodi importanti di una rete. Offrono un contesto importante per le risorse.
Web di dati
• Il progetto pilota dati.culturaitalia.it contiene set di open data aggregati in CulturaItalia e rilasciati dai partner del progetto con licenza “CC0 1.0 Universal Public Domain Dedication”.
• disponibili alcuni dataset di test del Polo museale fiorentino, catalogo opere d’arte della Regione Marche, Accademia S. Cecilia, Digibess, IInternet Culturale, Michael Italia, e Anagrafe delle Biblioteche Italiane
dati.culturaItalia, sezione dedicata ai dati aperti e ai LOD
• SPARQL endpoint che rende interrogabili i dati in formato CIDOC-CRM attraverso::
1) un'interfaccia di interrogazione SPARQL
2) un'interfaccia di interrogazione iSPARQL;
3) una ricerca di testo
• i dati in formato CIDOC sono arricchiti semanticamente :• con gli authority file del VIAF (Viartual International Authority file: www.viaf.org ) e
con i nomi geografici di GeoNames (www.geonames.org/)
• GeoNames (www.geonames.org/)
• PICO Thesaurus in SKOS
• DCMI Type vocabulary
dati.culturaItalia, sezione dedicata ai dati aperti e ai LOD
• Il CIDOC-CRM (Conceptual Reference Model) è un’ontologia formale per l’integrazione e lo scambio di informazioni eterogenee nell’ambito dei Beni Culturali
• Sviluppata dall’International Committee for Documentation (CIDOC) dell’ Internationa Council of Museums (ICOM) a partire dal 1996 ed è uno standard internazionale ISO (21127:2006)
Comprende 86 Classi e 136 Proprietà in grado di esprimere centinaia di formati di (meta)data e permettere l'integrazione fra archivi eterogenei nell'ambito dei beni culturali
Sviluppato per creare archivi che possano essere compresi dagli esseri umani ed elaborati dalle macchine
Il CIDOC-CRM
• L’OAI Provider rende disponibili metadati in formato XML e RDF strutturati secondo vari schemi:– oai-dc (xml): schema OAI-PMH adottato dall’Open Archives
Initiative Protocol for Metadata Harvesting– pico (xml): PICO Application Profile, il profilo applicativo di
CulturaItalia – edm (rdf): Europeana Data Model, adottato dal portale
Europeana– cidoc (rdf): CIDOC - Conceptual Reference Model
nell’implementazione Erlangen CRM / OWL
dati.culturaItalia, sezione dedicata ai dati aperti e ai LOD
Key issues: – Migliorare la qualità dei dati e fornire un accesso
diretto ai contenuti in modo che l'esperienza utente può migliorare drasticamente
– Sviluppare una proposta di valore più esplicita per le istituzioni culturali. Hanno bisogno di essere motivati a dare il meglio.
– Creazione di nuove competenze in DCH e di nuove opportunità di lavoro
– Riutilizzo e reperibilità dei contenuti culturali digitali– Creazione di una Infrastruttura digitale per il
patrimonio culturale e collegamento con le Infrastrutture di Ricercahttp://labs.europeana.eu/api/linked-open-data/
introduction/
CulturaItalia
Aderire a CulturaItalia: Banche dati
Documentazione tecnica
Documenti mapping profilo ICCD e MAG
Download modulo Data provider OAI-PMH
Software per la validazione del repository conforme al profilo applicativo PICO
Documenti tecnici
CulturaItaliaDocumentazione tecnica