Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria...

19
Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012

Transcript of Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria...

Page 1: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

Strumenti per l'integrazione e la condivisione delle informazioni

bibliografiche e musealiMaria Teresa Biagetti

Roma 10 settembre 2012

Page 2: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 2

ICOM International Council of Museums

Section 1. Museum

“A museum is a non-profit, permanent institution in the service of society and its development, open to the public, which acquires, conserves, researches, communicates and exhibits the tangible and intangible heritage of humanity and its environment for the purposes of education, study and enjoyment.” http://icom.museum/the-organisation/icom-statutes/3-definition-of-terms/#sommairecontent

Multimedia Information Retrieval Image / Visual Retrieval

Peter Enser "semantic gap"

CIDOC CRM Conceptual Reference Model

“significati intesi”

CIDOC International Committee for Documentation

ICOM International Council of Museums

Page 3: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 3

Le ontologie

le ontologie sono schemi concettuali condivisi e altamente strutturati, attraverso i quali si definiscono i concetti, gli oggetti, i processi, e le relazioni tra di essi, al fine di rendere evidenti e definire in modo stabile i rapporti gerarchici esistenti tra i concetti.

Sono impiegate per descrivere e rappresentare un'area della conoscenza utilizzando un linguaggio non ambiguo e suscettibile di essere trattato dalle macchine.

Definizioni di ontologia:

Thomas Robert Gruber: "An ontology is an explicit specification of a conceptualization"

Rudi Studer: "An ontology is a formal, explicit specification of shared conceptualization"

Thomas R. Gruber. A Translation Approach to Portable Ontology Specifications. "Knowledge Acquisition", 5 (1993), n. 2, p. 199-220. Rudi Studer, V. Richard Benjamins, Dieter Fensel. Knowledge Engineering: Principles and Methods, "Data & Knowledge Engineering", 25 (1998), n. 1-2, p. 161-198.

Una concettualizzazione è la definizione di un insieme di concetti, di entità, di oggetti, e di relazioni tra di essi, relativi ad un'area d'interesse o ad un settore di riferimento, una rappresentazione astratta del campo di conoscenza cui ci si riferisce.

Anche i tradizionali sistemi di classificazione biblioteconomica e i thesauri documentari costituiscono un esempio di concettualizzazione, sebbene non formale: sono scritti in linguaggio naturale (che può essere ambiguo, polisenso) non in linguaggio formale, e quindi non sono adatti per realizzare il ragionamento automatico.

Page 4: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 4

Ontologie formali

Rappresentano una concettualizzazione in un linguaggio formale e comprensibile dai computer.

Un linguaggio formale si basa su di un insieme finito di simboli, una grammatica che definisce quali sequenze di simboli costituiscono formule "ben formate", si basa su assiomi e regole di inferenza.

1950- Computer Science sviluppa ontologie formali per le basi di dati

1980- Artificial Intelligence realizza i sistemi esperti, ad es. MYCIN, per le diagnosi delle infezioni (Medicina) e DENDRAL, per la chimica organica.

I sistemi esperti generalmente usano regole stabilite per risolvere problemi relativi ad ambiti circoscritti, e raggiungono buoni risultati solo nei campi per cui sono stati realizzati, ma risultano inadatti a risolvere nuovi problemi.

Artificial Intelligence sviluppa studi per la Rappresentazione della conoscenza

Adozione della Description Logics per realizzare linguaggi formali per la rappresentazione della conoscenza da impiegare nell’elaborazione di ontologie formali.

La Logica descrittiva (Description Logics) costituisce un sottoinsieme della

Logica del primo ordine (First-order Logic, FOL).

Page 5: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 5

Description Logics rispetto alla Logica proposizionale offre gli strumenti per esprimere proposizioni sugli oggetti, sulle proprietà che gli oggetti possono presentare in comune, e sulle relazioni tra gli oggetti.

I formalismi descrittivi che utilizza comprendono gli operatori di congiunzione, di negazione, di intersezione di concetti, di quantificazione esistenziale, di restrizione dei valori e di restrizione numerica (cardinalità).

I linguaggi basati sulle Logiche descrittive forniscono agli utenti (agenti umani o automatici) la possibilità di realizzare inferenze, cioè dedurre conoscenze dalla rete di conoscenze esplicitate.

Le inferenze vengono realizzate applicando gli algoritmi di subsumption, che determina le relazioni gerarchiche tra concetti, di instance, determina l’appartenenza di un individuo ad una classe, e di consistency, che rende possibile l'analisi della coerenza logica e dell'assenza di contraddizione tra i concetti.

I linguaggi basati sulle Logiche descrittive si propongono quindi come i candidati migliori per la realizzazione dei linguaggi formali per le ontologie.

OWL Web Ontology Language Overview (W3C Recommendation 10 February 2004) <http://www.w3.org/TR/owl-features/>

OWL 2 Web Ontology Language Document Overview (W3C Recommendation 27 October 2009) <(http://www.w3.org/TR/owl2-overview/>.

Page 6: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 6

Thesauri documentari e ontologie Nei Thesauri tutte le possibili relazioni tra concetti vengono costrette all'interno di due ampie

categorie: le relazioni gerarchiche (BT Broader Terms, NT Narrower Terms) e le relazioni associative (RT Related Terms).

Manca una semantica precisa, definita ed esplicitata, e questo produce un significativo livello di ambiguità nell'interpretazione delle relazioni.

Aggiungendo relazioni e proprietà formalmente definite, entriamo nel mondo delle ontologie: relazioni tra i membri delle classi e delle sottoclassi; restrizione dei valori; unione; intersezione; disgiunzione.

I concetti e le relazioni sono definiti in modo univoco attraverso una semantica formale, che permette di attuare l'interoperabilità tra i diversi sistemi di organizzazione della conoscenza.

Lo standard SKOS Simple Knowledge Organization System Reference (W3C Recommendation 18 agosto 2009) http://www.w3.org/TR/2009/REC-skos-reference-20090818/ costituisce un modello adatto ad esprimere la struttura di base e i contenuti dei sistemi di organizzazione della conoscenza (KOS), definisce le modalità per la reingegnerizzazione di thesauri e sistemi di classificazioni come ontologie formali, trasformando la struttura di concetti esplicitata in un thesauro, ad esempio, in un insieme più sfaccettato ed elaborato di classi e proprietà, identificate da URI.

Page 7: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 7

Diversi tipi di ontologie

ontologie leggere (lightweight ontologies) semplici tassonomie di concetti, organizzati in gerarchie in base alla relazione genere-specie (relazione is-a, x è una specie di y). Possono essere impiegate anche per raggiungere l'interoperabilità semantica, purché gli utenti facciano parte di gruppi che condividono già la terminologia e i significati.

Topic Maps (Steve Pepper le definisce “indici del mondo dell'informazione”).

Topici (Topics) sono le entità, le persone, i concetti, gli oggetti, intorno a cui possa essere asserita qualsiasi cosa. Le Associazioni tra Topici formano una rete di relazioni chiaramente definite. Le Occorrenze sono le risorse informative rilevanti per il Topico, una monografia, un’immagine, una citazione all'interno di un'altra risorsa, puntate attraverso URI.

ontologie di dominio (domain ontologies) forniscono l'organizzazione di uno specifico campo disciplinare o applicativo, rappresentandone i concetti rilevanti.

upper ontologies (o top-level ontologies) rappresentano concetti e proprietà generali, applicabili ad un vasto insieme di ambiti cognitivi, e in questo caso il raggiungimento della condivisione dei significati può presentare notevoli difficoltà.

Page 8: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 8

Ontologie fondate sulla Logica formale

SUMO (Suggested Upper Merged Ontology) (http://www.ontologyportal.org/), è una ontologia che presenta un livello upper-level, sviluppata nel 2000 dalla società Teknowledge Corporation e candidata dallo Standard Upper Ontology Working Group a costituire uno standard per questo tipo di ontologie e ad agire come ontologia fondazionale per le ontologie di dominio. Ma comprende anche alcune ontologie di dominio.

Nella versione nella quale sono combinate SUMO e tutte le ontologie di dominio sono gestiti 20.000 concetti e 70.000 assiomi. Gli assiomi, che riflettono per lo più nozioni di senso comune, contribuiscono a restringere le interpretazioni dei singoli concetti e definire i significati, e costituiscono l'aiuto ai software agenti per il ragionamento automatico. E’ disponibile la mappatura con i synset di WordNet, interrogabile attraverso una semplice interfaccia.

Nella porzione che contiene le entità generali, SUMO offre 1.000 concetti, 4.000 assiomi e 750 regole.

CYC (www.cyc.com) ontologia formale basata sulle acquisizioni dell'Intelligenza Artificiale, che prevede un sistema di categorie molto complesso e ha incorporato un motore per le inferenze, capace di utilizzare centinaia di modelli di deduzioni contemporaneamente. La porzione relativa ai concetti astratti e generali (la upper ontology) definisce i concetti relativi a relazioni spaziali e temporali, i concetti logici e matematici, le nozioni relative a quantità, insiemi, gruppi.

Page 9: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 9

– Numero speciale sulle ontologie: AidaInformazioni n. 1 / 2 2010

http://www.aidainformazioni.it/

– IAOA International Association for Ontology and its Applications www.iaoa.org

organizzazione internazionale il cui scopo è promuovere la ricerca interdisciplinare tra i settori della Filosofia, della Linguistica, della Logica, della Computer Science, della Library and Information Science, della Ingegneria della conoscenza

Presidente è Nicola Guarino – ISTC CNR (LOA-Laboratory for Applied Ontology)

(Istituto di Scienze e Tecnologie della Cognizione - Trento)

Page 10: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 10

CIDOC CRM Conceptual Reference Model

strumento per l’interoperabilità semantica

hygh-level ontology che riguarda un vasto dominio

convertibile in formati leggibili dalle macchine come RDF Schema, e OWL

permette di organizzare la conoscenza nei musei – integrazione della documentazione scientifica in campo archeologico

permette trasferimento e merging di dati anche tra fonti eterogenee

Page 11: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 11

Page 12: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 12

TEMPORAL ENTITIES direttamente connessi allo SPAZIO e al TEMPO

Entità denominate attraverso identificatori (Appellations) possono essere classificate attraverso l'uso di categorie

Classe E55 Type

Proprietà P127 has broader term (has narrower term).

classe E1 Entity è il Domain della P2 has type (is type of), che ha come Range E55 Typeogni classe in CRM eredita la Proprietà P2 has type,

Page 13: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 13

CIDOC CRM Conceptual Reference Model

Endurant / Perdurant

Ontologia fondazionale DOLCE

Nicola Guarino ISTC CNR (Istituto di Scienze cognifive e tecnologia) di Trento http://www.loa.istc.cnr.it/index_ita.html.

principio di modellazione generale "mono-tonicità"

Instances di E21 Person: El Greco , Re Artù

Classi Sottoclassi Proprietà

relazione IsA: Person IsA Biological Object Person è sottoclasse di Biological Object

Domain e Range delle Proprietà

ereditarietà (inheritance) delle Proprietà

Page 14: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 14

Page 15: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 15

Page 16: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 16

P67 refers to (is referred to by): E1 CRM Entity

(P67.1 has type: E55 Type)

P129 is about (is subject of): E1 CRM Entity

Page 17: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 17

Classe E89 comprende le "proposizioni che riguardano le cose reali o immaginarie“

le Instances appartenenti alla classe E89 possono essere collegate attraverso la Proprietà P129 a tutte le Instances appartenenti alla classe E1 Entity. E1 riguarda tutte le cose che sono nell’universo di discorso di CRM

Page 18: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 18

FRBRoo

FRBR object-oriented definition and mapping to FRBRER (Version 1.0.2) gennaio 2012 editors Chryssoula Bekiari, Martin Doerr, Patrick Le Boeuf

FRBR E / R: OPERA. ESPRESSIONE. MANIFESTAZIONE. ITEM

Influenza di FRBR su CIDOC CRM: creazione nel 2008 delle classiE89 Propositional object e E90 Symbolic object

Influenza di CIDOC CRM su FRBRoo: FRBRoo prevede due classi disgiunte F3 Manifestation Product Type (ciascuna copia di una pubblicazione) e F4 Manifestation Singleton (oggetto fisico unico, ad es. un manoscritto)

Concetto di “Complex work”

Page 19: Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012.

11/04/23Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali

Pagina 19

Grazie per l’attenzione

Prof. Maria Teresa Biagetti

Sapienza Università di RomaDipartimento di Scienze documentarie, linguistico-filologiche e geografiche

http://www.dolinfige.uniroma1.it/http://www.filesuso.uniroma1.it/index.php?q=user/82