Cap1 2 3_intro_astrazioni

Post on 07-Dec-2014

224 views 0 download

description

 

Transcript of Cap1 2 3_intro_astrazioni

1

Corso sul tema:Concetti rilevanti

nella modellazione concettuale dei dati

al CSI Piemonte

C. BatiniUniversita’ degli Studi di Milano

BicoccaR. Grosso - CSI Piemonte

2

Contenuti del corso – primo giorno

• 0. Dott. Bonello – Introduzione al progetto • 1. Introduzione e scopi del corso • 2. Le astrazioni utilizzate nella modellazione

concettuale– Classificazione– Generalizzazione– Aggregazione– Altre astrazioni– Potere espressivo delle astrazioni– I modelli concettuali– Le ontologie

• 3. Il modello Entita’ Relazione – Concetti rilevanti nel modello– Relazioni tra astrazioni e concetti nel modello ER – Vincoli di integrita’

3

Contenuti del corso – primo giorno

• 4. Principi di progettazione concettuale – La progettazione top down– La progettazione bottom up– L’astrazione – L’integrazione – L’integrazione/astrazione– La documentazione di schemi: il repository

di schemi concettuali

• Esercizi e studi di caso semplici

4

Contenuti del corso – secondo giorno

• 5. L’ attivita’ di ricostruzione del contenuto concettuale della PA Piemontese

• 5.1 La conoscenza disponibile – Gli schemi di base– Gli schemi astratti – Le gerarchie di concetti

• 5.2 La metodologia adottata– Costruzione degli schemi di entita’ – Aggiunta delle gerarchie di generalizzazione– Ricostruzione delle relazioni – Attivita’ di verifica

5

Contenuti del corso – terzo giorno

• 6. Approfondimento sugli scopi della modellazione concettuale– Per comprendere la natura della informazione– Per confrontare il contenuto informativo di

diverse basi di dati – Per trovare ridondanze– Per trovare incoerenze – Per riconciliare le diverse rappresentazioni della

informazione– Per costruire una architettura federata della

informazione

6

1. Introduzione e scopi del corso

7

Scopi

• Utilizzare la progettazione concettuale come strumento per il proprio lavoro

• Comprendere I diversi possibili utilizzi della progettazione concettuale, specialmente nei sistemi informativi cooperativi, come quello in corso di creazione da parte del CSI Piemente per la PA Piemontese.

• Partecipare attivamente nel processo di generazione del Repository di schemi concettuali della PA Piemontese, a partire dal Repository della PA Centrale Italiana.

8

• 2. Le astrazioni

9

Dato, informazione, conoscenza

• Dato - Rappresentazione codificata di un frammento di realta’ osservata

• Es. 35• Informazione - Significato o intepretazione

associata al dato • Es 35 e’ l’ eta’ di Giovanni• Conoscenza – Informazione che si puo’

estrarre mediante ragionamento dai dati• Es Tutti gli uomini sono mortali, e Socrate e’

un uomo. • Quindi Socrate e’ mortale

10

Conoscenza, informazione, dati, astrazioni(da una presentazione della societa’ Exeura)

11

Perche’ iniziare con le astrazioni?

• Per abituarci a pensare che nella attivita’ di modellazione possiamo usare un vasto insieme di strumenti e linguaggi, e che non esistono solo le categorie di modellazione del proprio modello usuale.

• Per scegliere ogni volta le categorie di astrazione piu’ utili per un certo scopo.

• Per capire quali sono le relazioni trai vari modelli che utilizziamo.

12

Contenuti

• Definizione di astrazione • Un esempio di astrazione• Un insieme di astrazioni• Le ontologie• Confronto tra modelli

13

Le astrazioni

• Una astrazione e’ un procedimento concettuale per mezzo del quale creiamo un concetto piu’ generale (e in tel senso piu’ astratto) a partire da concetti piu’ elementari (e in tal senso piu’ concreti), rimuovendo dalla descrizione del concetto gli aspetti di dettaglio e particolari e mettendo in evidenza gli aspetti comuni e generali.

• I diversi modelli proposti per i dati a livello concettuale e logico utilizzando, talvolta implicitamente, un vasto insieme di astrazioni.

14

Ad esempio

• La relationship nel modello Entita’ Relazione, come ad esempio Persona Vive in Citta’, e la relazione nel modello relazionale, come ad esempio,

• Vive (Codice Fiscale, Codice Citta’)

• Altro esempio di astrazione diffusamente utilizzata nei modelli e’ la associazione, che a partire da due concetti permette di crearne uno nuovo, e che esprime una connessione strutturale tra i due concetti di partenza.

• La relationship puo’ essere vista come caso particolare di associazione

15

• Un insieme di astrazioni

16

La classificazione

Studente

A partire da un insieme di oggetti della realta’ di interesse (ad esempiogli studenti di una universita’), crea una classe di cui gli oggetti sonotutte e sole le istanze

Istanza della Classe Studente

17

La generalizzazione

Persona

A partire da un insieme di classi, crea una nuova classe le cui istanze sono l’unione delle istanze delle classi di partenza. Nell’ esempio, le istanze della Classe Persona sono la unione delle istanze delle classi Uomo e Donna

Uomo Donna

18

La aggregazione

Data

A partire da un insieme di classi, crea una nuova classe di cui le classi di partenza sono parti componenti. Nell’esempio, la classe Data ha come parti componenti le classi Giorno, Mese, Anno

Giorno AnnoMese

19

Materializzazione

• Materializzazione, mette in relazione una classe astratta di oggetti (es. Modelli di automobili) con un insieme di oggetti piu’ concreti (es. Singole Automobili); a ogni oggetto della classe astratta corrisponde un sottoinsieme di oggetti della classe piu’ concreta.

• Es la classe Fiat Panda con l’insieme di tutte le singole Panda che sono ancora in giro.

20

Raggruppamento

• Mette in relazione una classe di oggetti elementari (es. Giocatori) e una classe di gruppi (di oggetti elementari) (es. Squadre).

• Es. Giocatori della serie A con Milan, Juventus, Inter.

• E’ differente rispetto alla materializzazione, nel senso che in questa si mettono in relazione oggetti a diverso livello di astrazione (classe verso oggetti), nel raggruppamento gli oggetti sono allo stesso livello di astrazione (classe verso classe).

21

Raffinamento

• Mette in relazione una classe C1 con un insieme di classi CR1, .., Crn.

• La classe C1 e le classi CR1, .., Crn rappresentano la stessa realta’ di interesse, C1 in modo piu’ astratto, e CR1, .., Crn in modo piu’ concreto.

• Esempio i concetti Residente, Persona, Citta’, sono un raffinamento del concetto di Residenza.

• Si dice anche che Residenza e’ astrazione di Residente, Persona, Citta’.

22

Ruolo

• Un Ruolo mette in relazione una classe di oggetti (es Persone) con una classe di loro collocazioni organizzative o procedurali (es. Impiegati), in modo da poter descrivere stati dinamici per la classe di oggetti.

• Es. Persona del CSI verso Impiegato o Dirigente o Tecnico, quando lavora,

• Padre o Madre o Single o altro quando e’ in famiglia.

23

Metadati – Attributi dublin core - 1

• I metadati sono ‘tutti gli elementi necessari a descrivere una risorsa’,

• Noi siamo interessati alla risorsa dato o documento.

• Vari standard per i metadati, il piu’ importante e’ il Dublin core.

• Ogni elemento del Dublin Core è definito utilizzando un insieme di dieci attributi dello standard ISO/IEC 11179 [ISO11179] per la descrizione dei dati. Gli attributi sono:

• Nome – Etichetta assegnata al dato • Identificatore – Identificativo univoco assegnato al

dato • Versione – Versione del dato • Registrazione di autorità – Entità autorizzata a

registrare il dato

24

Metadati – Attributi dublin core - 2

• Lingua – Lingua nella quale il dato è indicato

• Definizione – Indicazione che rappresenta chiaramente il concetto e la natura essenziale del dato.

• Obbligatorietà – Indica se il dato è richiesto sempre o solo in alcuni casi (contiene un valore)

• Tipo di dato – Indica la tipologia del dato che può essere rappresentato nel valore del dato stesso

• Occorrenza massima – Indica un limite alla ripetibilità del dato

• Commento – Un’osservazione che concerne l’applicazione del dato

• Essi si possono estendere con parole chiave.

25

Elementi Dublin core - 1• Elemento: Titolo

– Nome: Titolo – Identificatore: Title – Definizione: Un nome dato alla risorsa – Commento: In particolare, un Title sarà un

nome con il quale la risorsa è formalmente conosciuta.

• Elemento: Creatore • Elemento: Soggetto• Elemento: Descrizione• Elemento: Editore

26

Elementi Dublin core - 2

• Elemento: Autore di contributo subordinato• Elemento: Data • Elemento: Tipo • Elemento: Formato• Elemento: Identificatore• Elemento: Fonte • Elemento: Lingua• Elemento: Relazione• Elemento: Copertura• Elemento: Gestione dei diritti

27

Le ontologie

• N. Guarino ‘An ontology refers to an engineering artifact, constituted by a specific vocabulary used to describe a certain reality, plus a set of explicit assumptions regarding the intended meaning of the vocabulary words'

28

Tante definizioni di ontologie

• Ontologie = Modello ER con generalizzazioni + Thesuarus + funzioni + proposizioni logiche

• Un Thesaurus e’ un elenco di termini per ciascuno dei quali si definiscono sinonimi, omonimi, iponimi (cioe’ sottoinsiemi)

• Una funzione e’ una corrispondenza tra domini• Es Eta’ media e’ una funzione definita tra Eta’

e i numeri decimali, sommando le Eta’ e dividendo per il loro numero.

• Una proposizione logica e’ una proprieta’ espressa in un linguaggio logico

• Es. Ogni impiegato guadagna meno del suo capo

29

Vantaggi delle ontologie

• Rappresentazione “veramente” formale• Possibilita’ di costruire ragionamenti, esempi:• L’ontologie e’ consistente, vi sono cioe’

proprieta’ contraddittorie definite sullo schema?• Esempio di proprieta’ contraddittorie:

– 1. Ogni impiegato guadagna meno del suo capo– 2. Esistono impegati che guadagnano piu’ dei loro

capi.

• Date due ontologie, quali sono i conflitti di rappresentazione dei concetti descritti in esse?

• Esempio: In una ontologia colore e’ attributo, nell’altra e’ entita’.

30

Discussione introduttiva sulle ontologie Guarino - 1

• What kinds of ontologies do we need? This is still an open issue. In most practical applications, ontologies appear as simple taxonomic structures of primitive or composite terms together with associated definitions.

• These are the so-called lightweight ontologies, used to represent semantic relationships among terms in order to facilitate content-based access to the (Web) data produced by a given community.

• In this case, the intended meaning of primitive terms is more or less known in advance by the members of such community.

• Hence, in this case, the role of ontologies is more that of supporting terminological services (inferences based on relationships among terms – usually just taxonomic relationships) rather than explaining or defining their intended meaning.

• Es. Allegato verso Documento, o Agricoltore verso • Pastore

31

Esempio di ontologia per la PA:l’ontologia dei servizi per le imprese

Esempio di alberatura

sottoinsiemi

Classi in gerarchia di generalizzazione

32

Discussione introduttiva sulle ontologie Guarino - 2

• On the other hand, however, the need to establishing precise agreements as to the meaning of terms becomes crucial as soon as a community of users evolves, or multicultural and multilingual communities need to exchange data and services.

• Es. faccia il buono alla cassa• To capture (or at least approximate) such subtle

distinctions we need an explicit representation of the so-called ontological commitments about the meaning of terms, in order to remove terminological and conceptual ambiguities. A rigorous logical axiomatisation seems to be unavoidable in this case, as it accounts not only for the relationships between terms, but – most importantly – for the formal structure of the domain to be represented.

• This allows one to use axiomatic ontologies not only to facilitate meaning negotiation among agents, but also to clarify and model the negotiation process itself, and in general the structure of interaction.

33

Modello

• Insieme di categorie di astrazione utili per determinati scopi

• Nelle basi di dati: descrivere, sviluppare applicazione, accedere ai dati

34

Ontologie = Modello ER con gen. + Thesuarus + funzioni + proposizioni logiche

Modello Entita’ Relazione con generalizzazioni

Le ontologie e il modello ER

Modello Entita’ Relazione originario

35

In un modello noi utilizziamo in genere diverse astrazioni

cognome

nome

data di nascitacodice fiscale

sesso

matricolastipendio

ufficio

Lavoratore dipendentepubblico

Lavoratore

Dipendente di uffici centrali

Dipendente di uffici periferici

Candidato Aspirante ad impiego

pubblico

Generalizzazione

Aggregazione

Citta’Risiede

Associazione

Nome

Regione

Classificazione

36

Uno schema nel modello relazionale

NOME- CODICE NUMEROLIBRERIA LIBRO COPIEDISPONIBILITA'

TITOLO COGNOMESCRITTO

AUTORE CODICE NOME COGNOME NAZIONALITA' SESSO

LIBRO CODICE-L TITOLO EDITORE PAGINE

LIBRERIA PARTITA-IVA NOME INDIRIZZO CITTA'

37

Un’ultima proposta

• Corpus based representation• Nasce dalla constatazione della pratica impossibilita’

di costruire schemi concettuali / ontologie integrate di grandi domini.

• Una corpus based representation e’ un insieme di frammenti di schemi/ontologie + un insieme di statistiche/ analisi su essi, in cui sono volutamente assenti schemi integrati globali o parziali.

• Es. Quale e’ la frequenza dei termini?• Persona o sottocategorie 500• Impresa o sottocategorie 300• Agricoltore 20• Spazzacamino 1

38

Struttura di un corpus based system

39

Confronto tra modelli

Comprensibilita’

Eseguibilita’ in un DBMS

Potenza espressiva

Modello ER con generalizzazioni

Modello relazionaleOntologie

OntologieModello ER con generalizzazioni

Modello relazionale

Modello relazionale

Modello ER con generalizzazioni

Ontologie

Basso Alto

Costo di Produzione

Modello ER con generalizzazioni

Modello relazionale

Ontologie

40

Utilita’ per I nostri scopi

Comprensibilita’

- +

Eseguibilita’ in un DBMS

Potenza Espressiva

- +

Modello ER con generalizzazioni

Modello relazionaleOntologie

OntologieModello ER con generalizzazioni

Modello relazionale

Modello relazionale

Modello ER con generalizzazioni

Ontologie

Basso Alto

Costo di Produzione

+ - Modello ER con generalizzazioni

Modello relazionale

Ontologie

41

Strategia complessiva di utilizzo di modelli al CSI

Conoscenza da modellare

Efficacia del modello

Ontologie

Modello ERcon genera-lizzazioni

Modello ERoriginale

Modellorelazionale

Dati e conoscenza core bussiness