ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw...

21
1 Basi di dati – Paolo Zirilli [email protected] BASI DI DATI Paolo Zirilli [email protected] Basi di dati – Paolo Zirilli [email protected] ORARI: martedì dalle 16 alle 18 aula 4 PP2 giovedì dalle 16 alle 18 aula 4 PP2 venerdì dalle 15 alle 17 aula 4 PP2 TESTI DI RIFERIMENTO: Database Management Systems , 3nd Edition,di Raghu Ramakrishnan e Johannes Gehrke, McGraw Hill,2003 (anche versione italiana) COMPLEMENTARI: Basi di dati, Modelli e linguaggi di interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli [email protected] Modalità d’esame Prova scritta: Test a risposte multiple (determina la fascia di voto) Progetto di un dbms dbms, web application, web server (potrebbe aggiungere punteggio alla prova scritta) Discussione del progetto, eventuale orale e verbalizzazione del voto Basi di dati – Paolo Zirilli [email protected] LEZIONE 1 Introduzione ai sistemi di basi di dati

Transcript of ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw...

Page 1: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

1

Basi di dati – Paolo Zirilli [email protected]

BASI DI DATI

Paolo Zirilli

[email protected]

Basi di dati – Paolo Zirilli [email protected]

• ORARI:martedì dalle 16 alle 18 aula 4 PP2 giovedì dalle 16 alle 18 aula 4 PP2venerdì dalle 15 alle 17 aula 4 PP2

• TESTI �DI RIFERIMENTO: Database Management Systems, 3nd

Edition,di Raghu Ramakrishnan e Johannes Gehrke, McGrawHill,2003 (anche versione italiana)

� COMPLEMENTARI: Basi di dati, Modelli e linguaggi di interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGrawHill,2002.

Basi di dati – Paolo Zirilli [email protected]

Modalità d’esame

• Prova scritta:– Test a risposte multiple (determina la fascia di voto)

• Progetto di un dbms– dbms, web application, web server

(potrebbe aggiungere punteggio alla prova scritta)

• Discussione del progetto, eventuale orale e verbalizzazione del voto

Basi di dati – Paolo Zirilli [email protected]

LEZIONE 1

Introduzione ai sistemi di basi di dati

Page 2: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

2

Basi di dati – Paolo Zirilli [email protected]

Organizzazione/Azienda

• utilizza un insieme di risorse e regole per lo svolgimento coordinato delle attività al fine del perseguimento degli scopi

• il sistema informativo è parte di ogni organizzazione

• il sistema informativo esegue/gestisce processi informativi (cioè i processi che coinvolgono informazioni )

Basi di dati – Paolo Zirilli [email protected]

Sistema informativo e’

• Componente (sottosistema) di una organizzazione che gestisce (acquisisce, elabora, conserva, produce) le informazioni di interesse (cioè utilizzate per il perseguimento degli scopi dell’organizzazione stessa).

• ogni organizzazione ha un sistema informativo;

– è quasi sempre di supporto ad altri

sottosistemi;

– è di solito suddiviso i n sottosistemi (in

modo gerarchico o decentrato), più o

meno fortemente integrati.

Basi di dati – Paolo Zirilli [email protected]

Risorse• le risorse di una azienda (o amministrazione):

– persone– denaro– materiali– informazioni

Funzioni di un sistema informativo

• raccolta , acquisizione delle informazioni• archiviazione , conservazione delle informazioni• elaborazione delle informazioni• distribuzione , scambio di informazioni

Basi di dati – Paolo Zirilli [email protected]

Sistemi informativi e automazione

• Il concetto di “sistema informativo” èindipendente da qualsiasi automatizzazione: – esistono organizzazioni la cui ragion d’essere

è la gestione di informazioni (p. es. servizi anagrafici e banche) e che operano da secoli

Page 3: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

3

Basi di dati – Paolo Zirilli [email protected]

Sistema Informatico

• porzione automatizzata del sistema informativo:la parte del sistema informativo che gestisce

informazioni con tecnologia informatica

Basi di dati – Paolo Zirilli [email protected]

Sistema Informatico

Sistema azienda

Sistema organizzativo

Sistema informativo

Sistema informatico

Basi di dati – Paolo Zirilli [email protected]

Sistema Informatico: • porzione automatizzata del sistema

informativo

• il sistema informatico è la parte del sistema informativo che gestisce informazioni per mezzo della tecnologia informatica.

Organizzazione/Azienda

Sistema informativo

Sistema informatico

Basi di dati – Paolo Zirilli [email protected]

Gestione delle informazioni:

• Nelle attività umane, le informazioni vengono gestite (registrate e scambiate) in forme diverse, a seconda delle necessità e capacità:– idee informali– linguaggio naturale (scritto o parlato, formale o colloquiale, in una lingua o in un’altra)– disegni, grafici, schemi– numeri– codici (anche segreti)e su vari supporti, dalla memoria umana alla carta

• Nelle attività standardizzate dei sistemi informativi complessi, sono state introdotte col tempo forme di organizzazione e codifica delle informazioni .Ad esempio, nei servizi anagrafici si è iniziato con registrazioni discorsive e sono state poi introdotte informazioni via via più precise (e in un certo senso artificiali):– nome e cognome;– estremi anagrafici;– codice fiscale;

Page 4: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

4

Basi di dati – Paolo Zirilli [email protected]

Informazioni e dati

• Nei sistemi informatici (e non solo in essi), le informazioni vengono rappresentate in modo essenziale attraverso i dati.

– informazione: notizia, dato o elemento che consente di avere conoscenza più o meno esatta di fatti, situazioni , modi di essere.

– dato: ciò che è immediatamente presente alla conoscenza,prima di ogni elaborazione; (in informatica)elementi di informazione costituiti da simboli che debbono essere elaborati.

(Vocabolario della lingua italiana, 1987)

Basi di dati – Paolo Zirilli [email protected]

Dati e informazioni

• Quindi , i dati sono fatti elementari, informazioni codificate, che hanno bisogno di essere interpretate per fornire conoscenza

• Esempio

‘Mario’ ’275’ su un foglio di carta sono due dati.

Se il foglio di carta viene fornito in risposta alla domanda “A chi mi devo rivolgere per il problema X; qual è il suo numero di telefono?”, allora i dati possono essere interpretati ed arricchire la conoscenza.

Perché i dati?

• La rappresentazione precisa di forme più ricche di informazione e conoscenza è difficile

• I dati costituiscono spesso una risorsa strategica, perché più stabili nel tempo di altre componenti (processi, tecnologie, ruoli umani)

Basi di dati – Paolo Zirilli [email protected]

Base di dati

(accezione generica, metodologica)

• Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attivitàdi un ente (azienda, ufficio, persona)

(accezione specifica, metodologica e tecnologica)

• insieme di dati gestito da un DBMS

Basi di dati – Paolo Zirilli [email protected]

Che cos'è l'informatica?

• Scienza del trattamento razionale, specialmente per mezzo di macchine automatiche, dell’informazione, considerata come supporto alla conoscenza umana e alla comunicazione (Accad. di Francia)

Due anime:– metodologica

– tecnologica

Page 5: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

5

Basi di dati – Paolo Zirilli [email protected]

Base di dati

(accezione generica, metodologica)

• Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attivitàdi un ente (azienda, ufficio, persona)

(accezione specifica, metodologica e tecnologica)

• insieme di dati gestito da un DBMS

Basi di dati – Paolo Zirilli [email protected]

Che cos’è un DBMS?

• Una collezione integrata di dati

• Modella organizzazioni del mondo reale– ad esempio studenti, corsi, docenti (Entità)

– Il “legame” tra essi ad esempio, Zirilliinsegna il corso BASDAT (Relazione)

• Un Database Management System (DBMS)

è un pacchetto software progettato per memorizzare e gestire basi di dati

Basi di dati – Paolo Zirilli [email protected]

Sistema di gestione di basi di datiDataBase Management System (DBMS)

• Sistema che gestisce collezioni di dati:

–grandi

–persistenti

– condivise

garantendo

–privatezza

–affidabilità

–efficienza

–efficacia

Basi di dati – Paolo Zirilli [email protected]

Sistema di gestione di basi di datiDataBase Management System —DBMS

Sistema (prodotto software) in grado di gestire collezioni di dati che siano (anche):

– grandi

di dimensioni (molto) maggiori della memoria centrale dei sistemi di calcolo utilizzati

– persistenti

con un periodo di vita indipendente dalle singole esecuzioni dei programmi che le utilizzano

– condivise

utilizzate da applicazioni diverse

Page 6: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

6

Basi di dati – Paolo Zirilli [email protected]

Condivisione

• Integrazione

• Ridondanza

Integrazione e condivisione permettono di ridurre la r(evitando ripetizioni ) e, di conseguenza, le possibiltà di incoerenza (o inconsistenza) fra i dati.

• privatezza

Poiché la condivisione non è mai completa i DBMS prevedono meccanismi di definizione della P dei dati e di limitazioni all’accesso (autorizzazioni).

• controllo della concorrenza

La condivisione richiede un opportuno coordinamento degli accessi: controllo della concorrenza

Basi di dati – Paolo Zirilli [email protected]

Sistema di gestione di basi di datiDataBase Management System —DBMS con quali caratteristiche:

Garantendo:

affidabilità resistenza a malfunzionamenti hardware e software

privatezza con una disciplina e un controllo degli accessi (condivisione)

efficienza utilizzando al meglio le risorse di spazio e tempo del sistema

efficacia rendendo produttive le attivitàdei suoi utilizzatori

Basi di dati – Paolo Zirilli [email protected]

Sistema di gestione di basi di datiDataBase Management System (DBMS)

• Sistema che gestisce collezioni di dati:

–grandi

–persistenti

– condivise

garantendo

–privatezza

–affidabilità

–efficienza

–efficacia

Basi di dati – Paolo Zirilli [email protected]

Page 7: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

7

Basi di dati – Paolo Zirilli [email protected] Basi di dati – Paolo Zirilli [email protected]

Problemi

• Ridondanza: – informazioni ripetute

• Rischio di incoerenza: – le versioni possono non coincidere

Basi di dati – Paolo Zirilli [email protected]

Archivi e basi di dati

Gestione

ricevimentoArchivio 2:

ricevimento

Gestione

orario lezioniArchivio 1:

orario lezioni

Basi di dati – Paolo Zirilli [email protected]

Archivi e basi di dati

Gestione

ricevimento

Gestione

orario lezioni

Base di dati

Page 8: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

8

Basi di dati – Paolo Zirilli [email protected]

Le basi di dati sono condivise

• Una base di dati e' una risorsa integrata, condivisa fra applicazioni

• conseguenze– Attivita' diverse su dati condivisi:

• meccanismi di autorizzazione

– Accessi di più utenti ai dati condivisi:• controllo della concorrenza

Basi di dati – Paolo Zirilli [email protected]

I DBMS garantiscono ... privatezza

• Si possono definire meccanismi di autorizzazione– l'utente A è autorizzato a leggere tutti i dati

e a modificare X

– l'utente B è autorizzato a leggere dati X e a modificare Y

Basi di dati – Paolo Zirilli [email protected]

Efficienza

• Si misura(come in tutti i sistemi informatici) in termini di tempo di esecuzione (tempo di risposta) e spazio di memoria (principale e secondaria).

• I DBMS, a causa della varietà di funzioni, non sono necessariamente più efficienti dei file system.

• L’efficienza è il risultato della qualità del DBMS e delle applicazioni che lo utilizzano.

Basi di dati – Paolo Zirilli [email protected]

I DBMS debbono essere...efficaci

• Cercano di rendere produttive le attivitàdei loro utilizzatori, offrendo funzionalitàarticolate, potenti e flessibili:– il corso è in buona parte dedicato ad

illustrare come i DBMS perseguono l'efficacia

Page 9: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

9

Basi di dati – Paolo Zirilli [email protected]

I DBMS garantiscono... affidabilità

• Affidabilità (per le basi di dati):– resistenza a malfunzionamenti hardware e

software

• Una base di dati è una risorsa pregiata e quindi deve essere conservata a lungo termine

• Tecnica fondamentale: – gestione delle transazioni

Basi di dati – Paolo Zirilli [email protected]

Transazione

• Insieme di operazioni da considerare indivisibile ("atomico"), corretto anche in presenza di concorrenza e con effetti definitivi

Basi di dati – Paolo Zirilli [email protected]

Le transazioni sono … atomiche

• Una sequenza di operazioni correlate:– trasferimento di fondi da un conto A ad un conto B: o

si fanno il prelevamento da A e il versamento su B o nessuno dei due

• … deve essere eseguita per intero o per niente:– o si fanno il prelevamento da A e il versamento su B o

nessuno dei due

Basi di dati – Paolo Zirilli [email protected]

Le transazioni sono … concorrenti

• L'effetto di transazioni concorrenti deve essere coerente– se due assegni emessi sullo stesso conto corrente

vengono incassati contemporaneamente

… si deve evitare di trascurarne uno

– se due agenzie rischiedono lo stesso posto (libero) suun treno

… si deve evitare di assegnarlo due volte

Page 10: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

10

Basi di dati – Paolo Zirilli [email protected]

I risultati delle transazioni sono permanenti

• La conclusione positiva di una transazione corrisponde ad un impegno (in inglese commit) a mantenere traccia del risultato in modo definitivo, anche in presenza di guasti e di esecuzione concorrente

Basi di dati – Paolo Zirilli [email protected]

DBMS vs file system

• La gestione di insiemi di dati grandi e persistenti è possibile anche attraverso sistemi più semplici — gli ordinari file system dei sistemi operativi

• I file system prevedono forme rudimentali di condivisione: "tutto o niente"

• I DBMS estendono le funzionalità dei file system, fornendo più servizi ed in maniera integrata

Basi di dati – Paolo Zirilli [email protected]

DBMS vs file system (2)

• Nei programmi tradizionali che accedono a file, ogni programma contiene una descrizione della struttura del file stesso, con i conseguenti rischi di incoerenza fra le descrizioni (ripetute in ciascun programma) e i file stessi

• Nei DBMS, esiste una porzione della base di dati (il catalogo o dizionario) che contiene una descrizione centralizzata dei dati, che può essere utilizzata dai vari programmi

Basi di dati – Paolo Zirilli [email protected]

File verso DBSM

• Necessità di spostare grandi insiemi di dati tra memoria principale e memoria secondaria (ad esempio in caso di buffering, di accessi orientati alla pagina, di indirizzamento a 32 bit, etc.)

• Codifica speciale per interrogazioni diverse

• Necessità di proteggere i dati da inconsistenza dovuta a utenti multipli che accedono i dati simultaneamente in maniera concorrente

• Ripristino da crash

• Sicurezza e controllo degli accessi

Page 11: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

11

Basi di dati – Paolo Zirilli [email protected]

Perché usare un DBMS?

• Indipendenza dei dati e accesso efficiente

• Tempo ridotto di sviluppo dell’applicazione

• Integrità dei dati e sicurezza

• Amministrazione dei dati uniforme

• Accesso concorrente, ripristino da crash

Basi di dati – Paolo Zirilli [email protected]

• Siamo partiti con il dato e l’informazione associato …..

MODELLO DEI DATI

Basi di dati – Paolo Zirilli [email protected]

Descrizioni dei dati nei DBMS

• Esistono descrizioni e rappresentazioni dei dati a livelli diversi, che permettono l’indipendenza dei dati dalla rappresentazione fisica: i programmi fanno riferimento alla struttura a livello più alto, e le rappresentazioni sottostanti possono essere modificate senza necessità di modifica dei programmi.

Basi di dati – Paolo Zirilli [email protected]

Modello dei dati

• insieme di costrutti utilizzati per organizzare i dati di interesse e descriverne la dinamica

• componente fondamentale: meccanismi di strutturazione (o costruttori di tipo)

es.:come nei linguaggi di programmazione esistono meccanismi che permettono di definire nuovi tipi, così costruttori ogni modello dei dati prevede alcuni

• ad esempio, il modello relazionale prevede il costruttore relazione, che permette di definire insiemi di record omogenei

Page 12: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

12

Basi di dati – Paolo Zirilli [email protected] Basi di dati – Paolo Zirilli [email protected]

Organizzazione dei dati in una base di datiOrario

Insegnamento Docente Aula Ora

Analisi matem. I Luigi Neri N1 8:00

Basi di dati Piero Rossi N2 9:45

Chimica Nicola Mori N1 9:45

Fisica I Mario Bruni N1 11:45

Fisica II Mario Bruni N3 9:45

Sistemi inform. Piero Rossi N3 8:00

Basi di dati – Paolo Zirilli [email protected]

Si segue un approccio sistematico seguendo una metodologia

Si articola in tre fasi distinte:

Sviluppo di un’applicazione informatica

Basi di dati – Paolo Zirilli [email protected]

Due tipi (principali) di modelli

• modelli concettuali (semantici): permettono di rappresentare i dati in modo indipendente da ogni DBMS, cercando di descrivere i concetti del mondo reale; sono utilizzati nelle fasi preliminari di progettazione; il più noto è il modello Entity-Relationship

• modelli logici: utilizzati nei DBMS esistenti per l’organizzazione dei dati; ad essi fanno riferimento i programmi, sono indipendenti dalle strutture fisiche;esempi: RELAZIONALE, reticolare, gerarchico, a oggetti

ENTITY-RELATIONSHIP

RELAZIONALE

Page 13: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

13

Basi di dati – Paolo Zirilli [email protected]

Si segue un approccio sistematico seguendo una metodologia precisa-

Si articola in tre fasi distinte:

Sviluppo di un’applicazione informatica

Basi di dati – Paolo Zirilli [email protected]

DominioApplicativo

DominioApplicativo

SCHEMA

CONCETTUALE

PROGETTAZIONE

CONCETTUALE

PROGETTAZIONE

LOGICASCHEMA LOGICO

(SQL DDL)

DBMS

(SQL DDL+DML)

DB

VALUTAZIONE

PRESTAZIONI

Progettazione

E-R

Mod. RELAZIONALE

Basi di dati – Paolo Zirilli [email protected]

ES. DI SCHEMA CONCETTUALE

Basi di dati – Paolo Zirilli [email protected]

UN Modelli di dati è:

• è una collezione (insieme) di concetti utilizzati per organizzare i dati di interesse e descriverne la struttura dei dati

• Uno schema è una descrizione di una particolare collezione di dati, che fa uso del modello di dati fornito

• Il modello di dati relazionale è il modello (logico) oggi più usato

Page 14: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

14

Basi di dati – Paolo Zirilli [email protected]

Il modello di dati relazionale

• è il modello (logico) oggi più usato

– Concetto chiave RELAZIONE:

fondamentalmente una tabella con righe e colonne

– Ogni relazione ha uno schema

che descrive le colonne, o campi

Basi di dati – Paolo Zirilli [email protected]

Tabelle:rappresentazione di relazioni

Basi di dati – Paolo Zirilli [email protected]

Schemi e istanze

In ogni base di dati esistono:

• lo schema, sostanzialmente invariante nel tempo, che ne descrive la struttura ( aspetto intensionale)

nell’esempio precedente, le intestazioni delle tabelle e degli attributi

• l’istanza, costituita dai valori attuali, che possono cambiare molto e molto rapidamente (aspetto estensionale);nell’esempio, il “corpo”di ciascuna tabella

Basi di dati – Paolo Zirilli [email protected]

Esempio: Relazione Studenti

Istanza

cardinalita’ 3grado 5

SchemaStudenti(sid:string,

nome:string, login:string,

età:integer,gpa:real)

18

19

18

età

3.2bi@ecBianchi

0072

bi@tt

ro@ec

login

3.8Bianchi

0033

3.4Rossi0012

gpanomesid

� Non e’ definito alcun ordinamento tra le n-uple/righe� Le n-uple/righe di una relazione sono distinte� Ciascuna n-upla e’ ordinata al suo interno; all’i-esimo valore corrisponde l’i-esimo dominio definito nello schema

Page 15: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

15

Basi di dati – Paolo Zirilli [email protected]

L'istanza della base di dati

Lo schema della base di datiOrario

Insegnamento Docente Aula Ora

Analisi matem. I Luigi Neri N1 8:00

Basi di dati Piero Rossi N2 9:45

Chimica Nicola Mori N1 9:45

Fisica I Mario Bruni N1 11:45

Fisica II Mario Bruni N3 9:45

Sistemi inform. Piero Rossi N3 8:00

Basi di dati: schema e istanza

Basi di dati – Paolo Zirilli [email protected]

Due tipi (principali) di modelli

• modelli logici

• modelli concettuali (semantici)

Basi di dati – Paolo Zirilli [email protected]

Modelli logici

• Adottati nei DBMS esistenti per l’organizzazione dei dati– utilizzati dai programmi

– indipendenti dalle strutture fisiche

• esempi: relazionale, reticolare, gerarchico, a oggetti

Basi di dati – Paolo Zirilli [email protected]

Modelli concettuali

• Permettono di rappresentare i dati in modo indipendente da ogni sistema– cercano di descrivere i concetti del mondo

reale

– sono utilizzati nelle fasi preliminari di progettazione

• Il più diffuso è il modello Entity-Relationship

Page 16: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

16

Basi di dati – Paolo Zirilli [email protected]

Architettura (semplificata) di un DBMS

BD

Schema logico

Schema interno

utente

Basi di dati – Paolo Zirilli [email protected]

Architettura semplificata di un DBMS: schemi

• schema logico: descrizione della base di dati nel modello logico (ad esempio, mod. Relazionale (la struttura della tabella))

• schema interno (o fisico): rappresentazione dello schema logico per mezzo di strutture memorizzazione (file; ad esempio, record con puntatori, ordinati in un certo modo)

Basi di dati – Paolo Zirilli [email protected]

Indipendenza dei dati

• Il livello logico è indipendente da quello fisico:– una tabella è utilizzata nello stesso modo

qualunque sia la sua realizzazione fisica (che può anche cambiare nel tempo)

• In questo corso vedremo il livello logico e cenni di quello fisico

Basi di dati – Paolo Zirilli [email protected]

Architettura standard (ANSI/SPARC)

a tre livelli per DBMS

BD

Schema logico

Schema

esterno

Schema interno

Schema

esterno

Schema

esterno

utenteutente

utenteutente utente

Page 17: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

17

Basi di dati – Paolo Zirilli [email protected]

Architettura ANSI/SPARC: schemi

schema logico: descrizione dell’intera base di dati nel modello logico “principale” del DBMS

Schema interno (o fisico): rappresentazione dello schema logico per mezzo di strutture fisiche di memorizzazione

schema esterno: descrizione di parte della base di dati in un modello logico (“VISTE” parziali, derivate, anche in modelli diversi)

Basi di dati – Paolo Zirilli [email protected]

Una vista

Corso AulaDocente

RossiBasi di dati DS3

BruniReti N3

NeriSistemi N3

BruniControlli G

Corsi

Nome PianoEdificio

OMIDS1 Terra

PincherleG Primo

OMIN3 Terra

Aule

CorsiSedi Corso Aula

Reti N3

Sistemi N3

Controlli G

PianoEdificio

OMI Terra

Pincherle Primo

OMI Terra

Basi di dati – Paolo Zirilli [email protected]

Indipendenza dei dati

• conseguenza della articolazione in livelli

• l’accesso avviene solo tramite il livello esterno (che può coincidere con il livello logico)

• due forme: – indipendenza fisica

– indipendenza logica

Basi di dati – Paolo Zirilli [email protected]

Indipendenza fisica

• il livello logico e quello esterno sono indipendenti da quello fisico – una relazione è utilizzata nello stesso modo

qualunque sia la sua realizzazione fisica

– la realizzazione fisica può cambiare senza che debbano essere modificati i programmi

Page 18: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

18

Basi di dati – Paolo Zirilli [email protected]

Indipendenza logica

• il livello esterno è indipendente da quello logico

• aggiunte o modifiche alle viste non richiedono modifiche al livello logico

• modifiche allo schema logico che lascino inalterato lo schema esterno sono trasparenti

Basi di dati – Paolo Zirilli [email protected]

L’architettura a livelli garantisce: Indipendenza dei dati*

• Le applicazioni sono separate dalla struttura e dalla memorizzazione dei dati

• Indipendenza logica dei dati: protezione dalle modifiche alla struttura logica dei dati

• Indipendenza fisica dei dati: protezione dalle modifiche alla struttura fisica dei dati

* Uno dei più importanti benefici dell’uso di un DBMS!

Basi di dati – Paolo Zirilli [email protected]

Esecuzione Concorrente di Controllo di transazioni

• L’esecuzione concorrente di programmi utente è essenziale per ottenere buone prestazioni dal DBMS– Poiché gli accessi al disco sono frequenti, e

relativamente lenti, è importante tenere occupata la CPU lavorando su diversi programmi utente concorrentemente

• Le azioni interallacciate di diversi programmi utente possono portare a inconsistenza: ad esempio, un assegno viene pagato mentre viene calcolato il bilancio del conto corrente

• Il DBMS garantisce che tali problemi non si presentino: ogni utente può immaginare di essere l’unico utente del sistema

Basi di dati – Paolo Zirilli [email protected]

DEF:Transazione: l’esecuzione di un programma sulla base di dati

• Il concetto chiave è la transazione, che è una sequenza atomica di azioni sulla base di dati (letture/scritture)

• Ciascuna transazione, eseguita completamente, deve lasciare la base di dati in uno stato consistente se esso era consistente quando la transazione ha avuto inizio– Gli utenti possono specificare alcuni semplici vincoli

di integrità sui dati, e il DBMS garantirà tali vincoli

– Al di là di questo, il DBMS non capisce realmente la semantica dei dati (ad esempio non capisce come sono calcolati gli interessi su un conto bancario)

– Quindi, garantire che una transazione (eseguita da sola) conservi la consistenza dei dati è, in ultima analisi, responsabilità dell’utente!

Page 19: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

19

Basi di dati – Paolo Zirilli [email protected]

Scheduling di transazioni concorrenti

• Il DBMS garantisce che l’esecuzione di {T1, ..., Tn} è equivalente a una qualche esecuzione seriale T1’... Tn’– Prima di leggere/scrivere un oggetto, una

transazione richiede un lock sull’oggetto, e aspetta finché il DBMS fornisce tale lock. Tutti i lock sono rilasciati al termine della transazione (protocollo di locking Strict 2PL)

– Idea: se una azione di Ti (ad esempio, scrivere X) influenza Tj (che magari legge X), una tra Ti e Tj, diciamo Ti, otterrà il blocco su X per prima, e Tjdovrà aspettare fino al termine di Ti; ciò in pratica dà un ordinamento alle transazioni

– Che succede se Tj ha già un blocco su Y e Ti in seguito richiede un blocco su Y? (Deadlock!) Ti o Tjdeve essere interrotta e fatta ripartire!

Basi di dati – Paolo Zirilli [email protected]

Garantire l’atomicità

• Il DBMS garantisce l’atomicità (proprietàtutto-o-niente) anche se il sistema va in crash durante una transazione

• Idea: mantenere un log (una storia) di tutte le azioni effettuate dal DBMS nell’eseguire un insieme di transazioni:– prima che una modifica sia fatta alla base di dati, la

voce corrispondente del log viene messa al sicuro (protocollo WAL: spesso il supporto del sistema operativo in questo ambito è inadeguato)

– dopo un crash, gli effetti delle transazioni eseguite parzialmente sono annullati usando il log (grazie al WAL, se una voce del log non era stata salvata prima del crash, le corrispondenti modifiche alla base di dati non erano state apportate!)

Basi di dati – Paolo Zirilli [email protected]

Il log

• Le seguenti azioni sono registrate nel log:– Ti scrive un oggetto: il vecchio valore e il nuovo valore

• Il record nel log deve essere salvato su disco prima della pagina modificata

– Ti termina/si interrompe: un record nel log registra tale azione

• I record nel log sono collegati tramite l’ID della transazione, così che sia semplice annullare una transazione specificata (ad esempio per risolvere un deadlock)

• Il log è spesso duplicato e archiviato in una memoria “stabile”

• Tutte le attività connesse al log (e di fatto tutte le attivitàconnesse al controllo di concorrenza, come blocco/sblocco, gestione dei deadlock, ecc) sono gestite dal DBMS in maniera trasparente

Basi di dati – Paolo Zirilli [email protected]

Le basi di dati per...

• Utenti finali e produttori di DBMS

• Programmatori di applicazioni per DBMS– Ad esempio abili gestori di siti Web

• Amministratori di basi di dati (DBA)– Progettano gli schemi logico/fisico

– Gestiscono la sicurezza e le autorizzazioni

– Gestiscono disponibilità dei dati, ripristino da crash

– Modificano lo schema della base di dati con l’evolversi delle necessità

Page 20: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

20

Basi di dati – Paolo Zirilli [email protected]

Struttura di un DBMS

• Un tipico DBMS ha una struttura stratificata

• La figura non mostra le componenti di controllo di concorrenza e di ripristino

• Questa è una tra le possibili architetture; ciascun sistema ha le proprie varianti

Ottimizzazione ed esecuzione

delle interrogazioni

Operatori relazionali

File e metodi di accesso

Gestione del buffer

Gestione dello spazio su disco

DB

Questi strati

devono tenere

in considerazione

il controllo di

concorrenza e

il ripristino

Basi di dati – Paolo Zirilli [email protected]

Sommario

• Un DBMS è usato per mantenere e interrogare grandi insiemi di dati

• Tra i benefici, il ripristino dai crash del sistema, l’accesso concorrente, il rapido sviluppo di applicazioni, l’integrità dei dati e la sicurezza

• I livelli di astrazione portano all’indipendenza dei dati

• Un DBMS tipicamente ha un’architettura stratificata

• I DBA svolgono un lavoro di responsabilità …

• La ricerca e sviluppo nei DBMS è una della piùvaste ed eccitanti aree dell’informatica

Basi di dati – Paolo Zirilli [email protected]

Esercizi su

Basi di dati e DBMS

Basi di dati – Paolo Zirilli [email protected]

• Quali delle seguenti affermazioni sono vere?

– l'indipendenza dei dati permette di scrivere programmi senza conoscere le strutture fisiche dei dati

– l'indipendenza dei dati permette di modificare le strutture fisiche dei dati senza dover modificare i programmi che accedono alla base di dati

– l'indipendenza dei dati permette di scrivere programmi conoscendo solo lo schema concettuale della BD

– l'indipendenza dei dati permette di formulare interrogazioni senza conoscere le strutture fisiche

Page 21: ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw Hill,2002. Basi di dati – Paolo Zirilli p.zirilli@gmail.com Modalità d’esame • Prova

21

Basi di dati – Paolo Zirilli [email protected]

• Quali delle seguenti affermazioni sono vere?

– il fatto che le basi di dati siano condivise favorisce l'efficienza dei programmi che le utilizzano

– il fatto che le basi di dati siano condivise permette di ridurre ridondanze e inconsistenze

– il fatto che le basi di dati siano persistenti ne garantisce l'affidabilità

– il fatto che le basi di dati siano persistenti favorisce l'efficienza dei programmi

– il fatto che le basi di dati siano condivise rende necessaria la gestione della privatezza e delle autorizzazioni

Basi di dati – Paolo Zirilli [email protected]

• Quali delle seguenti affermazioni sono vere?

– la distinzione fra DDL e DML corrisponde alla distinzione fra schema e istanza

– le istruzioni DML permettono di interrogare la base di dati ma non di modificarla

– le istruzioni DDL permettono di specificare la struttura della base di dati ma non di modificarla

– non esistono linguaggi che includono sia istruzioni DDL sia istruzioni DML

– SQL include istruzioni DML e DDL

– le istruzioni DML permettono di interrogare la base di dati e di modificarla