ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw...
Transcript of ORARI BASI DI DATI - uniroma2.it · interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGraw...
1
Basi di dati – Paolo Zirilli [email protected]
BASI DI DATI
Paolo Zirilli
Basi di dati – Paolo Zirilli [email protected]
• ORARI:martedì dalle 16 alle 18 aula 4 PP2 giovedì dalle 16 alle 18 aula 4 PP2venerdì dalle 15 alle 17 aula 4 PP2
• TESTI �DI RIFERIMENTO: Database Management Systems, 3nd
Edition,di Raghu Ramakrishnan e Johannes Gehrke, McGrawHill,2003 (anche versione italiana)
� COMPLEMENTARI: Basi di dati, Modelli e linguaggi di interrogazione, Atzeni,Ceri,Paraboschi Torlone,McGrawHill,2002.
Basi di dati – Paolo Zirilli [email protected]
Modalità d’esame
• Prova scritta:– Test a risposte multiple (determina la fascia di voto)
• Progetto di un dbms– dbms, web application, web server
(potrebbe aggiungere punteggio alla prova scritta)
• Discussione del progetto, eventuale orale e verbalizzazione del voto
Basi di dati – Paolo Zirilli [email protected]
LEZIONE 1
Introduzione ai sistemi di basi di dati
2
Basi di dati – Paolo Zirilli [email protected]
Organizzazione/Azienda
• utilizza un insieme di risorse e regole per lo svolgimento coordinato delle attività al fine del perseguimento degli scopi
• il sistema informativo è parte di ogni organizzazione
• il sistema informativo esegue/gestisce processi informativi (cioè i processi che coinvolgono informazioni )
Basi di dati – Paolo Zirilli [email protected]
Sistema informativo e’
• Componente (sottosistema) di una organizzazione che gestisce (acquisisce, elabora, conserva, produce) le informazioni di interesse (cioè utilizzate per il perseguimento degli scopi dell’organizzazione stessa).
• ogni organizzazione ha un sistema informativo;
– è quasi sempre di supporto ad altri
sottosistemi;
– è di solito suddiviso i n sottosistemi (in
modo gerarchico o decentrato), più o
meno fortemente integrati.
Basi di dati – Paolo Zirilli [email protected]
Risorse• le risorse di una azienda (o amministrazione):
– persone– denaro– materiali– informazioni
Funzioni di un sistema informativo
• raccolta , acquisizione delle informazioni• archiviazione , conservazione delle informazioni• elaborazione delle informazioni• distribuzione , scambio di informazioni
Basi di dati – Paolo Zirilli [email protected]
Sistemi informativi e automazione
• Il concetto di “sistema informativo” èindipendente da qualsiasi automatizzazione: – esistono organizzazioni la cui ragion d’essere
è la gestione di informazioni (p. es. servizi anagrafici e banche) e che operano da secoli
3
Basi di dati – Paolo Zirilli [email protected]
Sistema Informatico
• porzione automatizzata del sistema informativo:la parte del sistema informativo che gestisce
informazioni con tecnologia informatica
Basi di dati – Paolo Zirilli [email protected]
Sistema Informatico
Sistema azienda
Sistema organizzativo
Sistema informativo
Sistema informatico
Basi di dati – Paolo Zirilli [email protected]
Sistema Informatico: • porzione automatizzata del sistema
informativo
• il sistema informatico è la parte del sistema informativo che gestisce informazioni per mezzo della tecnologia informatica.
Organizzazione/Azienda
Sistema informativo
Sistema informatico
Basi di dati – Paolo Zirilli [email protected]
Gestione delle informazioni:
• Nelle attività umane, le informazioni vengono gestite (registrate e scambiate) in forme diverse, a seconda delle necessità e capacità:– idee informali– linguaggio naturale (scritto o parlato, formale o colloquiale, in una lingua o in un’altra)– disegni, grafici, schemi– numeri– codici (anche segreti)e su vari supporti, dalla memoria umana alla carta
• Nelle attività standardizzate dei sistemi informativi complessi, sono state introdotte col tempo forme di organizzazione e codifica delle informazioni .Ad esempio, nei servizi anagrafici si è iniziato con registrazioni discorsive e sono state poi introdotte informazioni via via più precise (e in un certo senso artificiali):– nome e cognome;– estremi anagrafici;– codice fiscale;
4
Basi di dati – Paolo Zirilli [email protected]
Informazioni e dati
• Nei sistemi informatici (e non solo in essi), le informazioni vengono rappresentate in modo essenziale attraverso i dati.
– informazione: notizia, dato o elemento che consente di avere conoscenza più o meno esatta di fatti, situazioni , modi di essere.
– dato: ciò che è immediatamente presente alla conoscenza,prima di ogni elaborazione; (in informatica)elementi di informazione costituiti da simboli che debbono essere elaborati.
(Vocabolario della lingua italiana, 1987)
Basi di dati – Paolo Zirilli [email protected]
Dati e informazioni
• Quindi , i dati sono fatti elementari, informazioni codificate, che hanno bisogno di essere interpretate per fornire conoscenza
• Esempio
‘Mario’ ’275’ su un foglio di carta sono due dati.
Se il foglio di carta viene fornito in risposta alla domanda “A chi mi devo rivolgere per il problema X; qual è il suo numero di telefono?”, allora i dati possono essere interpretati ed arricchire la conoscenza.
Perché i dati?
• La rappresentazione precisa di forme più ricche di informazione e conoscenza è difficile
• I dati costituiscono spesso una risorsa strategica, perché più stabili nel tempo di altre componenti (processi, tecnologie, ruoli umani)
Basi di dati – Paolo Zirilli [email protected]
Base di dati
(accezione generica, metodologica)
• Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attivitàdi un ente (azienda, ufficio, persona)
(accezione specifica, metodologica e tecnologica)
• insieme di dati gestito da un DBMS
Basi di dati – Paolo Zirilli [email protected]
Che cos'è l'informatica?
• Scienza del trattamento razionale, specialmente per mezzo di macchine automatiche, dell’informazione, considerata come supporto alla conoscenza umana e alla comunicazione (Accad. di Francia)
Due anime:– metodologica
– tecnologica
5
Basi di dati – Paolo Zirilli [email protected]
Base di dati
(accezione generica, metodologica)
• Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attivitàdi un ente (azienda, ufficio, persona)
(accezione specifica, metodologica e tecnologica)
• insieme di dati gestito da un DBMS
Basi di dati – Paolo Zirilli [email protected]
Che cos’è un DBMS?
• Una collezione integrata di dati
• Modella organizzazioni del mondo reale– ad esempio studenti, corsi, docenti (Entità)
– Il “legame” tra essi ad esempio, Zirilliinsegna il corso BASDAT (Relazione)
• Un Database Management System (DBMS)
è un pacchetto software progettato per memorizzare e gestire basi di dati
Basi di dati – Paolo Zirilli [email protected]
Sistema di gestione di basi di datiDataBase Management System (DBMS)
• Sistema che gestisce collezioni di dati:
–grandi
–persistenti
– condivise
garantendo
–privatezza
–affidabilità
–efficienza
–efficacia
Basi di dati – Paolo Zirilli [email protected]
Sistema di gestione di basi di datiDataBase Management System —DBMS
Sistema (prodotto software) in grado di gestire collezioni di dati che siano (anche):
– grandi
di dimensioni (molto) maggiori della memoria centrale dei sistemi di calcolo utilizzati
– persistenti
con un periodo di vita indipendente dalle singole esecuzioni dei programmi che le utilizzano
– condivise
utilizzate da applicazioni diverse
6
Basi di dati – Paolo Zirilli [email protected]
Condivisione
• Integrazione
• Ridondanza
Integrazione e condivisione permettono di ridurre la r(evitando ripetizioni ) e, di conseguenza, le possibiltà di incoerenza (o inconsistenza) fra i dati.
• privatezza
Poiché la condivisione non è mai completa i DBMS prevedono meccanismi di definizione della P dei dati e di limitazioni all’accesso (autorizzazioni).
• controllo della concorrenza
La condivisione richiede un opportuno coordinamento degli accessi: controllo della concorrenza
Basi di dati – Paolo Zirilli [email protected]
Sistema di gestione di basi di datiDataBase Management System —DBMS con quali caratteristiche:
Garantendo:
affidabilità resistenza a malfunzionamenti hardware e software
privatezza con una disciplina e un controllo degli accessi (condivisione)
efficienza utilizzando al meglio le risorse di spazio e tempo del sistema
efficacia rendendo produttive le attivitàdei suoi utilizzatori
Basi di dati – Paolo Zirilli [email protected]
Sistema di gestione di basi di datiDataBase Management System (DBMS)
• Sistema che gestisce collezioni di dati:
–grandi
–persistenti
– condivise
garantendo
–privatezza
–affidabilità
–efficienza
–efficacia
Basi di dati – Paolo Zirilli [email protected]
7
Basi di dati – Paolo Zirilli [email protected] Basi di dati – Paolo Zirilli [email protected]
Problemi
• Ridondanza: – informazioni ripetute
• Rischio di incoerenza: – le versioni possono non coincidere
Basi di dati – Paolo Zirilli [email protected]
Archivi e basi di dati
Gestione
ricevimentoArchivio 2:
ricevimento
Gestione
orario lezioniArchivio 1:
orario lezioni
Basi di dati – Paolo Zirilli [email protected]
Archivi e basi di dati
Gestione
ricevimento
Gestione
orario lezioni
Base di dati
8
Basi di dati – Paolo Zirilli [email protected]
Le basi di dati sono condivise
• Una base di dati e' una risorsa integrata, condivisa fra applicazioni
• conseguenze– Attivita' diverse su dati condivisi:
• meccanismi di autorizzazione
– Accessi di più utenti ai dati condivisi:• controllo della concorrenza
Basi di dati – Paolo Zirilli [email protected]
I DBMS garantiscono ... privatezza
• Si possono definire meccanismi di autorizzazione– l'utente A è autorizzato a leggere tutti i dati
e a modificare X
– l'utente B è autorizzato a leggere dati X e a modificare Y
Basi di dati – Paolo Zirilli [email protected]
Efficienza
• Si misura(come in tutti i sistemi informatici) in termini di tempo di esecuzione (tempo di risposta) e spazio di memoria (principale e secondaria).
• I DBMS, a causa della varietà di funzioni, non sono necessariamente più efficienti dei file system.
• L’efficienza è il risultato della qualità del DBMS e delle applicazioni che lo utilizzano.
Basi di dati – Paolo Zirilli [email protected]
I DBMS debbono essere...efficaci
• Cercano di rendere produttive le attivitàdei loro utilizzatori, offrendo funzionalitàarticolate, potenti e flessibili:– il corso è in buona parte dedicato ad
illustrare come i DBMS perseguono l'efficacia
9
Basi di dati – Paolo Zirilli [email protected]
I DBMS garantiscono... affidabilità
• Affidabilità (per le basi di dati):– resistenza a malfunzionamenti hardware e
software
• Una base di dati è una risorsa pregiata e quindi deve essere conservata a lungo termine
• Tecnica fondamentale: – gestione delle transazioni
Basi di dati – Paolo Zirilli [email protected]
Transazione
• Insieme di operazioni da considerare indivisibile ("atomico"), corretto anche in presenza di concorrenza e con effetti definitivi
Basi di dati – Paolo Zirilli [email protected]
Le transazioni sono … atomiche
• Una sequenza di operazioni correlate:– trasferimento di fondi da un conto A ad un conto B: o
si fanno il prelevamento da A e il versamento su B o nessuno dei due
• … deve essere eseguita per intero o per niente:– o si fanno il prelevamento da A e il versamento su B o
nessuno dei due
Basi di dati – Paolo Zirilli [email protected]
Le transazioni sono … concorrenti
• L'effetto di transazioni concorrenti deve essere coerente– se due assegni emessi sullo stesso conto corrente
vengono incassati contemporaneamente
… si deve evitare di trascurarne uno
– se due agenzie rischiedono lo stesso posto (libero) suun treno
… si deve evitare di assegnarlo due volte
10
Basi di dati – Paolo Zirilli [email protected]
I risultati delle transazioni sono permanenti
• La conclusione positiva di una transazione corrisponde ad un impegno (in inglese commit) a mantenere traccia del risultato in modo definitivo, anche in presenza di guasti e di esecuzione concorrente
Basi di dati – Paolo Zirilli [email protected]
DBMS vs file system
• La gestione di insiemi di dati grandi e persistenti è possibile anche attraverso sistemi più semplici — gli ordinari file system dei sistemi operativi
• I file system prevedono forme rudimentali di condivisione: "tutto o niente"
• I DBMS estendono le funzionalità dei file system, fornendo più servizi ed in maniera integrata
Basi di dati – Paolo Zirilli [email protected]
DBMS vs file system (2)
• Nei programmi tradizionali che accedono a file, ogni programma contiene una descrizione della struttura del file stesso, con i conseguenti rischi di incoerenza fra le descrizioni (ripetute in ciascun programma) e i file stessi
• Nei DBMS, esiste una porzione della base di dati (il catalogo o dizionario) che contiene una descrizione centralizzata dei dati, che può essere utilizzata dai vari programmi
Basi di dati – Paolo Zirilli [email protected]
File verso DBSM
• Necessità di spostare grandi insiemi di dati tra memoria principale e memoria secondaria (ad esempio in caso di buffering, di accessi orientati alla pagina, di indirizzamento a 32 bit, etc.)
• Codifica speciale per interrogazioni diverse
• Necessità di proteggere i dati da inconsistenza dovuta a utenti multipli che accedono i dati simultaneamente in maniera concorrente
• Ripristino da crash
• Sicurezza e controllo degli accessi
11
Basi di dati – Paolo Zirilli [email protected]
Perché usare un DBMS?
• Indipendenza dei dati e accesso efficiente
• Tempo ridotto di sviluppo dell’applicazione
• Integrità dei dati e sicurezza
• Amministrazione dei dati uniforme
• Accesso concorrente, ripristino da crash
Basi di dati – Paolo Zirilli [email protected]
• Siamo partiti con il dato e l’informazione associato …..
MODELLO DEI DATI
Basi di dati – Paolo Zirilli [email protected]
Descrizioni dei dati nei DBMS
• Esistono descrizioni e rappresentazioni dei dati a livelli diversi, che permettono l’indipendenza dei dati dalla rappresentazione fisica: i programmi fanno riferimento alla struttura a livello più alto, e le rappresentazioni sottostanti possono essere modificate senza necessità di modifica dei programmi.
Basi di dati – Paolo Zirilli [email protected]
Modello dei dati
• insieme di costrutti utilizzati per organizzare i dati di interesse e descriverne la dinamica
• componente fondamentale: meccanismi di strutturazione (o costruttori di tipo)
es.:come nei linguaggi di programmazione esistono meccanismi che permettono di definire nuovi tipi, così costruttori ogni modello dei dati prevede alcuni
• ad esempio, il modello relazionale prevede il costruttore relazione, che permette di definire insiemi di record omogenei
12
Basi di dati – Paolo Zirilli [email protected] Basi di dati – Paolo Zirilli [email protected]
Organizzazione dei dati in una base di datiOrario
Insegnamento Docente Aula Ora
Analisi matem. I Luigi Neri N1 8:00
Basi di dati Piero Rossi N2 9:45
Chimica Nicola Mori N1 9:45
Fisica I Mario Bruni N1 11:45
Fisica II Mario Bruni N3 9:45
Sistemi inform. Piero Rossi N3 8:00
Basi di dati – Paolo Zirilli [email protected]
Si segue un approccio sistematico seguendo una metodologia
Si articola in tre fasi distinte:
Sviluppo di un’applicazione informatica
Basi di dati – Paolo Zirilli [email protected]
Due tipi (principali) di modelli
• modelli concettuali (semantici): permettono di rappresentare i dati in modo indipendente da ogni DBMS, cercando di descrivere i concetti del mondo reale; sono utilizzati nelle fasi preliminari di progettazione; il più noto è il modello Entity-Relationship
• modelli logici: utilizzati nei DBMS esistenti per l’organizzazione dei dati; ad essi fanno riferimento i programmi, sono indipendenti dalle strutture fisiche;esempi: RELAZIONALE, reticolare, gerarchico, a oggetti
ENTITY-RELATIONSHIP
RELAZIONALE
13
Basi di dati – Paolo Zirilli [email protected]
Si segue un approccio sistematico seguendo una metodologia precisa-
Si articola in tre fasi distinte:
Sviluppo di un’applicazione informatica
Basi di dati – Paolo Zirilli [email protected]
DominioApplicativo
DominioApplicativo
SCHEMA
CONCETTUALE
PROGETTAZIONE
CONCETTUALE
PROGETTAZIONE
LOGICASCHEMA LOGICO
(SQL DDL)
DBMS
(SQL DDL+DML)
DB
VALUTAZIONE
PRESTAZIONI
Progettazione
E-R
Mod. RELAZIONALE
Basi di dati – Paolo Zirilli [email protected]
ES. DI SCHEMA CONCETTUALE
Basi di dati – Paolo Zirilli [email protected]
UN Modelli di dati è:
• è una collezione (insieme) di concetti utilizzati per organizzare i dati di interesse e descriverne la struttura dei dati
• Uno schema è una descrizione di una particolare collezione di dati, che fa uso del modello di dati fornito
• Il modello di dati relazionale è il modello (logico) oggi più usato
14
Basi di dati – Paolo Zirilli [email protected]
Il modello di dati relazionale
• è il modello (logico) oggi più usato
– Concetto chiave RELAZIONE:
fondamentalmente una tabella con righe e colonne
– Ogni relazione ha uno schema
che descrive le colonne, o campi
Basi di dati – Paolo Zirilli [email protected]
Tabelle:rappresentazione di relazioni
Basi di dati – Paolo Zirilli [email protected]
Schemi e istanze
In ogni base di dati esistono:
• lo schema, sostanzialmente invariante nel tempo, che ne descrive la struttura ( aspetto intensionale)
nell’esempio precedente, le intestazioni delle tabelle e degli attributi
• l’istanza, costituita dai valori attuali, che possono cambiare molto e molto rapidamente (aspetto estensionale);nell’esempio, il “corpo”di ciascuna tabella
Basi di dati – Paolo Zirilli [email protected]
Esempio: Relazione Studenti
Istanza
cardinalita’ 3grado 5
SchemaStudenti(sid:string,
nome:string, login:string,
età:integer,gpa:real)
18
19
18
età
3.2bi@ecBianchi
0072
bi@tt
ro@ec
login
3.8Bianchi
0033
3.4Rossi0012
gpanomesid
� Non e’ definito alcun ordinamento tra le n-uple/righe� Le n-uple/righe di una relazione sono distinte� Ciascuna n-upla e’ ordinata al suo interno; all’i-esimo valore corrisponde l’i-esimo dominio definito nello schema
15
Basi di dati – Paolo Zirilli [email protected]
L'istanza della base di dati
Lo schema della base di datiOrario
Insegnamento Docente Aula Ora
Analisi matem. I Luigi Neri N1 8:00
Basi di dati Piero Rossi N2 9:45
Chimica Nicola Mori N1 9:45
Fisica I Mario Bruni N1 11:45
Fisica II Mario Bruni N3 9:45
Sistemi inform. Piero Rossi N3 8:00
Basi di dati: schema e istanza
Basi di dati – Paolo Zirilli [email protected]
Due tipi (principali) di modelli
• modelli logici
• modelli concettuali (semantici)
Basi di dati – Paolo Zirilli [email protected]
Modelli logici
• Adottati nei DBMS esistenti per l’organizzazione dei dati– utilizzati dai programmi
– indipendenti dalle strutture fisiche
• esempi: relazionale, reticolare, gerarchico, a oggetti
Basi di dati – Paolo Zirilli [email protected]
Modelli concettuali
• Permettono di rappresentare i dati in modo indipendente da ogni sistema– cercano di descrivere i concetti del mondo
reale
– sono utilizzati nelle fasi preliminari di progettazione
• Il più diffuso è il modello Entity-Relationship
16
Basi di dati – Paolo Zirilli [email protected]
Architettura (semplificata) di un DBMS
BD
Schema logico
Schema interno
utente
Basi di dati – Paolo Zirilli [email protected]
Architettura semplificata di un DBMS: schemi
• schema logico: descrizione della base di dati nel modello logico (ad esempio, mod. Relazionale (la struttura della tabella))
• schema interno (o fisico): rappresentazione dello schema logico per mezzo di strutture memorizzazione (file; ad esempio, record con puntatori, ordinati in un certo modo)
Basi di dati – Paolo Zirilli [email protected]
Indipendenza dei dati
• Il livello logico è indipendente da quello fisico:– una tabella è utilizzata nello stesso modo
qualunque sia la sua realizzazione fisica (che può anche cambiare nel tempo)
• In questo corso vedremo il livello logico e cenni di quello fisico
Basi di dati – Paolo Zirilli [email protected]
Architettura standard (ANSI/SPARC)
a tre livelli per DBMS
BD
Schema logico
Schema
esterno
Schema interno
Schema
esterno
Schema
esterno
utenteutente
utenteutente utente
17
Basi di dati – Paolo Zirilli [email protected]
Architettura ANSI/SPARC: schemi
schema logico: descrizione dell’intera base di dati nel modello logico “principale” del DBMS
Schema interno (o fisico): rappresentazione dello schema logico per mezzo di strutture fisiche di memorizzazione
schema esterno: descrizione di parte della base di dati in un modello logico (“VISTE” parziali, derivate, anche in modelli diversi)
Basi di dati – Paolo Zirilli [email protected]
Una vista
Corso AulaDocente
RossiBasi di dati DS3
BruniReti N3
NeriSistemi N3
BruniControlli G
Corsi
Nome PianoEdificio
OMIDS1 Terra
PincherleG Primo
OMIN3 Terra
Aule
CorsiSedi Corso Aula
Reti N3
Sistemi N3
Controlli G
PianoEdificio
OMI Terra
Pincherle Primo
OMI Terra
Basi di dati – Paolo Zirilli [email protected]
Indipendenza dei dati
• conseguenza della articolazione in livelli
• l’accesso avviene solo tramite il livello esterno (che può coincidere con il livello logico)
• due forme: – indipendenza fisica
– indipendenza logica
Basi di dati – Paolo Zirilli [email protected]
Indipendenza fisica
• il livello logico e quello esterno sono indipendenti da quello fisico – una relazione è utilizzata nello stesso modo
qualunque sia la sua realizzazione fisica
– la realizzazione fisica può cambiare senza che debbano essere modificati i programmi
18
Basi di dati – Paolo Zirilli [email protected]
Indipendenza logica
• il livello esterno è indipendente da quello logico
• aggiunte o modifiche alle viste non richiedono modifiche al livello logico
• modifiche allo schema logico che lascino inalterato lo schema esterno sono trasparenti
Basi di dati – Paolo Zirilli [email protected]
L’architettura a livelli garantisce: Indipendenza dei dati*
• Le applicazioni sono separate dalla struttura e dalla memorizzazione dei dati
• Indipendenza logica dei dati: protezione dalle modifiche alla struttura logica dei dati
• Indipendenza fisica dei dati: protezione dalle modifiche alla struttura fisica dei dati
* Uno dei più importanti benefici dell’uso di un DBMS!
Basi di dati – Paolo Zirilli [email protected]
Esecuzione Concorrente di Controllo di transazioni
• L’esecuzione concorrente di programmi utente è essenziale per ottenere buone prestazioni dal DBMS– Poiché gli accessi al disco sono frequenti, e
relativamente lenti, è importante tenere occupata la CPU lavorando su diversi programmi utente concorrentemente
• Le azioni interallacciate di diversi programmi utente possono portare a inconsistenza: ad esempio, un assegno viene pagato mentre viene calcolato il bilancio del conto corrente
• Il DBMS garantisce che tali problemi non si presentino: ogni utente può immaginare di essere l’unico utente del sistema
Basi di dati – Paolo Zirilli [email protected]
DEF:Transazione: l’esecuzione di un programma sulla base di dati
• Il concetto chiave è la transazione, che è una sequenza atomica di azioni sulla base di dati (letture/scritture)
• Ciascuna transazione, eseguita completamente, deve lasciare la base di dati in uno stato consistente se esso era consistente quando la transazione ha avuto inizio– Gli utenti possono specificare alcuni semplici vincoli
di integrità sui dati, e il DBMS garantirà tali vincoli
– Al di là di questo, il DBMS non capisce realmente la semantica dei dati (ad esempio non capisce come sono calcolati gli interessi su un conto bancario)
– Quindi, garantire che una transazione (eseguita da sola) conservi la consistenza dei dati è, in ultima analisi, responsabilità dell’utente!
19
Basi di dati – Paolo Zirilli [email protected]
Scheduling di transazioni concorrenti
• Il DBMS garantisce che l’esecuzione di {T1, ..., Tn} è equivalente a una qualche esecuzione seriale T1’... Tn’– Prima di leggere/scrivere un oggetto, una
transazione richiede un lock sull’oggetto, e aspetta finché il DBMS fornisce tale lock. Tutti i lock sono rilasciati al termine della transazione (protocollo di locking Strict 2PL)
– Idea: se una azione di Ti (ad esempio, scrivere X) influenza Tj (che magari legge X), una tra Ti e Tj, diciamo Ti, otterrà il blocco su X per prima, e Tjdovrà aspettare fino al termine di Ti; ciò in pratica dà un ordinamento alle transazioni
– Che succede se Tj ha già un blocco su Y e Ti in seguito richiede un blocco su Y? (Deadlock!) Ti o Tjdeve essere interrotta e fatta ripartire!
Basi di dati – Paolo Zirilli [email protected]
Garantire l’atomicità
• Il DBMS garantisce l’atomicità (proprietàtutto-o-niente) anche se il sistema va in crash durante una transazione
• Idea: mantenere un log (una storia) di tutte le azioni effettuate dal DBMS nell’eseguire un insieme di transazioni:– prima che una modifica sia fatta alla base di dati, la
voce corrispondente del log viene messa al sicuro (protocollo WAL: spesso il supporto del sistema operativo in questo ambito è inadeguato)
– dopo un crash, gli effetti delle transazioni eseguite parzialmente sono annullati usando il log (grazie al WAL, se una voce del log non era stata salvata prima del crash, le corrispondenti modifiche alla base di dati non erano state apportate!)
Basi di dati – Paolo Zirilli [email protected]
Il log
• Le seguenti azioni sono registrate nel log:– Ti scrive un oggetto: il vecchio valore e il nuovo valore
• Il record nel log deve essere salvato su disco prima della pagina modificata
– Ti termina/si interrompe: un record nel log registra tale azione
• I record nel log sono collegati tramite l’ID della transazione, così che sia semplice annullare una transazione specificata (ad esempio per risolvere un deadlock)
• Il log è spesso duplicato e archiviato in una memoria “stabile”
• Tutte le attività connesse al log (e di fatto tutte le attivitàconnesse al controllo di concorrenza, come blocco/sblocco, gestione dei deadlock, ecc) sono gestite dal DBMS in maniera trasparente
Basi di dati – Paolo Zirilli [email protected]
Le basi di dati per...
• Utenti finali e produttori di DBMS
• Programmatori di applicazioni per DBMS– Ad esempio abili gestori di siti Web
• Amministratori di basi di dati (DBA)– Progettano gli schemi logico/fisico
– Gestiscono la sicurezza e le autorizzazioni
– Gestiscono disponibilità dei dati, ripristino da crash
– Modificano lo schema della base di dati con l’evolversi delle necessità
20
Basi di dati – Paolo Zirilli [email protected]
Struttura di un DBMS
• Un tipico DBMS ha una struttura stratificata
• La figura non mostra le componenti di controllo di concorrenza e di ripristino
• Questa è una tra le possibili architetture; ciascun sistema ha le proprie varianti
Ottimizzazione ed esecuzione
delle interrogazioni
Operatori relazionali
File e metodi di accesso
Gestione del buffer
Gestione dello spazio su disco
DB
Questi strati
devono tenere
in considerazione
il controllo di
concorrenza e
il ripristino
Basi di dati – Paolo Zirilli [email protected]
Sommario
• Un DBMS è usato per mantenere e interrogare grandi insiemi di dati
• Tra i benefici, il ripristino dai crash del sistema, l’accesso concorrente, il rapido sviluppo di applicazioni, l’integrità dei dati e la sicurezza
• I livelli di astrazione portano all’indipendenza dei dati
• Un DBMS tipicamente ha un’architettura stratificata
• I DBA svolgono un lavoro di responsabilità …
• La ricerca e sviluppo nei DBMS è una della piùvaste ed eccitanti aree dell’informatica
Basi di dati – Paolo Zirilli [email protected]
Esercizi su
Basi di dati e DBMS
Basi di dati – Paolo Zirilli [email protected]
• Quali delle seguenti affermazioni sono vere?
– l'indipendenza dei dati permette di scrivere programmi senza conoscere le strutture fisiche dei dati
– l'indipendenza dei dati permette di modificare le strutture fisiche dei dati senza dover modificare i programmi che accedono alla base di dati
– l'indipendenza dei dati permette di scrivere programmi conoscendo solo lo schema concettuale della BD
– l'indipendenza dei dati permette di formulare interrogazioni senza conoscere le strutture fisiche
21
Basi di dati – Paolo Zirilli [email protected]
• Quali delle seguenti affermazioni sono vere?
– il fatto che le basi di dati siano condivise favorisce l'efficienza dei programmi che le utilizzano
– il fatto che le basi di dati siano condivise permette di ridurre ridondanze e inconsistenze
– il fatto che le basi di dati siano persistenti ne garantisce l'affidabilità
– il fatto che le basi di dati siano persistenti favorisce l'efficienza dei programmi
– il fatto che le basi di dati siano condivise rende necessaria la gestione della privatezza e delle autorizzazioni
Basi di dati – Paolo Zirilli [email protected]
• Quali delle seguenti affermazioni sono vere?
– la distinzione fra DDL e DML corrisponde alla distinzione fra schema e istanza
– le istruzioni DML permettono di interrogare la base di dati ma non di modificarla
– le istruzioni DDL permettono di specificare la struttura della base di dati ma non di modificarla
– non esistono linguaggi che includono sia istruzioni DDL sia istruzioni DML
– SQL include istruzioni DML e DDL
– le istruzioni DML permettono di interrogare la base di dati e di modificarla