Basi di Dati Semistrutturate e XML

Carlo Sartiani

Dipartimento di Informatica Università di Pisa

Questo lavoro è stato in parte finanziato con i fondi del Progetto MURST DATA-X

Struttura della presentazione

• Introduzione

• Modelli dei dati

• Linguaggi di interrogazione

• Meccanismi di schematizzazione

• Conclusioni

INTRODUZIONE

Basi di dati semistrutturate

• Una base di dati semistrutturata è caratterizzata da:– un’elevata irregolarità strutturale e/o– un’elevata instabilità strutturale

• Queste caratteristiche rendono gli SSD non agevolmente gestibili con sistemi relazionali e/o object-oriented

Esempio@inproceedings{GW99 , AUTHOR = {R. Goldman and J. Widom}, TITLE = {Approximate DataGuides}, BOOKTITLE = {To appear in Proceedings of the second International Workshop WebDB '99, Pennsylvania}, YEAR = {1999}, MONTH = {June},}

@inproceedings{DBLP:conf/icde/NestorovUWC97, author = {S. Nestorov and J. Ullman and J. Wiener and S. Chawathe}, editor = {Alex Gray and Per-{\AA}ke Larson}, title = {Representative Objects: Concise Representations of

Semistructured, Hierarchial Data}, booktitle = {Proceedings of the Thirteenth International Conference on Data Engineering, April 7-11, 1997 Birmingham U.K}, publisher = {IEEE Computer Society}, year = {1997}, isbn = {0-8186-7807-0}, pages = {79-90}, bibsource = {DBLP, http://dblp.uni-trier.de}}

Somiglianze tra XML e SSD

• Autodescrittività

• Flessibilità nella rappresentazione

• Integrazione dei risultati ottenuti nei due ambiti di ricerca– SSD: modelli dei dati e linguaggi di

interrogazione– XML: meccanismi di schematizzazione

MODELLI DEI DATI

Modelli dei dati per SSD e XML

• I modelli dei dati usualmente impiegati per gli SSD si basano su OEM

• OEM rappresenta una base di dati come un grafo diretto etichettato

• OEM può essere facilmente esteso alla rappresentazione di documenti XML

Un documento XML

<name> MacOS </name>

</currentVersion>

<releasedBy> Apple Computer Inc. </releasedBy>

<name> WIndowsNT </name>

</currentVersion>

<releasedBy> Microsoft Inc. </releasedBy>

</operatingSystems>

Rappresentazione del documentooperatingSystems

(Y2KBugFree,“Yes”) (Y2KBugFree,“No”)

currentVersion

MacOS Apple Computer Inc.

namereleasedBy releasedBy

WindowsNT Microsoft Inc.

currentVersion

(lastRevisionDate, “01032000”)

(lastRevisionDate, “11011999”)

9.14 SP6

LINGUAGGI DI INTERROGAZIONE

Desiderata

• Dichiaratività• Chiusura rispetto al modello dei dati• Capacità di esprimere interrogazioni e

trasformazioni• Composizionalità delle query• XML: capacità di sfruttare, ai fini

dell’ottimizzazione di query, le eventuali DTD associate ai documenti interrogati

Linguaggi per XML

• XML-QL è stato progettato specificamente per interrogare documenti data-oriented– Può essere considerato il migliore linguaggio di

query per XML data-oriented

• XQL è un linguaggio per l’interrogazione di documenti general-purpose– XQL non è consigliabile per l’interrogazione di

documenti data-oriented

XML-QLCONSTRUCT <results> {

WHERE <bib>

<book>

</book>

</bib> IN “www.bn.com/bib.xml”

CONSTRUCT <result>

</result>

} </results>

• La query precedente, pur semplice, non è esprimibile in XQL

• Una query XQL:

\database\softwareVendors\company[$i=ID]\name

[\database\operatingSystems\

OS[@releasedBy=$i]

[@Y2KBugFree=”Yes”]]

MECCANISMI DI SCHEMATIZZAZIONE

Assenza di schema logico

• I sistemi di gestione di SSD sono di solito privi di uno schema logico

• L’assenza di schemi logici crea problemi:– esecuzione inefficiente delle query– mancanza di una nozione di correttezza di

query– difficoltà nella formulazione delle query

Schemi per XML data-oriented

• Le DTD non sono soddisfacenti– Descrivono la struttura sintattica e non

l’organizzazione logica– Impongono un ordinamento sui dati– Non permettono di esprimere vincoli sui

riferimenti

Schemi per XML data-oriented

• Esistono numerose proposte di schemi per documenti XML

• La più interessante, per quanto riguarda i documenti data-oriented, è SOX2.0– Tipizzazione dei riferimenti– Maggiore attenzione all’organizzazione logica

dei dati

CONCLUSIONI

Direzioni di ricerca

• Buona parte della comunità di ricerca ritiene soddisfacenti le soluzioni per SSD relative a:– modelli dei dati– linguaggi di interrogazione

• Non siamo d’accordo

Problemi aperti

• I problemi aperti sono ancora troppi– Ottimizzazione– Correttezza– Applicazioni su database

• La loro risoluzione richiede, a nostro avviso, un approccio diverso da quello finora seguito

Approccio unificante

• È necessario un approccio unificante

• Il progetto che stiamo sviluppando (Data-X)– Realizzazione di un query language tipizzato– Sistema di tipi che risolva i tre problemi

precedentemente citati

Basi di Dati Semistrutturate e XML

Documents

Transcript of Basi di Dati Semistrutturate e XML

XML 7 MANUALE TECNICO - Softitalia Cloud

Web Service - isti.cnr.itMartinelli/XML/doc/WebServices/Web_Services_290410.pdf · conto della sicurezza. Le soluzioni emerse ad oggi XML-RPC SOAP REST XML-RPC si basa su uno scambio

Modulo1c XML Basico Schema

XML SIGNATURE E XML ENCRYPTION - di-srv.unisa.itads/ads/Sicurezza_files/XML Signature e XML... · Questo lavoro illustra queste due specifiche e le tecnologie correlate. In particolare

1 Basi di Dati Semistrutturate e XML Carlo Sartiani Dipartimento di Informatica Università di Pisa Questo lavoro è stato in parte finanziato con i fondi.

identità e narrazioni · Interviste libere Interviste semistrutturate Interviste strutturate Dinamica, flessibile, in grado di cogliere elementi inaspettati, che aggiungono dettagli

Corso-Guida - HTML.it - Corso XML

XML: DTD - dsi.unive.itasorato/SlideXML/DTD.pdf · Alessandro Sorato - Linguaggi per la rete: XML – Dipartimen to di Informatica – Università di Venezia Ca' Foscari. XML: DTD

TRACCIATO XML FATTURA ENERGIA/GAS V. 1€¦ · 2 STRUTTURA DEL FLUSSO XML In questo capitolo è descritta la struttura del flusso XML contenente le fatture. Il nome del file xml dovrà

XML e basi di dati - Dipartimento di Matematica e Informaticausers.dimi.uniud.it/~angelo.montanari/xml.pdf · XML e Basi di Dati Corso di Basi di Dati 3 ’ & $ % Cosa non e XML -

Case History sulle Sitemap XML

XML e i programmi di impaginazione

SCHEDA PROGRAMMAZIONE DISCIPLINARE DI FINE ANNO … · 2019-05-21 · patrimoniale e finanziaria dell’azienda ... Verifiche strutturate e semistrutturate di simulazione II prova

Una introduzione a XML

· Web viewmetodologia. lezione frontale. esercitazioni scritte orali e pratiche. tipologia di verifiche. prove scritte strutturate e semistrutturate. prove scritte sulle ...

XSL:Rappresentare i documenti XML

Xml annessi e connessi

XML Prof. Alfredo Pulvirenti. XML XML (eXtensible Markup Language) è un meta linguaggio. Può essere definito come un insieme di regole e convenzioni che.

XQUERY Basi di Dati II Sara Romano. Cosè XQuery? XQuery è il linguaggio per interrogare dati XML; XQuery è per lXML quello che SQL è per i database; XQuery.

Seminario Basi di dati XML - dia.uniroma3.itatzeni/didattica/BD/20032004/BD-XML.pdf · 1 Seminario Base di dati XML - 2004 Seminario Basi di dati XML A cura di Sergio Iacobelli Seminario