Nascita di XML

16
Nascita di XML Tecnologie di Internet Dott. Nicola Dragoni Nascita di XML Nascita di XML I limiti del Web I limiti di HTML

description

Nascita di XML. I limiti del Web I limiti di HTML. HTML nasce come linguaggio di presentazione di dati ipertestuali, adatto dunque a gestire:. testo immagini audio filmati animazioni. In principio era HTML. Ma gli scenari evolvono velocemente. - PowerPoint PPT Presentation

Transcript of Nascita di XML

Page 1: Nascita di XML

Nascita di XMLTecnologie di Internet

Dott. Nicola Dragoni

Nascita di XMLNascita di XML

I limiti del Web I limiti di HTML

Page 2: Nascita di XML

Nascita di XMLTecnologie di Internet

2Dott. Nicola Dragoni

In principio era HTML...In principio era HTML...

HTML nasce come linguaggio di presentazione di dati ipertestuali, adatto dunque a gestire:

testo

immagini

audio

filmati

animazioni

Page 3: Nascita di XML

Nascita di XMLTecnologie di Internet

3Dott. Nicola Dragoni

Ma gli scenari evolvono velocemente...Ma gli scenari evolvono velocemente...

Dati sempre più complessi cominciano ad essere scambiati attraverso la rete (ad esempio per l’e-commerce).

Per via dell’importanza economica di alcuni di questi dati, si sente la necessità di strumenti di validazione.

Sempre più spesso i dati vengono scambiati e processati automaticamente da agenti software. Devono quindi essere “comprensibili” anche per le applicazioni software.

Page 4: Nascita di XML

Nascita di XMLTecnologie di Internet

4Dott. Nicola Dragoni

Il successo del WEBIl successo del WEBIl World Wide Web rappresenta oggi il più grande contenitore di informazione mai assemblata dall’uomo. Contiene infatti documenti e risorse multimediali riguardanti qualsiasi dominio immaginabile e tutta questa informazione è disponibile istantaneamente a qualsiasi utente provvisto di una connessione Internet.

Il successo del Web è dovuto al suo essere decentralizzato e universale: le pagine web risiedono su computer sparsi in tutto il mondo e ogni documento può puntare a qualsiasi altro documento. Un utente, in qualsiasi parte del mondo, può aggiungere informazione al Web contribuendo così alla sua crescita, che in pochi anni è diventata esponenziale.

Page 5: Nascita di XML

Nascita di XMLTecnologie di Internet

5Dott. Nicola Dragoni

I limiti del WEB I limiti del WEB

Questa crescita incontrollata del Web ha determinato una reale difficoltà a trovare informazione utile. Sebbene le directories (ad es. quelle di Yahoo) e i motori di ricerca (ad es. Google e Altavista) possono aiutare a reperire informazione, questi meccanismi hanno ancora molti limiti.

Il più delle volte trovare il documento giusto è come cercare un ago in un pagliaio.

Ricerca di un documentoRicerca di un documento

Page 6: Nascita di XML

Nascita di XMLTecnologie di Internet

6Dott. Nicola Dragoni

I limiti del WEB I limiti del WEB

I limiti del Web sono ancora più evidenti quando un utente vuole eseguire qualche operazione più complessa della ricerca di un documento.

Altri servizi web “più complessi”Altri servizi web “più complessi”

Esempio: un utente potrebbe voler pianificare e prenotare una vacanza o riservare posti in un ristorante o in un cinema.

Per ottenere questi servizi l’utente è spesso costretto a visitare molte pagine, analizzarne il contenuto e ragionarci sopra in qualche modo. Attualmente tali capacità sono sconosciute a qualsiasi motore di ricerca o assistente virtuale.

Page 7: Nascita di XML

Nascita di XMLTecnologie di Internet

7Dott. Nicola Dragoni

IlIl LLimite del WEB imite del WEB Il principale ostacolo e limite del Web consiste nel fatto che non è stato progettato per essere processato da computer, ma solo dall’uomo.

Il Web si presenta oggi come una grande rete di informazione, ma poiché l’informazione diventi conoscenza o informazione utile deve essere analizzata semanticamente. Purtroppo la tecnologia attuale non permette alcun tipo di analisi semantica.

Quest’ultima è affidata unicamente all’utente che, dopo essere stato parzialmente aiutato da qualche motore di ricerca o agente software, deve distinguere l’informazione utile da quella inutile.

Page 8: Nascita di XML

Nascita di XMLTecnologie di Internet

8Dott. Nicola Dragoni

IlIl LLimite del WEB: HTML imite del WEB: HTML

L’HTML non è altro che un linguaggio di formattazione e visualizzazione di testo che, partendo da un testo qualsiasi, definisce per ogni elemento la sua dimensione, forma, colore, posizione, ecc….

Tale limite è dovuto al fatto che l’informazione sul Web non è strutturata, ma viene espressa ad un unico livello tramite l’HTML.

In questo modo una pagina Web non ha alcuna informazione che possa aiutare un’entità software a determinare il significato del testo e quindi non può essere processata intelligentemente da essa.

Page 9: Nascita di XML

Nascita di XMLTecnologie di Internet

9Dott. Nicola Dragoni

I limiti di HTML

Descrive come presentare dati, non l’informazione in essi contenuta. Non è estensibile, ma rigido: non possono essere definiti nuovi tag e attributi. Non è prevista alcuna validazione (semantica) dei dati. L’informazione non è strutturata, ma viene espressa ad un unico livello.

Page 10: Nascita di XML

Nascita di XMLTecnologie di Internet

10Dott. Nicola Dragoni

Un semplice esempioUn semplice esempio

Query: seleziona l’elenco delle partite.

Algoritmo:Per ogni tag <tr> ritorna i primi due <th>

Inter JuventusMilan Roma

<html> <table border=“1pt”><tr> <th>Inter</th> <th>Juventus</th> <th>3-0</th> </tr> <tr> <th>Milan</th> <th>Roma</th> <th>1-1</th> </tr></table></html>

<html> <table border=“1pt”><tr> <th>Inter</th> <th>Juventus</th> <th>3-0</th> </tr> <tr> <th>Milan</th> <th>Roma</th> <th>1-1</th> </tr></table></html>

Page 11: Nascita di XML

Nascita di XMLTecnologie di Internet

11Dott. Nicola Dragoni

Un semplice esempio (cont.)Un semplice esempio (cont.)

<html> <table border=“1pt”><tr> <th>Trefoloni</th> <th>Milano</th> <th>Inter</th> <th>Juventus</th> <th>0-3</th> </tr></table></html>

<html> <table border=“1pt”><tr> <th>Trefoloni</th> <th>Milano</th> <th>Inter</th> <th>Juventus</th> <th>0-3</th> </tr></table></html>

Query: seleziona l’elenco delle partite.

Trefoloni Milano

Algoritmo:Per ogni tag <tr> ritorna i primi due <th>

Page 12: Nascita di XML

Nascita di XMLTecnologie di Internet

12Dott. Nicola Dragoni

Quale soluzione adottare per Quale soluzione adottare per risolvere i limiti del Web?risolvere i limiti del Web?

Serve qualcosa di nuovo!Serve qualcosa di nuovo!Una nuova tecnologia per il Una nuova tecnologia per il

Web!Web!

Page 13: Nascita di XML

Nascita di XMLTecnologie di Internet

13Dott. Nicola Dragoni

Il Web SemanticoIl Web Semantico

Recentemente Tim Berners-Lee, l’inventore del Web, ha proposto di aumentare il Web attuale con linguaggi che possano rendere esplicita l’informazione contenuta nelle pagine, rendendo così il Web “semantico”.

Non si tratta di definire un nuovo Web, ma di estendere quello già presente facendo in modo che l’informazione sia processabile dalle macchine come dall’uomo.

Page 14: Nascita di XML

Nascita di XMLTecnologie di Internet

14Dott. Nicola Dragoni

Nuove tecnologie per il WebNuove tecnologie per il Web

Attualmente la comunità scientifica sta studiando nuove tecnologie per poter realizzare il Web Semantico. Sostanzialmente l’architettura del nuovo Web si baserà su tre livelli fondamentali, ben distinti tra loro:

Ontologie (vocabolari)

Metadati (informazioni sui dati e relazioni che intercorrono fra essi)

Dati

Page 15: Nascita di XML

Nascita di XMLTecnologie di Internet

15Dott. Nicola Dragoni

Il semplice esempio risoltoIl semplice esempio risolto

<giornata> <partita> <arbitro>Trefoloni</arbitro> <luogo>Milano</luogo> <altra_informazione/> <squadra>Inter</squadra> <squadra>Juventus</squadra> </partita></giornata>

<giornata> <partita> <arbitro>Trefoloni</arbitro> <luogo>Milano</luogo> <altra_informazione/> <squadra>Inter</squadra> <squadra>Juventus</squadra> </partita></giornata>

Query: seleziona l’elenco delle partite.

Algoritmo:Per ogni tag <partita> ritorna i primi due <squadra>

Inter Juventus

Page 16: Nascita di XML

Nascita di XMLTecnologie di Internet

Dott. Nicola Dragoni 16

Prossima lezione:

Fondamenti di XML