Sistemi Web per il turismo - lezione 9 - cs.unibg.it 2014-2015 Appunti lezione 9.pdf · Negli...

49
Sistemi Web per il turismo - lezione 9 -

Transcript of Sistemi Web per il turismo - lezione 9 - cs.unibg.it 2014-2015 Appunti lezione 9.pdf · Negli...

Sistemi Web !per il turismo! - lezione 9 -  

I siti Web per il turismo!Come li scopriamo sul Web?!Negli esercizi in classe delle lezioni precedenti, come hanno gli studenti selezionato i siti Web da analizzare?A parte rare eccezioni, in cui l’utente conosceva già l’indirizzo del sito Web da analizzare (indirizzo da inserire nella barra del suo browser per scaricare le relative pagine sul suo computer), nella maggior parte dei casi le persone si sono affidate a un motore di ricerca, inserendo delle parole chiave, e poi selezionando un sito tra i diversi i cui riferimenti sono stati restituiti come risultato della ricerca.!!

!

E’ evidente che i siti Web i cui riferimenti fanno parte del risultato delle ricerche fatte con i motori di ricerca sono più facilmente reperibili dagli utenti e hanno maggiore probabilità di successo nella promozione delle relative destinazioni. !

!!

Search Engine Optimization!

Che sia dedicato al turismo o meno, un sito Web che figura tra i primi risultati di una ricerca ha più probabilità di essere selezionato e utilizzato.!

!!

In una lezione precedente abbiamo visto che l’ordine con cui i motori di ricerca presentano i risultati è determinato dalla rilevanza dei siti. L’ordine è decrescente: più un sito è rilevante per le parole ricercate, più in alto viene presentato nella pagina dei risultati.!

!!

La Search Engine Optimization (SEO) è una branca molto specializzata dell’informatica che si occupa di questo problema.!!

!

La SEO (in italiano: ottimizzazione del motore di ricerca) è una procedura che ha lo scopo di incrementare la visibilità di un sito Web nei risultati “naturali” (ossia senza pagamento) di una ricerca su un particolare motore di ricerca. Come già detto, l’idea di base è che più un sito è in alto nel ranking dei siti che costituiscono il risultato della ricerca, più in alto il link a tale sito comparirà nella finestra del risultati, e maggiori sono le probabilità che il link verrà cliccato dagli utenti del motore di ricerca.!

I fattori considerati da SEO!•  Come funzionano i motori di ricerca"•  I termini e le parole chiave inserite dagli

utenti di un motore di ricerca per cercare determinati siti"

•  Quali sono i motori di ricerca preferiti da determinate fasce di utenza"

Che cosa vuol dire “ottimizzare”!•  Modificare il contenuto di un sito"•  Modificare il codice HTML di un sito"•  Modificare gli altri codici associati a un sito

(ad es.: Javascript, AJAX, etc.)""con lo scopo di:!•  aumentare il legame tra il sito e le parole

chiave più usate"•  favorire un’indicizzazione corretta del sito da

parte dei motori di ricerca"

Che cosa vuol dire “indicizzazione”? !

Vuol dire l’atto di creare degli indici. !

Tradizionalmente un indice è un insieme di riferimenti ai contenuti e al loro numero di pagina in un libro. !

Nel contesto dell’informatica l’indice consiste sempre in un riferimento, ma non ai capitoli di un libro, bensì a dati presenti in una raccolta.!

In informatica, una raccolta di dati prende il nome di database.!

Database:collezione strutturata di dati riguardanti un certo aspetto della realtà, un’entità, o un’organizzazione.!

!!

Esempi di database:le temperature medie di tutti giorni dal 1° gennaio 2005 al 31 dicembre 2008 della città di Venezia;le sigle di tutti i voli che sono atterrati all’aeroporto Caravaggio di Orio al Serio nell’anno 2012;i nomi, gli indirizzi e i numeri di telefono di tutti i ristoranti nella città di Praga. !!

!

Database Management System (DBMS):sistema informatico che gestisce un database.!!!

!

Per costruire un database e il relativo DBMS bisogna innanzitutto fissare un data model, ossia la struttura con cui vengono organizzati i dati, la quale determina come tal i dati verranno immagazzinati, letti, e comunicati. !!

!

Data model, o modello dei dati !

!!

Il data model più diffuso è il modello relazionale.!!

Proposto nel 1969 da Edgar Codd, un informatico inglese che lavorava per IBM. !!

!

Il modello relazionale !!

!

Una relazione viene rappresentata sotto forma di tabella, le cui colonne corrispondono agli attributi legati da tale relazione.I dati nel database vengono organizzati secondo tali attributi, i cui valori riempiono le righe della tabella, chiamate tuple.!!

Come dice il suo nome stesso, il modello si basa sul concetto di relazione: i dati vengono organizzati secondo delle relazioni che legano tra loro determinati attributi. !!!

nome della tabella !!

!

attributi/colonne!!

!

valore!!

!

testata!!

!

tupla/riga!!

!

corpo!!

!

Esempio !!

!

Per trovare un elemento all’interno di un database bisogna effettuare un’operazione di ricerca (search). !

Un tipico esempio di search è la Web search: la ricerca di pagine Web di nostro interesse. Non siamo solo noi ad effettuare una ricerca: la fa anche il motore di ricerca, che ha il compito di trovare tutti i siti che rispondono ai criteri da noi inseriti.!

Si potrebbe pensare che un motore di ricerca come Google abbia un database contenente tutte le pagine Web conosciute da Google in cui effettuare la ricerca di cui sopra.!

Naturalmente questa ipotesi è assurda…!

…perché le pagine del Web sono dati salvati sui Web server sparsi in tutto il mondo (ad esempio: quello di UniBG in Italia, quello del Wall Street Journal negli USA, quello di Easyjet in Inghilterra e così via).Dovesse Google mantenere nei suoi server una copia di tutti i siti Web che conosce, l’azienda dovrebbe avere tanti Web server quanti ne esistono al mondo (o almeno quanti sono quelli conosciuti da Google), il che è una condizione impraticabile sia dal punto di vista finanziario (costerebbe troppo), sia logistico (gli uffici di Google dovrebbero avere una metratura che copre un’intera regione).!

Indice di un database !!

!

Ecco che vengono utili gli indici. Un indice è un riferimento univoco a un determinato dato (esattamente come si ha negli indici dei libri).Nel contesto dei database, l’indice è un riferimento univoco a un dato contenuto nella tabella di un database.!

Gli indici sono stati originariamente introdotti per permettere un accesso rapido al dato cercato in un database. Anziché scorrere tutti i dati di un database dall’inizio in cerca del dato desiderato, ci si avvale degli indici per velocizzare il processo di ricerca.!

Un modo molto diffuso di organizzare gli indici di un database è il B-tree (struttura ad albero: c’è una radice da cui partono rami che portano a dei nodi, da cui possono partire altri rami). !

!!

Gli indici così organizzati sono molto più rapidi da scorrere. La radice contiene solo alcuni riferimenti. Si presuppone che ad ogni nodo i riferimenti siano in ordine crescente. Se il riferimento cercato è presente in un nodo, lo abbiamo trovato, altrimenti dobbiamo seguire il ramo che parte dal punto che si riferisce all’insieme di valori che potrebbe contenere il riferimento da noi cercato: a sinistra di 7 se il riferimento cercato è minore di 7, tra 7 e 16 se il riferimento è compreso tra questi valori, a destra di 16 se è maggiore di 16.!!

!

Per arrivare all’elemento 12, ad esempio, partendo dalla radice, esaminiamo i 2 valori presenti, riconosciamo il ramo da percorrere, e giungiamo subito al nodo con l’elemento cercato.!

Si tratta di un notevole risparmio di tempo rispetto a un semplice elenco lineare che dobbiamo scorrere dall’inizio fino a che non troviamo il 12.!!

!

Nel caso particolare di un motore di ricerca come Google, l’elenco dei dati veri e propri (ossia il database delle pagine Web note a Google) non esiste: Google mantiene sui suoi server solo gli indici che fungono da riferimento alle pagine Web contenute nei vari Web server sparsi nel mondo. !

Google mantiene comunque nei suoi server le copie di alcune delle pagine Web. Tali pagine sono salvate in database che prendono il nome di “cache”. Tali pagine sono le cosiddette pagine “cachate”. !

Le pagine cachate permettono a Google di offire ai suoi utenti la possibilità di visitare le copie di pagine Web che risiedono su Web server al momento non disponibili per motivi tecnici.!

Indicizzazione:il processo con cui un motore di ricerca viene a conoscenza di pagine Web esistenti nel Web e ne salva le informazioni relative sotto forma di indice nel suo database.Quando questo avviene, si dice che la pagina Web è stata “indicizzata”.!

Per poter essere trovata attraverso Google, una pagina Web deve essere stata indicizzata da Google in precedenza. !

Considerato che Google è il leader assoluto del mercato dei motori di ricerca, un sito Web con mire di successo deve essere indicizzato da Google.!

72%!

15%! 10%!

ottobre 2011 !

Indicizzazione:!come avviene?!

1) I gestori del sito Web si presentano

direttamente al motore di ricerca!

http://www.google.com/submityourcontent/!

Su questa pagina di Google una DMO può “iscriversi” a Google sottomettendo il sito Web da essa gestito inserendone le informazioni relative.In questo modo, il sito Web viene indicizzato, il suo riferimento (URL) entra a far parte del database di Google e può essere restituito come risultato di una ricerca.!

Una pagina web si dice “pubblicata” quando è accessibile tramite internet!

Per accedere a una pagina occorre localizzarla nella rete!

A questo scopo ogni pagina web è contraddistinta da un URL (Uniform Resource Locator), ad esempio:!

http://cs.unibg.it/verdicch/swt.html!!Ricordiamo che la parte che identifica l’host è detta dominio (o domain name), ed è organizzata in maniera gerarchica!

it

unibg

cs

Ricordiamo anche che i domain name devono essere acquistati dall’organizzazione proprietaria del sito Web presso organizzazioni di Internet chiamate Domain Name Registrars.!

Informazioni aggiuntive!

Il servizio non consiste semplicemente nel notificare il proprio URL: il motore di ricerca offre la possibilità di integrare tale informazioni con dati aggiuntivi per una migliore visibilità presso gli utenti.!

Esempio!

Rich snippets:sulla base delle informazioni fornite dai gestori del sito Web, il motore di ricerca è in grado di r e s t i t u i r e r i s u l t a t i c h e forniscono un’anteprima del contenuto del sito oppure valutazioni degli utenti.!

Particolarmente importanti per una destinazione turistica sono le informazioni sulla posizione, i contatti, gli orari di apertura.Google offre la possibilità di organizzare e visualizzare tali informazioni aggiuntive al lato destro della schermata dei risultati della ricerca.!

2) Il motore di ricerca esplora il Web e ne

indicizza le pagine in maniera automatica!

I programmi che esplorano il Web in cerca di pagine da

indicizzare si chiamano “spider”

oppure “Web crawler”!

Come fanno gli spider a scoprire nuove pagine?!

Attraverso i link* presenti nelle pagine che conoscono già.!

*questo vuol dire che una pagina Web a cui non fa riferimento alcun link non sarà mai trovata dagli spider.!

Attraverso i link* presenti nelle pagine che conoscono già.!Attenzione ai link: si potrebbe immaginare che

più link all’interno di un sito Web gli spider visitano, migliore sia la sua visibilità, ma non è sempre così.!

Questa è una pagina di Youtube con un video di surf nelle Hawaii.!

Il sito Web di promozione del turismo alla isole Hawaii potrebbe contenere una pagina con un link a questo video a scopo promozionale.!

Attenzione: nella sezione commenti sono inseriti dei link (chiaramente si tratta di spam) che fanno riferimento a siti che non hanno nulla a che vedere col turismo o il surf alle Hawaii.!

Se lo spider del motore di ricerca seguisse questi link, il ranking del sito verrebbe abbassato, in quanto contiene riferimenti a siti per niente rilevanti alla ricerca, ad esempio, su “Hawaii” e “surf”.!

Come può il gestore di un sito Web modificare il comportamento degli

spider?!

Questi link non possono che danneggiare il ranking del sito, quindi la DMO che lo gestisce deve impedire che uno spider li visiti. Si pone dunque il seguente problema.!

La risposta è: attraverso degli specifici metatag con cui caratterizzare il sito. “Metatag” come termine può essere nuovo, ma ci siamo già occupati in passato di tag.!

Il linguaggio HTML!•  HTML (HyperText Markup Language) è un linguaggio

standard per la marcatura di ipertesti, ovvero di testi che possono contenere collegamenti (link) ad altre pagine"

•  HTML prevede un insieme prefissato di tag, il cui significato è definito da una raccomandazione W3C (World Wide Web Consortium)""Esempi di tag HTML:"" "<head> ... </head> <style>... </style> <title>... </title>

<body> ... </body>

Ricordate? !

I tag forniscono informazioni su come

visualizzare gli elementi che fanno parte del

contenuto di una pagina Web.!

I meta tag forniscono informazioni sulla

pagina Web in generale.!

<meta name="keywords" content="wikipedia,encyclopedia" >

I metatag possono indicare diverse proprietà salienti di una pagina Web, come ad esempio le parole chiave che la caratterizzano e che verranno utilizzate per indicizzare tale pagina.!

Oppure, per affrontare il problema sopra menzionato, modificano il comportamento degli spider in caso di visita, eventualmente vietando l’indicizzazione di alcune pagine, oppure vietando che i link presenti sulla pagina vengano seguiti e presi in considerazione per il calcolo della rilevanza della pagina.!

In questo esempio, il nome “robots” indica un metatag che serve a modificare il comportamento dello spider, e il suo contenuto è uno tra “all” (tutto permesso), “none” (niente permesso), “index” (indicizza), “noindex” (non indicizzare), “follow” (segui i link), o “nofollow” (non seguire i link).!

<meta name="robots" content="all|none|index|noindex|follow|nofollow">

Dopo aver concepito un sito, aver comunicato ai Web designer il suo aspetto e le dinamiche che lo caratterizzano, averlo realizzato, e averlo ottimizzato per massimizzare le probabilità di essere selezionati dagli utenti attraverso un motore di ricerca…che cosa succede?!

Una DMO responsabile di un sito Web deve essere in grado di controllarne il successo presso il pubblico.!

Naturalmente i questionari tradizionali sono un ottimo strumento: a tutti gli ospiti che giungono alla destinazione si può chiedere come sono venuti a conoscenza dei servizi offerti etc. ma le aziende che gestiscono i motori di ricerca spesso offrono anche servizi di analisi di traffico sui siti Web.!

Nel caso di Google, alla pagina www.google.com/analytics le DMO si possono abbonare a un servizio di “monitoraggio” del proprio sito, per avere una visione migliore di quanto e di quale tipo di successo stia godendo, giorno per giorno, il sito.!

Ecco un esempio di analisi fornita da Google Analytics. Si possono notare i diversi indicatori: il numero di visite nel tempo, i paesi di provenienza di queste visite, il bounce rate (la proporzione di visitatori che abbandonano il sito dopo la prima pagina) etc.!

Un dato molto interessante è anche la “traffic source overview”, ossia la panoramica sull’ origine del traffico sul sito:1) traffico diretto (i visitatori hanno immesso l’indirizzo del sito direttamente nel browser 2) attraverso motori di ricerca (i visitatori hanno raggiunto il sito dopo averlo trovato tra i risultati di una ricerca su un motore)3) attraverso altri siti (i visitatori hanno raggiungo il sito cliccando su un link contenuto in un altro sito Web)!

Naturalmente tale analisi non ha solo risvolti di carattere tecnologico/informatico, ma può suggerire nuove strategie di marketing (ad esempio se ci sono pochi visitatori attraverso link pubblicitari sui social network, tale campagna va ripensata).!

“Google Analytics” è un servizio fornito da Google, ma analisi altrettanto valide si possono eseguire in maniera indipendente da questa azienda.!

L’attività di analisi dei dati sull’utilizzo di un sito Web da parte degli utenti si chiama Web Analytics. !

Ogni log è relativo a un determinato periodo di tempo in cui il comportamento degli utenti di un sito è stato monitorato.!

Per poter permettere di fare Web Analytics un Web server deve conservare i dati relativi al comportamento degli utenti del sito Web. Tali dati prendono complessivamente il nome di traffic log.!

L’attività di Web Analytics mira a misurare la qualità di un sito Web sulla base di alcune metriche. Vediamo le più usate. !

Pages per Visit !

Numero medio di pagine del sito viste dall’utente durante una visita al sito.!

I visitatori visitano abbastanza pagine del sito per vedere che cosa il sito ha da offrire?!I visitatori del Web sono notoriamente impazienti e questa metrica rappresenta una delle sfide più importanti per i gestori di un sito.!

La metrica è relativa al contesto del sito: per un blog su un social network avere un valore di 2 o 3 pages per visit è già un ottimo risultato, mentre se il sito è di commercio elettronico e la pagina degli ordini è dietro 5 livelli a partire dalla homepage, un valore di 2-3 pages per visit è indicativo di un problema.!

Time on Site !

Tempo medio trascorso da ogni visitatore sul sito.!

Il tempo trascorso da un visitatore sul sito è un buon indicatore di quanto positiva sia la sua esperienza sul sito. !

In poche parole, più un utente passa il tempo sul sito, meglio è, soprattutto se il sito comprende pagine di vendita di prodotti.!

Bounce rate !

Percentuale di utenti che abbandonano il sito immediatamente dopo avere visualizzato la prima pagina.!

L’obiettivo di un gestore di un sito è naturalmente di abbassare il bounce rate.!Le cause possibili di un bounce rate elevato sono varie: il sito può avere problemi di usabilità in generale, oppure la campagna marketing oppure i risultati presentati dai motori di ricerca creano false aspettative negli utenti che poi si scontrano con quanto vedono al momento della visita del sito.!

Exit pages !

La pagine del sito dove avviene il maggior numero di abbandoni.!

Non è strano che gli utenti escano dal sito nei punti principali di ingresso (come ad esempio la home page), ma se un gran numero di utenti abbandona alla seconda pagina dedicata al carrello degli acquisti, allora c’è da chiedersi se non vi sia un problema di usabilità.!Questo indicatore può aiutare a individuare dei problemi nel sito la cui soluzione può migliorarne il bilancio.!

Conversion rate !

Rapporto tra numero di visitatori che sono diventati anche clienti e numero di visitatori totali.!

Per “cliente” intendiamo un utente del sito che ha raggiunto uno degli obiettivi per cui il sito è stato creato (acquisto di un prodotto, compilazione di una form, download di un documento…etc.)!Da notare che si possono distinguere i visitatori unici dai visitatori (cioè la stessa persona viene contata una volta sola) e, se gli acquisti sono tracciabili, gli acquisti multipli di uno stesso utente devono anch’essi essere contati una volta sola nella conversion rate.!