Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il...

84
‹N› Dipartimento Informatica Tecnologie Web Università degli Studi di Genova DIRAAS Informatica per Umanisti Antonio Lieto

Transcript of Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il...

Page 1: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Università degli Studi di Genova DIRAAS

Informatica per Umanisti

Antonio Lieto

Page 2: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

ARGOMENTI DI QUESTO GRUPPO DI LUCIDI

• I motori di ricerca su Web

•SEO: Search Engine Optimization

Page 3: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Un primo cenno ai motori di ricerca su Web (I)

• Uno dei modi per reperire contenuti sul Web è quello di cercarli tramite i cosiddetti “motori di ricerca” su Web

• Vi sono numerosi motori di ricerca generalisti su Web, anche se, al momento, i tre principali sono Google, Yahoo! (che, oltre a funzionalità di ricerca su Web, offre anche altri servizi come email, messenger, chat, web directory e contenuti) e Bing (quest’ultimo è di Microsoft)

• In Italia, sono piuttosto utilizzati anche Libero e Virgilio: questi, però, non offrono proprie funzionalità di ricerca, ma utilizzano quelle di Google

• Val la pena menzionare anche DuckDuckGo un motore di ricerca relativamente recente (lancio nel 2008) che fa del rispetto della privacy la propria bandiera e usa contenuti provenienti da altri siti per migliorare il risultato della ricerca (es., fornendo un breve e strutturata sintesi iniziale degli argomenti)

Page 4: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Tipicamente, gli attuali motori di ricerca: • consentono all’utente di specificare la propria richiesta (per mezzo di sole parole chiave o

anche in maniera più “articolata”, es. restringendo la ricerca ad una specifica tipologia di risorse [es., immagini, video, ecc.] o utilizzando funzionalità di ricerca “avanzate” [es., si veda la “ricerca avanzata” di Google])

• presentano all’utente una o più pagine Web contenenti l’esito della ricerca (con gli URL delle risorse Web individuate e “corrispondenti” alla richiesta espressa dall’utente)

• Recentemente, Google ha anche introdotto una funzionalità di ricerca tramite immagini (non ancora di largo utilizzo)

• Riportiamo qui di seguito le home page dei succitati principali motori di ricerca e una parte della prima pagina dei risultati da essi prodotti in risposta ad una semplice ricerca con parola chiave “Torino” e poi un esempio di ricerca tramite immagine (al 27/11/2014)...

Un primo cenno ai motori di ricerca su Web (II)

Page 5: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Google [http://www.google.com/ o http://www.google.it/] (I)

Page 6: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Google [http://www.google.com/ o http://www.google.it/] (II)

Page 7: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Yahoo! [http://it.yahoo.com o http://www.yahoo.com/] (I)

Page 8: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Yahoo! [http://it.yahoo.com o http://www.yahoo.com/] (II)

Page 9: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Bing [http://www.bing.com/] (I)

Page 10: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Bing [http://www.bing.com/] (II)

Page 11: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

DuckDuckGo [http://duckduckgo.com/] (I)

Page 12: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

DuckDuckGo [http://duckduckgo.com/] (II)

Page 13: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Google Immagini [https://images.google.com/] (I)…inoltre, ecco un esempio di uso della ricerca tramite immagini con Google Immagini…

Page 14: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Google Immagini [https://images.google.com/] (II)

Foto delle vacanze…

Page 15: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Google Immagini [https://images.google.com/] (III)

Page 16: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO (Search Engine Optimization): cos’è? (I)

• Chi costruisce un sito Web ha solitamente il desiderio che i contenuti del sito possano essere facilmente individuati

• Questa esigenza è particolarmente marcata quando si tratta di siti di organizzazioni o di siti aziendali

• E’ importante che il sito (home page, ma anche pagine interne e risorse che esso offre) compaia “ai primi posti” (diciamo: nelle prime 2-3 pagine) fra i risultati di una ricerca fatta attraverso un motore di ricerca Web e alla quale il sito può offrire risposte utili

Page 17: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web volte ad assicurare buona visibilità a siti e pagine Web nei risultati prodotti dai motori di ricerca

• Il SEO mira quindi a garantire che, ogni volta che un sito contiene informazioni rilevanti per una data ricerca su Web, i link alle opportune pagine del sito compaiano fra le prime posizioni nelle pagine dei risultati della ricerca (indicativamente: nelle prime tre pagine… naturalmente, se si riesce ad arrivare alla prima, meglio ancora!)

• Fra gli esperti SEO, è famoso il detto: “Un buon posto per

nascondere un cadavere è la seconda pagina di google” ☺

SEO (Search Engine Optimization): cos’è? (II)

Page 18: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il SEO è parte di quel più complesso insieme di strategie, attività e prassi (tra loro correlate) che vanno sotto il nome di Web Marketing (la seguente classificazione è solo indicativa, in quanto i termini non sono sempre usati dagli addetti ai lavori in maniera coerente):

• SEM (Search Engine Marketing): ▫ SEO (Search Engine Optimization): promozione dei contenuti di un sito per ottenere

visibilità nei risultati “naturali” dei motori di ricerca 1 ▫ SEA (Search Engine Advertising): promozione dei contenuti di un sito attraverso inserzioni

pubblicitarie nelle pagine dei risultati dei motori di ricerca

• SMM (Social Media Marketing): promozione dei contenuti di un sito per ottenere visibilità nelle varie comunità virtuali online, nei siti di social networking, nelle piattaforme Web per la condivisione di contenuti,

1 N.B. Il SEO riguarda solo i risultati cosiddetti “naturale” della ricerca: esclude le tutto ciò che attiene alle sponsorizzazioni (es. gli AdWords di Google)

SEO (Search Engine Optimization): cos’è? (III)

Page 19: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Motori di ricerca su Web (I)• Per capire il SEO, occorre prima avere un’idea del funzionamento dei motori di

ricerca su Web

• Dal punto di vista dell’utente “classico”, un motore di ricerca su Web è un sito al quale ci si connette con un browser e a cui è possibile formulare una richiesta nei termini di una caratterizzazione delle risorse Web cercate. Il motore risponde con un insieme di risultati che, tipicamente, contiene un elenco di collegamenti alle risorse Web che soddisfano la richiesta.1

1La risposta di un motore di ricerca può contenere (e spesso contiene) anche altri elementi, oltre all’elenco di collegamenti...

Page 20: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il modo più frequente in cui un utente esprime la propria richiesta è per mezzo di un insieme di parole chiave

• Molti motori di ricerca su Web offrono però all’utente anche funzionalità di ricerca più avanzate, come un linguaggio più ricco con cui caratterizzare le risorse Web cercate o anche, come si è detto, dei meccanismi di ricerca (non ancora di largo uso) tramite immagini

Motori di ricerca su Web (II)

Page 21: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Es., Google consente di racchiudere una sequenza di parole fra virgolette per specificare la ricerca di documenti che contengono esattamente quelle parole in quell’esatta sequenza (es., “il tema non è secondario”), oppure la ricerca in uno specifico sito (es., vittorio foa site:www.anpi.it), o, ancora, che la risorsa cercata deve corrispondere ad almeno una parola chiave specificata, ma non necessariamente a tutte (es., latifoglia OR conifera).

• Es. Google offre anche un’interfaccia per la ricerca avanzata all’URL http://www.google.com/advanced_search

Motori di ricerca su Web (III)

Page 22: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Un motore di ricerca su Web è un’applicazione software piuttosto sofisticata. Il suo funzionamento è il risultato dell’esecuzione di tre funzionalità principali, le prime due “dietro le quinte” e la terza in risposta alle richieste degli utenti:

1. analisi del Web 2. indicizzazione 3. ricerca e risposta alle richieste dell’utente

N.B.: Molti motori di ricerca sono applicazioni proprietarie di aziende profit, le quali non svelano tutti i segreti del loro prodotto...quindi, in molti casi, non è possibile conoscere i dettagli implementativi di un motore di ricerca

Motori di ricerca su Web (IV)

Page 23: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Questa attività è solitamente chiamata “Web crawling” • E’ eseguita da appositi software, detti Web crawlers (detti anche

anche: spiders, robots, bots,...) che sono parte essenziale dei motori di ricerca su Web

• I Web crawlers scandiscono il Web, visitandone i vari siti e seguendo i collegamenti ipertestuali fra le pagine

• I Web crawlers, durante le loro visite, memorizzano negli enormi data center delle organizzazioni che gestiscono i motori di ricerca informazioni sulle pagine Web che visitano (talvolta memorizzano intere pagine Web o parti di esse, immagini, documenti, ecc.)

• Le informazioni memorizzate vengono elaborate nella successiva fase di indicizzazione

Motori di ricerca su Web: analisi del Web (I)

Page 24: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• ...N.B. un Web crawler è un client HTTP...quindi per visitare un sito invia messaggi HTTPrequest ad un Web server

• Dato che un Web crawler è in grado di scandire un sito Web molto più velocemente di quanto possa farlo un utente umano per mezzo del browser, è importante che i Web crawlers non sovraccarichino i Web server con le loro richieste, producendo un degrado delle prestazioni del server e prevaricando gli utenti umani...

• ...i Web crawler dei motori di ricerca noti, solitamente manifestano un comportamento “educato” (ad esempio, operano più lentamente di quanto effettivamente potrebbero)

• Il Web crawler di Google si chiama Googlebot, quello di Yahoo! si chiama Yahoo! Slurp, quello di Bing si chiama BingBot e quello di DuckDuckGo si chiama DuckDuckBot

Motori di ricerca su Web: analisi del Web (II)

Page 25: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Motori di ricerca: indicizzazione

• Le informazioni recuperate dai Web crawlers e memorizzate nei data center delle organizzazioni che gestiscono i motori di ricerca vengono utilizzati per rispondere alle ricerche fatte dagli utenti (individuando ogni volta le risorse Web che meglio rispondono alla richiesta dell’utente)

• Affinché queste informazioni possano essere recuperate efficientemente nella fase di risposta alle richieste degli utenti, esse non vengono “gettate in un calderone”, ma vengono organizzate opportunamente

• Queste informazioni vengono “indicizzate”: vengono costruiti degli “indici” (in certa misura analoghi agli indici dei libri) consultando i quali i motori di ricerca possono accedere più velocemente alle informazioni cercate

Page 26: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Motori di ricerca: ricerca e risposta alle richieste dell’utente (I)

• Quando un utente esprime una richiesta (spesso con una sequenza di parole chiave, o con una frase o in forme più avanzate, come ad esempio quelle che combinano parole chiave e operatori booleani), il motore di ricerca confronta la richiesta con le informazioni in proprio possesso (avvalendosi degli indici per trovare più in fretta le informazioni rilevanti)

• Individua un insieme di risorse Web rispondenti alla richiesta

Page 27: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Determina l’importanza di ciascuna di esse e costruisce le pagine dei risultati (SERPs: Search Engine Result Pages) ordinando le risorse individuate in ordine decrescente di importanza (Ranking)

• L’importanza di ciascuna risorsa è generalmente una funzione complessa che combina diversi parametri, di cui uno è – ovviamente – il grado di corrispondenza fra la risorsa e la richiesta dell’utente (anch’esso calcolato dinamicamente)...

• ...ma non solo! Gli algoritmi di ranking dei motori di ricerca sono piuttosto sofisticati (e generalmente tenuti più o meno nascosti) e prendono in considerazione anche parametri legati alla sola risorsa (come ad esempio la “reputazione” e popolarità di un sito, ecc.)

• Es. Google utilizza, tra gli altri, un algoritmo noto come “Page Rank” per determinare l’ordine di apparizione dei risultati per ciascuna query.

Motori di ricerca: ricerca e risposta alle richieste dell’utente (II)

Page 28: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• … l’attuale tecnologia dei motori di ricerca consente anche di ipotizzare il tipo di esigenza espressa dall’utente con la sua richiesta e di utilizzare tale ipotesi nel reperire e presentare i risultati

• Es., il tipo di esigenza può essere classificato nelle seguenti categorie (ma classificazioni più raffinate sono possibili):

1. Navigazionale: l’utente cerca pagine/risorse Web (es. cerca siti di automobili d’epoca)

2. Informativa: l’utente cerca informazioni su qualcosa e non necessariamente pagine Web che parlano di quel qualcosa da cui ricavare informazioni (es. cerca la ricetta della «bagna cauda» o la traduzione in inglese del temine «automobile»)

3. Transazionale: l’utente cerca servizi Web che consentono di eseguire una qualche transazione (es. cerca un servizio online per la prenotazione di uno spetacolo teatrale)

Motori di ricerca: ricerca e risposta alle richieste dell’utente (III)

Page 29: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Motori di ricerca e “semantica” (I)

• Al momento, è osservabile nei motori di ricerca una direzione evolutiva caratterizzata da una crescente importanza degli aspetti “semantici” nelle ricerche su Web

• Sempre più numerosi sono gli esempi in cui i motori di ricerca tentano di andare al di là di un meccanismo basato sul confronto fra parole (per quanto sofisticati, efficaci ed efficienti siano ormai gli algoritmi di ricerca basati sul confronto fra parole adottati nei motori di ricerca)

• Una delle direzioni di sviluppo attuali nei motori di ricerca risiede nel tentativo di considerare le parole non solo come delle sequenze di caratteri, ma anche nei significati che esse veicolano e nell’uso del significato per migliorare i risultati di una ricerca

Page 30: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Si veda, ad esempio: • Kngine (http://kngine.com/) • DuckDuckGo (http://duckduckgo.com/), già citato in precedenza • Evi (http://www.evi.com/) (già TrueKnowledge), che si propone come “motore di

risposta” (answer engine)

• Ma anche i più noti motori di ricerca stanno indagando e sperimentando il ruolo della semantica nelle ricerche su Web e alcuni hanno già da tempo implementato funzionalità in qualche modo legate alla semantica delle parole che non tratano più le parole solo come stringhe di testo, ma ne usano, in certa misura, anche il significato es.:

• Google stesso ha da tempo intrapreso la strada della semantica: si veda il post dal titolo “Introducing the Knowledge Graph: things, not strings”, pubblicato il 16 maggio 2012 sul blog ufficiale di Google (http://googleblog.blogspot.co.uk)

Motori di ricerca e “semantica” (II)

Page 31: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Kngine (I)

Ricerca per parole chiave “New” e “York”: significato ambiguo!

Riconoscimento ambiguità: 3 tab, uno per la città di New York, uno per lo Stato e uno per il film

Page 32: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Kngine (II)Ricerca per parole chiave “New” e “York”: significato ambiguo!

Informazioni sull’elemento precedono la lista di risorse Web

Page 33: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

DuckDuckGo

Riconoscimento dei diversi significati della parola “torino” e breve descrizione di ciascuno di essi

Page 34: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

True Knowledge (ora ridenominato Evi)

Formulazione di domanda in inguaggio naturale a True Knowledge

True Knowledge fornisce la risposta (quando la conosce)!

Page 35: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Semantica e SEO

• Il recente ruolo (importante, per quanto non [ancora] centrale) della «semantica» negli attuali motori di ricerca suggerisce alcuni nuovi accorgimenti dal punto di vista SEO…

• ...è ragionevole attendersi che se il ruolo della semantica dovesse ulteriormente accrescere di importanza per i motori di ricerca su Web, essa avrebbe un impatto ancora più rilevante sulle pratiche di SEO...

Page 36: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: richiede competenze

• SEO è un’attività che richiede competenze specifiche

• Qui di seguito riporteremo alcune delle principali linee guida SEO, ma queste slide non hanno la pretesa di formare degli esperti SEO...piuttosto, mirano a fornire le conoscenze necessarie ad interagire con esperti SEO!

Page 37: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: alcuni avvertimenti prima di iniziare!

1. Non cercare di ingannare i motori di ricerca! ...i motori di ricerca sono diventati ormai molto abili a riconoscere i tentativi di frode nei loro confronti e penalizzano i siti nei quali hanno riconosciuto tentativi di frode nei loro confronti

2. Ricordare che un sito è fatto per gli utenti, non per i motori di ricerca! ...i motori di ricerca, tendenzialmente, premiano i siti in cui trovano informazioni utili per rispondere ai bisogni informativi degli utenti: dopo tutto, le organizzazioni che gestiscono/progettano/offrono i servizi di motori di ricerca su Web hanno interesse a soddisfare i propri utenti!

3. Non abusare nemmeno delle buone pratiche SEO: il troppo stroppia! ...l’abuso di buone pratiche SEO è comunque sospetto e generalmente non è apprezzato dai motori di ricerca su Web

Page 38: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Gli strumenti per i webmaster dei motori di ricerca

• I principali motori di ricerca mettono gratuitamente a disposizione dei webmaster un insieme di tool che offrono numerosi servizi utili per gli scopi di SEO

• Solitamente, per usare questi tool è necessario iscriversi al servizio

• Si veda, ad esempio: • Gli strumenti per webmaster, e di analisi dei siti di Google (http://

www.google.com/webmasters/tools/, http://www.google.it/analytics/, http://www.google.com/websiteoptimizer/)

• Gli strumenti per webmaster di Bing (che, a seguito di un accordo fra Yahoo! e Microsoft, include anche servizi precedentemente offerti da Yahoo!) http://www.bing.com/toolbox/webmaster

Page 39: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Consigli SEO da chi gestisce motori di ricerca Web

• Google ha pubblicato una propria guida SEO: Guida introduttiva di Google all’ottimizzazione per motori di ricerca (SEO), scaricabile all’URL http://www.google.com/intl/it/webmasters/docs/search-engine-optimization-starter-guide-it.pdf

• In ogni caso, tutte le principali organizzazioni che offrono motori di ricerca su Web forniscono consigli SEO...

• Un’altra buona guida introduttiva al SEO è: Michele De Capitani, Guida SEO – Posizionamento nei motori di ricerca, Prima Posizione, scaricabile gratuitamente dal sito dell’azienda Prima Posizione (una delle tante che offrono consulenze e servizi di Web Marketing e SEO) http://www.prima-posizione.it/

Page 40: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: scegliere le parole chiave (I)

• Attualmente, la ricerca è prevalentemente effettuata con parole chiave

• ➔ è importante innanzi tutto individuare le parole chiave con cui si vuole che i contenuti del sito siano trovati

• ...tali parole chiave saranno quelle che compariranno in vari tag (es., title, h1, h2,..., ), in alcuni meta tag (es., description,...), nel testo dei link, nei nomi dei file, nell’attributo alt delle immagini, nel contenuto vero e proprio, ...

Page 41: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Le parole chiave devono essere coerenti con i contenuti offerti dal sito • Può essere utile cercare di capire (tramite interrogazioni ai motori di

ricerca, visualizzazione del sorgente delle pagine,...) quali sono le parole chiave usate da siti affini (es., dai competitors, nel caso di siti aziendali o da siti di organizzazioni con le stesse nostre finalità)

• E’ opportuno cercare di capire quali parole gli utenti potrebbero utilizzare per cercare i contenuti del sito (es. può essere utile intervistare un campione di potenziali utenti)

• Non ha senso cercare di posizionarsi nei risultati delle ricerche per parole chiave che non hanno nulla a che vedere con i contenuti del sito (es., non ha senso cercare di posizionare un sito di un’azienda che offre servizi di Customer Relationship Management su Web con le parole chiave “frutta” o “protezione panda”)

SEO: scegliere le parole chiave (II)

Page 42: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Vi sono parole chiave più competitive (per le quali è più difficile posizionarsi bene nelle SERP) e parole chiave meno competitive, più “di nicchia” (con cui è più facile posizionarsi bene nelle SERP)

• Es., un’azienda di Venaus (Comune della Val di Susa) che produca e venda miele biologico e prodotti derivati potrebbe desiderare posizionarsi bene nelle SERP sia per ricerche con parole chiave come “prodotti biologici” sia per ricerche con “miele biologico venaus”: il primo è un esempio di parole molto competitive: sono molte le aziende che vorrebbero essere ben posizionate in ricerche con “prodotti biologici”; il secondo è un esempio di parole meno competitive (più di nicchia): presumibilmente, non sono molte le aziende che desiderano essere trovate con ricerche con le parole “miele biologico venaus”

• Inizialmente, meglio occuparsi delle parole meno competitive; in secondo tempo, si può investire energia nella competizione

SEO: scegliere le parole chiave (III)

Page 43: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Alcuni motori di ricerca offrono un servizio di suggerimento di parole chiave, es:

• https://adwords.google.com/select/KeywordToolExternal di Google

SEO: scegliere le parole chiave (IV)

Page 44: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il titolo della pagina è un elemento ispezionato dai motori di ricerca e che incide molto sul posizionamento della pagina nelle SERP: è quindi opportuno usare le parole chiave principali per la caratterizzazione della pagina nell’elemento <title>

• Es., la home page dell’azienda di Venaus produttrice di miele biologico potrebbe avere questo titolo:

<title>APESUSA: produzione e vendita miele biologico e prodotti derivati – Venaus, TO</title>

• Meglio non scrivere titoli di pagina troppo lunghi (non più lunghi dell’esempio sopra)

SEO: usare le parole chiave (I)

Page 45: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• In ogni caso, i titoli di pagina devono sempre essere coerenti con il contenuto della pagina

• L’ideale sarebbe avere un titolo univoco (cioè non ripetuto in più pagine) per ogni pagina del sito...in ogni caso, è bene non ripetere uno stesso titolo in molte pagine (peggio ancora: in tutte le pagine del sito)

• Non riempire il titolo di parole chiave che nulla hanno a che vedere con il contenuto della pagina o, comunque, non necessarie

SEO: usare le parole chiave (II)

Page 46: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• I titoli di paragrafo (<h1>, <h2>, ...) sono altri elementi in cui è opportuno inserire parole chiave, es.

<h1>Le nostre offerte di miele biologico e prodotti derivati</h1> ... <h2>Le nostre varietà di miele</h2> ... <h3>Miele di castagno</h3>

• Usare i tag titoli per specificare effettivamente titoli di paragrafo: evitare di inserire interi paragrafi nei titoli

SEO: usare le parole chiave (III)

Page 47: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Testi dei link: è bene usare testi significativi e legati al contenuto per i collegamenti ipertestuali. In questi testi, usare parole chiave, es.

<a href=“http://www.apesusa.com/catalogo-miele.php”> Catalogo prodotti: miele</a>

• Evitare nei link testi come Per vedere le varietà di miele in catalogo, <a href=“http://www.apesusa.com/

catalogo-miele.php”> clicca qui</a>

• Non scrivere frasi molto lunghe (peggio ancora: interi paragrafi) nei testi dei link

• Non riempire i testi dei link di parole chiave inutili

• E’ generalmente da evitare di usare come testo l’URL della risorsa a cui il collegamento rimanda

SEO: usare le parole chiave (IV)

Page 48: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Nomi dei file: opportuno attribuire a file e cartelle nomi significativi (usando parole chiave, magari più d’una, separate da un trattino), es.:

Un file di un’immagine di un barattolo di miele di castagno potrebbe chiamarsi barattolo-miele-castagno.jpg, una pagina Web sul processo di produzione del miele, potrebbe chiamarsi produzione-miele-biologico.html, ...

• Evitare nomi generici, tipo: img1.jpg, img2.jpg, pag10.html, ...

• Non esagerare con l’inserimento di parole chiave: es., “barattolo-miele-biologico-castagno-apesusa-venaus-to.jpg” non è un buon nome di file!

SEO: usare le parole chiave (V)

Page 49: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Gli attributi alt delle immagini sono un altro punto in cui usare parole chiave per testi significativi (senza eccedere in lunghezza...), es.

<img src=“barattolo-miele-castagno.jpg” alt=“foto di barattolo di miele di castagno”>

• I crawler sono testuali: non capiscono le immagini, ma accedono al valore dell’attributo alt ➔ importante associare un testo significativo a questo attributo (anche per migliorare il posizionamento dell’immagine in una ricerca per immagini!)

• Evitare testo troppo lungo o pieno di parole chiave non necessarie

SEO: usare le parole chiave (VI)

Page 50: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• I contenuti testuali sono altri punti in cui è opportuno usare le parole chiave individuate (sempre ricordando che i contenuti sono rivolti agli utenti e non ai motori di ricerca e sempre senza esagerare!)

• Può essere utile (anche ai fini SEO) enfatizzare le parole chiave con gli appositi tag di formattazione: <strong>, <em>

SEO: usare le parole chiave (VII)

Page 51: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il Meta Tag DESCRIPTION: è utile inserire una breve (indicativamente: un paio di frasi, un breve paragrafo, 150-200 caratteri) descrizione della pagina, usando questo meta-tag. Infatti, se il contenuto della description contiene le parole chiave con cui l’utente ha espresso la propria ricerca, è molto probabile che tale contenuto venga visualizzato nelle SERP

• Es., la pagina Web produzione-miele-biologico.html che descrive il processo di produzione del miele biologico, potrebbe essere così descritta:

<meta name=“description” content =“Descrizione del nostro processo di produzione del miele biologico: posizionamento delle arnie, estrazione dei melari, smielatura, filtraggio, decantazione, schiumatura, invasettamento e stoccaggio. Elenco delle certificazioni bio ottenute.”>

SEO: usare le parole chiave (VIII)

Page 52: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il contenuto del meta tag DESCRIPTION deve essere informativo e coerente con il contenuto della pagina

• L’ideale sarebbe avere una descrizione univoca (cioè non ripetuta in più pagine) per ogni pagina del sito...in ogni caso, è bene non ripetere una stessa descrizione in molte pagine (peggio ancora: in tutte le pagine del sito)

• Non riempire la descrizione di parole chiave

• Non inserire nella descrizione una copia dell’intera pagina

SEO: usare le parole chiave (IX)

Page 53: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il Meta Tag KEYWORDS: è possibile elencare parole chiave in questo meta tag, ma esso è ormai inutile (generalmente ignorato dai motori di ricerca), secondo alcuni, è addirittura meglio non utilizzarlo!

SEO: usare le parole chiave (X)

Page 54: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: curare ogni singola pagina (I)

• Scrivere pagine Web “pulite”: • rispettare la sintassi (X)HTML. Anche se HTML è “più tollerante” rispetto a

XHTML sugli errori di sintassi, è opportuno scrivere sempre pagine sintatticamente corrette

• mantenere separato tutto ciò che riguarda l’aspetto da contenuto e struttura logica della pagina (buona norma usare i CSS esterni!)

• usare i tag <h1>,<h2>,..., <h6> per ciò per cui sono stati pensati: per specificare la struttura logica di una pagina e indicare argomenti e sotto-argomenti nei titoli dei paragrafi

Page 55: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• annidare correttamente gli elementi <h1>,<h2>,..., <h6> ▫ un esempio di buon annidamento: <h1>I nostri prodotti: miele biologico e prodotti derivati</h1> <p>Tutti i nostri prodotti sono bla bla... </p> <h2>Le varietà di miele biologico di nostra produzione</h2> <p>bla bla... </p> <h2>I prodotti biologici derivati dal miele</h2> <p>bla bla... </p>

▫ un esempio di cattivo annidamento: <h2>I nostri prodotti: miele biologico e prodotti derivati</h2> <p>Tutti i nostri prodotti sono bla bla... </p> <h1>Le varietà di miele biologico di nostra produzione</h1> <p>bla bla... </p> <h2>I prodotti biologici derivati dal miele</h2> <p>bla bla... </p>

SEO: curare ogni singola pagina (II)

Page 56: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• non ripetere il tag <h1> in una stessa pagina

• non abusare dei tag <h1>,<h2>,..., <h6>: inserirli solo quando si pensa siano utili agli utenti per capire la struttura logica della pagina...ogni elemento <h1>,<h2>,..., <h6> dovrebbe avere una ragionevole quantità di contenuto

• non usare i tag <h1>,<h2>,..., <h6> solo per ottenere del testo enfatizzato: a questo scopo, usare invece <strong> o <em>

SEO: curare ogni singola pagina (III)

Page 57: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• evitare di infarcire ogni pagina di parole chiave: usare nella pagina solo le parole chiave effettivamente attinenti (es., pensare di “ottimizzare” una singola pagina per una o due parole chiave...)

• evitare l’uso dei frame (ormai obsoleti)

• evitare il più possibile di avere collegamenti ipertestuali che richiedono di cliccare su un’immagine: meglio i link testuali (molti crawler sono solo testuali)...se proprio si vuole avere un link immagine, scrivere testo significativo nell’attributo “alt”

• non creare collegamenti ipertestuali inutili

SEO: curare ogni singola pagina (IV)

Page 58: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• non inserire testo nelle immagini (i motori di ricerca leggono il testo in cui i caratteri sono rappresentati secondo una qualche codifica di caratteri – ASCII, Unicode+UTF8, ecc. – ma generalmente non sono in grado di leggere testo codificato come immagine)

SEO: curare ogni singola pagina (V)

Page 59: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: curare il sito nel suo complesso (I)

• Creare una struttura di navigazione razionale e semplice in cui i collegamenti ipertestuali fra pagine del sito siano effettivamente usate per collegare pagine semanticamente correlate

• Evitare di costruire una complicata ragnatela di collegamenti ipertestuali (es., evitare di collegare ogni pagina del sito ad ogni altra pagina del sito)

• Evitare strutture ipertestuali eccessivamente profonde (es. che richiedano 20 clic per raggiungere una pagina)

• Consentire una navigazione che vada dai contenuti più generali a quelli più specifici

Page 60: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Usare prevalentemente link di testo per specificare i percorsi di navigazione

• Evitare di definire un meccanismo di navigazione basata prevalentemente su menu a tendina, anziché su collegamenti ipertestuali

• Le pagine e le altre risorse che costituiscono il sito sono memorizzate nel file system del server, in una struttura di cartelle accessibili al Web server: in questa struttura, riservare una cartella alle immagini e salvare tutte le immagini usate nel sito in quella cartella

• Usare per le immagini dei formati di file supportati dai browser comuni (i principali formati supportati: JPEG, GIF, BMP, PNG)

SEO: curare il sito nel suo complesso (II)

Page 61: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• L’URL del sito (dominio) non influisce molto sul posizionamento delle sue pagine nelle SERP, quindi ha senso inserire parole chiave nell’URL del sito solo se questo produce URL sensati

• Le considerazioni per la scelta dell’URL del sito dovrebbero comunque essere altre (rispetto all’uso dell’URL a fini SEO):

• meglio se nell’URL compare il nome dell’azienda (es. www.apesusa.com) • scegliere URL facili e corti, facili da ricordare e da “indovinare” (es.,

www.apesusa.com, ma NO: www.miele-biologico-prodotti-derivati.com) • Scegliere un dominio di primo livello (es., .com, .it, .biz, ecc.) che abbia

attinenza con il sito, es., per l’azienda APESUSA, vanno bene .com, .it,eventualmente anche .biz, ma non, .mil, .edu, ecc.

• ...è però comunque opportuno registrare tutti principali domini di primo livello (anche quelli che non si intende usare), per evitare che qualcuno possa farlo con intenzioni malevoli

SEO: curare il sito nel suo complesso (III)

Page 62: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Ogni risorsa del sito (pagine, immagini, applicazioni, ecc.) è identificata da un URL: creare URL semplici e comprensibili: questo implica avere una struttura di cartelle sul server ben organizzata, non molto profonda e in cui le cartelle hanno nomi significativi, es. www.apesusa.it/produzioni/produzione-miele-biologico.html

• Evitare URL troppo lunghi, con un eccessivo annidamento di cartelle o con cartelle con nomi non significativi o fuorvianti

SEO: curare il sito nel suo complesso (IV)

Page 63: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il contenuto è il fattore più importante (anche ai fini SEO)!!!!!!

•Offrire contenuto utile ed originale

• Scrivere testi corretti (anche grammaticalmente) e comprensibili

• Evitare di copiare o riarrangiare contenuti da altri siti (meglio mettere un link ai siti che si reputano autorevoli, anziché riproporne parti del contenuto)

• Evitare di avere contenuti duplicati all’interno del sito stesso

SEO: curare il sito nel suo complesso (V) – il contenuto

Page 64: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Importanti fattori che influenzano il posizionamento di una pagina nelle SERP sono la “popolarità e la reputazione della pagina”

• a parità di ogni altro parametro, una pagina popolare e con alta reputazione occupa posizioni migliori nelle SERP rispetto ad una con minore popolarità o reputazione

SEO: curare il sito nel suo complesso (VI)

Page 65: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• La determinazione della popolarità e reputazione di un sito Web è un calcolo complesso che combina molti fattori e che, spesso, le organizzazioni che offrono i servizi di ricerca su Web non svelano fino in fondo. Fra gli aspetti che influenzano popolarità e reputazione, possiamo elencare:

• il numero e la qualità dei collegamenti che il sito ottiene da pagine di altri siti (backlinks)

• la qualità del sito stesso e dei suoi contenuti • la reputazione dei siti verso cui il sito contiene collegamenti ipertestuali • ...

SEO: curare il sito nel suo complesso (VII)

Page 66: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• I motori di ricerca generalmente interpretano un collegamento ipertestuale da un sito verso un secondo sito come un “voto favorevole” che il primo sito attribuisce al secondo

• Per un sito, non basta, però, ricevere molti link da altri siti, occorre che tali link siano pertinenti e di qualità, quindi...

• Cercare di ottenere (con mezzi onesti!) backlink da siti che hanno una buone popolarità e reputazione e che trattano argomenti affini (es., per l’azienda APESUSA un backlink da un sito autorevole che parla di miele o di agricoltura biologica vale di più di un backlink da un sito altrettanto autorevole, ma che parla di automobili)

SEO: curare il sito nel suo complesso (VIII)

Page 67: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Il miglior modo per ottenere backlink da siti affini (e, sperabilmente, autorevoli) è quello di offrire contenuti o servizi originali, utili ed interessanti: infatti, molti utenti che riconoscono la qualità dei contenuti o servizi di un sito potranno a loro volta avere un sito che tratta temi affini in cui inserire collegamenti ipertestuali al sito reputato interessante

• Promuovere il sito: es., • usando un blog sul sito per annunciare nuovi contenuti e servizi nel sito (ma

solo le novità veramente rilevanti...) • frequentando i social media • ...

SEO: curare il sito nel suo complesso (IX)

Page 68: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Evitare di acquistare link da altri siti o di far parte di accordi per lo scambio dei link fra siti (i motori di ricerca sono diventati abili nello scoprire tentativi di ingannarli come questi)

• Evitare di costruire “siti satelliti” che contengono link al sito che si vuole promuovere (idem come sopra)

• Evitare di richiedere link a tutti i siti affini che si conoscono

SEO: curare il sito nel suo complesso (X)

Page 69: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Un sito che contenga collegamenti ipertestuali a siti con bassa reputazione (o addirittura a siti considerati spam) può veder ridotta la propria reputazione a causa di tali link

• Evitare di inserire link a siti con bassa reputazione

• A volte, può essere opportuno o inevitabile l’inserimento di link a siti con bassa reputazione, es.:

• in un sito che contenga un blog con possibilità per gli utenti di inserirvi commenti: in questo caso, è sempre possibile che utenti malintenzionati inseriscano commenti che contengono collegamenti a siti con bassa reputazione (o addirittura considerati spam dai motori di ricerca)

• se si vuole citare un certo sito come esempio negativo

SEO: curare il sito nel suo complesso (XI)

Page 70: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Come fare nei casi precedenti?

• Assegnare valore “nofollow” all’attributo “rel” di un link, es. <p>...un sito pieno di menzogne è <a href=http://www.gran-balle.org rel =“nofollow”>Gran Balle

</a>...</p>

• I motori di ricerca non seguono i link nei quali è specificato rel =“nofollow” (e non li considerano come un voto positivo dato al sito a cui il link si riferisce)

• Questo meccanismo è utile anche nel caso in cui semplicemente non si voglia regalare con un link un po’ della reputazione del proprio sito (faticosamente guadagnata) ad un altro sito a cui comunque si vuole inserire un link

• E’ possibile applicare l’indicazione nofollow automaticamente agli spazi per i commenti degli utenti

SEO: curare il sito nel suo complesso (XII)

Page 71: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Fra le cartelle e i file di un sito Web, ve ne possono essere alcuni che non hanno rilevanza per i motori di ricerca perché contengono informazioni che non sarebbe utile presentare agli utenti come risultato di una ricerca

• Es.: cartelle contenenti database, pagine dinamiche senza contenuto, pagine o cartelle di amministrazione del sito, ...

• E’ opportuno segnalare ai crawler di NON visitare quei file o cartelle

SEO: curare il sito nel suo complesso (XIII)

Page 72: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Lo di può fare inserendo nella cartella principale del sito un file di testo denominato “robots.txt” che contiene le indicazioni delle sezioni del sito a cui i crawler non dovrebbero accedere

• Quasi tutti i crawler, se trovano questo file nella cartella principale, lo leggono e si attengono alle direttive che esso contiene

• Es. per indicare al crawler di Google di NON accedere alla cartella “admin”, è sufficiente inserire nel file “robots.txt” queste righe:

“User-agent: googlebot Disallow: /admin/” per dare questa indicazione a tutti i crawler: “User-agent: * Disallow: /admin/”

SEO: curare il sito nel suo complesso (XIV)

Page 73: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• ATTENZIONE! I crawler non sono obbligati a seguire le direttive del file robots.txt (anche se i principali lo fanno), quindi, NON USARE QUESTO FILE PER BLOCCARE L’ACCESSO A MATERIALE SENSIBILE O RISERVATO!

SEO: curare il sito nel suo complesso (XV)

Page 74: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Costruire “mappe” o “indici” del sito (“sitemap” o “site map”)

• Le sitemap sono file che contengono essenzialmente l’elenco degli URL delle (principali) pagine visitabili del sito.

• E’ utile costruire sitemap (in (X)HTML) per gli utenti e sitemap (solitamente in un apposito linguaggio XML) per i motori di ricerca

• Una volta costruita una sitemap per motori di ricerca, la si può salvare in filesystem e aspettare che i crawler la trovino, oppure:

• Inviare le sitemap XML ai principali motori di ricerca (seguendo le loro istruzioni per farlo): questo non è garanzia di indicizzazione, ma fornisce comunque ai motori di ricerca utili informazioni sul sito

SEO: curare il sito nel suo complesso (XVI)

Page 75: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Nella sitemap XML, per ogni URL è possibile specificare anche alcune informazioni, es. frequenza di aggiornamento della pagina corrispondente, ultimo aggiornamento, ecc.

• Es.: <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.apesusa.it/</loc> <lastmod>2012-05-14</lastmod> <changefreq>monthly</changefreq> </url> <url> <loc> www.apesusa.it/produzioni/produzione-miele-biologico.html </loc> <lastmod>2011-12-10</lastmod> <changefreq>yearly</changefreq> </url>

... </urlset>

SEO: curare il sito nel suo complesso (XVII)

Page 76: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Un tempo, era importante registrare un sito presso un motore di ricerca: ora questo passaggio è ritenuto da molti irrilevante ai fini SEO

• Se lo si desidera, è comunque possibile farlo (seguendo le istruzioni riportate sui siti dei motori di ricerca Web e compilando gli appositi form)

SEO: curare il sito nel suo complesso (XVIII)

Page 77: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Iscrivere il sito nelle Web directory

• Una Web directory è una directory accessibile via Web che contiene un elenco di siti Web solitamente strutturato in categorie

• Una delle principali Web directory è Open Directory Project (ODP), noto anche come DMoz (Directory.Mozilla): http://www.dmoz.org/

• Ma ve ne sono anche altre...

SEO: curare il sito nel suo complesso (XIX)

Page 78: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Un operatore utile per vedere se un motore di ricerca ha indicizzato un certo sito è “site:”: presente in Google e in altri motori di ricerca, consente di focalizzare una ricerca in uno specifico sito; può essere usato anche per verificare la presenza di un sito in un motore di ricerca

SEO: curare il sito nel suo complesso (XX)

Page 79: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: curare il sito nel suo complesso (XXI)

Page 80: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

SEO: curare il sito nel suo complesso (XXII)

Page 81: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

Altre cose da evitare (oltre a quelle già dette)

• Evitare di: • abusare delle tecniche di ottimizzazione (anche di quelle consigliate): si

rischia penalizzazione per sovraottimizzazione • creare pagine apposite per i motori di ricerca, diverse da quelle per gli

utenti: quello che vede un motore di ricerca devono poterlo vedere anche gli utenti

• inserire nelle pagine Web dei contenuti nascosti agli utenti umani, ma visibili per i motori di ricerca (es. elenco di parole chiave, magari con colore uguale allo sfondo, così che gli utenti non le vedano): idem come sopra

Page 82: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

…inoltre: meglio HTTPS

• In un post sul Webmaster Central Blog di Google (http://googlewebmastercentral.blogspot.it/2014/08/https-as-ranking-signal.html), datato 6 agosto 2014, Google afferma che:

• I suoi servizi usano HTTPS

• E’ suo obiettivo poter assicurare ai propri utenti che i siti a cui assi accedono attraverso Google sono siti sicuri

• Considera HTTPS come uno dei fattori di ranking delle pagine Web. Al momento, l’impatto di questo fattore sul ranking è limitato (così da dare ai Webmaster il tempo di migrare da HTTP ad HTTPS), ma, in futuro, esso è destinato ad aumentare…

Page 83: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• HTTPS = HTTP Secure

• HTTPS non è un protocollo, ma indica l’uso combinato di due protocolli: HTTP + Un protocollo per la realizzazione di comunicazioni sicure in Internet

• Attualmente, il protocollo di riferimento per la realizzazione di comunicazioni sicure in Interner è TLS (Transport Layer Security)

• TLS è un prococollo basato su crittografia. Tecnicamente, TLS si situa a livello applicativo, anche se, in pratica, esso rappresenta un’«estensione sicura» di protocolli di trasporto

…ok…ma cos’è HTTPS? (I)

Page 84: Università degli Studi di Genova DIRAAS Informatica per ... · Tecnologie Web Informatica • Il SEO è un insieme di buone prassi nella costruzione e manutenzione di un sito Web

‹N›Dipartimento InformaticaTecnologie Web

• Con HTTPS, i messaggi fra client e server Web vengono criptati (viene criptati sia l’header, sia il body dei messaggi di tipo HTTPRequest e HTTPResponse) prima dell’invio e decriptati in fase di ricezione

• HTTPS fornisce un’accettabile garanzia che: • Gli attori della comunicazione siano effettivamente chi dicono di essere (quindi,

un utente ha la ragionevole certezza che, attraverso il proprio browser, sta effettivamente accedendo al sito Web a cui pensa di accedere e che nessuno è in grado di sostituirsi fraudolentemente al client durante la conversazione)

• La comunicazione fra client e server non possa essere compresa da terzi

…ok…ma cos’è HTTPS? (III)