Versione 1.0 Manuale scritto da nel mese di agosto 2003

22
Versione 1.0 Manuale scritto da nel mese di agosto 2003 A SBAFO! Tutto per il web gratis e in italiano... www.asbafo.net Copyright© Seatiger Team 2003 Sono vietate la riproduzione, la pubblicazione e la distribuzione anche parziale del presente manuale senza il consenso scritto degli autori.

Transcript of Versione 1.0 Manuale scritto da nel mese di agosto 2003

Versione 1.0

Manuale scritto da

nel mese di agosto 2003

A SBAFO! Tutto per il web gratis e in italiano... www.asbafo.net

Copyright© Seatiger Team 2003 Sono vietate la riproduzione, la pubblicazione e la distribuzione anche parziale del presente

manuale senza il consenso scritto degli autori.

Indice Generale Una breve premessa……………………………………………………… pagina 2 I motori di ricerca…………………………………… ……………… pagina 2 Le chiavi di ricerca………………………………… ………………… pagina 2 I risultati della ricerca………………………………………………. pagina 2 Come fanno i motori ad indicizzare le pagine…………. pagina 2 Le allergie degli spiders……………………………………………. pagina 3 Cosa sono i MetaTag………………………………………………… pagina 3 Dove vanno inseriti i MetaTag…………………………………. pagina 4 Gli indispensabili…………………………………………………………… pagina 5 Generalità…………………………………………………………………. pagina 5 Il titolo – DC.TITLE…………………………………………………… pagina 6 La descrizione del sito – DESCRIPTION…………………… pagina 6 Le parole chiave – KEYWORDS………………………………… pagina 6 Le istruzioni allo spider – ROBOTS………………………….. pagina 7 Gli utili……………………………………………………………………………. pagina 8 Generalità………………………………………………………………….. pagina 8 Rivisita tra... - REVISIT-AFTER………………………………… pagina 8 Diritti d'autore – COPYRIGHT………………………………….. pagina 8 L'autore – AUTHOR…………………………………………………… pagina 8 La lingua utilizzata – LANGUAGE…………………………….. pagina 9 Pubblico cui il sito è destinato – RATING………………… pagina 9 Argomento trattato - CLASSIFICATION…………………. pagina 9 Contatto e-mail con l'autore - REPLY-TO………………… pagina 11 Elimina l'icona salva immagini - IMAGETOOLBAR ….. pagina 12 Quelli per pagine particolari…………………………………………. pagina 13 Generalità…………………………………………………………………. pagina 13 Scadenza del documento – EXPIRES………………………. pagina 13 Non salvare le pagine nei temporanei – PRAGMA …. pagina 14 Aggiorna – REFRESH……………………………………………….. pagina 14 Aggiorna e reindirizza - REFRESH …………………………… pagina 14 Problematiche inerenti le pagine con frames …………….. pagina 16 Generalità ……………………………………………………………….. pagina 16 Pagine con frames - Cosa sono ………………………………. pagina 16 Inserire MetaTag e links nella pagina FRAMESET …… pagina 17 Inseriamo uno script di reindirizzamento ……………….. pagina 19 Conclusioni ……………………………………………………………….. pagina 20

1

Una breve premessa

I Motori di ricerca

Com'è noto i motori di ricerca nascono per far sì che ciascun navigatore trovi immediatamente ciò che sta cercando con il maggior numero di occorrenze possibili. Semplificando al massimo sono come delle enormi banche-dati che, sulla base delle parole o delle frasi inserire nel campo di ricerca, restituiscono le pagine che più si avvicinano alle chiavi inserite, seguendo criteri non sempre univoci. In realtà ogni motore ha una sua formula particolare di indicizzazione per cui un sito primo su Google in base alla ricerca effettuata molto difficilmente risulterà primo anche in altri motori come Altavista o Shinyseek. In queste banche-dati sono indicizzate miliardi di pagine web e poiché il navigatore medio statisticamente non va oltre i siti presenti nelle prime cinque pagine trovate dal motore, ecco l'esigenza di aver un buon posizionamento.

Le chiavi di ricerca

Un navigatore, quando effettua una ricerca, inserisce delle parole logiche e quindi se cerca la biografia di un particolare autore digiterà la frase biografia di xxxxxxxx. Per questo motivo sono importanti le cosidette parole chiave che verranno inserite nelle pagine di un sito. Queste parole chiave fanno in modo che, quando un motore di ricerca scandaglia la sua banca-dati alla ricerca dei siti che hanno quel tipo di parola chiave, questi ultimi appaiano tra i risultati della ricerca.

I risultati della ricerca

Come detto i motori di ricerca sono siti che indicizzano un numero elevatissimo di pagine web per cui una parola troppo comune, come gratis, restituirà milioni di siti. Associando alla prima parola un sostantivo, ad esempio clipart gratis, il campo di ricerca sarà più limitato ed il risultato più soddisfacente. Specificando ancora meglio con una frase, tipo clipart gratis in italiano, il risultato sarà ancor più circoscritto. E' da precisare che il motore mostrerà per primi i siti che conterranno parole chiave o avranno nel loro titolo o nel loro contenuto clipart gratis e in italiano, ma fornirà anche i risultati delle sottostringhe clipart gratis, clipart in italiano, clipart, gratis, italiano. Per circoscrivere al massimo la ricerca si può provare ad inserire la frase tra virgolette "clipart gratis in italiano": in questo modo il motore restituirà come risultato solo i siti che avranno nel loro titolo, nel loro contenuto, nelle loro parole chiave questa frase nell'ordine esatto delle parole e quindi un sito che contenga o nel titolo o nel contenuto o nelle parole chiave la frase "clipart in italiano gratis" non apparirà tra i risultati della ricerca.

Come fanno i motori ad indicizzare le pagine

Tramite gli spiders che sono programmi che scandagliano in modo automatico e sistematico il web alla ricerca delle pagine. Ogni spider lavora in maniera differente ed estrapola i dati in maniera diversa da motore a motore: c'è quello che privilegia il titolo e le prime parole di ciascuna pagina, c'è quello che tiene in considerazione il titolo, i links presenti ed i links esterni che puntano a quella pagina, ecc. Ma tutti gli spiders tengono in considerazione i MetaTag. Analizziamo quali sono i criteri più diffusi che utilizzano i motori di ricerca per indicizzare i siti e cioè l'ordinamento in base alla rilevanza (relevance ranking) che è una complessa e variabile formula rigorosamente segreta e differente per ciascun motore dei seguenti elementi:

2

• la frequenza dei termini utilizzati per la ricerca all'interno della pagina; • la densità, cioè il rapporto tra la parola ricercata ed il totale delle parole contenute nella

pagina; • l'originalità della parola cioè il rapporto tra le parole contenute nella pagina e quelle

contenute nella loro banca-dati; • la mancata presenza di alcuni termini molto comuni che vengono volutamente ignorati.

Parole come "web", "Internet", "software" sono classiche "stop words" ed è inutile inserirle a meno che non siano combinate con altre più rare;

• la contemporanea presenza nella pagina di parte o di tutte le parole o addirittura dell'esatta frase digitata nel campo di ricerca;

• l'ordine in cui sono state immesse le parole nel campo di ricerca rispetto a quelle presenti in ciascuna pagina;

• la posizione delle parole nella pagina, in particolare le prime 200 parole contenute nella pagina (tag body) e soprattutto ciò che è presente nell'intestazione (tag head), in particolare il titolo, le parole chiave e la descrizione;

• la popolarità, cioè il numero di link esterni che puntano a quella pagina; • l'aggiornamento della pagina.

Le allergie degli spiders

Pur se i motori sono sempre più evoluti e a saperli utilizzare bene si riesce a trovare in rete anche l'impossibile, gli spiders che vengono da loro impiegati sono allergici a tutto ciò che non è HTML. Sono bravi a trovare un link nella forma <a href="http://www.miosito.com"></a>, ma se trovano un link in JavaScript, o contenuto in un'applet, o in linguaggio Flash o davanti alle pagine dinamiche in ASP, CGI, ecc. si bloccano. Ad eccezione delle pagine tradizionali in HTML statico, gli spiders non si sono evoluti verso altre forme di linguaggio. Gli spiders sono allergici inoltre ai siti strutturati in frames: è più facile che indicizzino le singole pagine costituenti il frameset che la pagina contenitore. Verso la fine del manuale sveleremo dei trucchetti per far sì che, anche qualora vengano indicizzate le singole pagine costituenti il frameset, chiunque clicchi su quel link apra il nostro sito in frames.

Cosa sono i MetaTag

I MetaTag sono delle istruzioni, non visualizzabili dal programma di navigazione, ma ben visibili agli spiders dei motori di ricerca che quando analizzano una pagina non la guardano dal lato in cui siamo abituati a vederla noi navigatori, ma dalla parte del linguaggio di programmazione. Essendo posti nell'intestazione del documento tra i tag <head> e </head> sono addirittura la prima cosa che trovano. Con queste istruzioni, non solo comunichiamo il titolo della pagina, ma anche i contenuti, la descrizione del sito, il genere di argomento che trattiamo nel nostro sito, in quale lingua o in quali lingue è scritto, ogni quanto viene aggiornato, se vogliamo che la pagina sia indicizzata oppure no, se vogliamo che lo spiders segua i links e analizzi anche le altre pagine linkate e le indicizzi e molte altre cose ancora che andremo ad approfondire in questo manuale. Creare ed inserire i MetaTag è cosa delicata e la scelta di un contenuto rispetto ad un altro spesso incide in maniera decisiva sulla catalogazione delle nostre pagine web. Per inserire i MetaTag occorre lavorare sul linguaggio di programmazione ed è quindi necessario avere un minimo di conoscenza del linguaggio HTML.

3

Dove vanno inseriti i MetaTag

Direttamente nel linguaggio HTML tra i tag <head> e </head> come nella figura sottostante:

E iniziamo a parlare dei MetaTag (era l'ora dirà qualcuno).

Inizieremo con... gli indispensabili...

4

Gli indispensabili

Generalità

Come detto, i MetaTag si inseriscono nell'intestazione di una o più pagine del sito, a seconda che se ne voglia indicizzare una o più di una. Ad eccezione di quelle di supporto, si consiglia di inserirli in tutte le pagine, in quanto ogni pagina potrebbe avere contenuti tali da soddisfare i criteri di ricerca di un navigatore rispetto alle altre pagine.

Una pagina HTML qualunque, ricordiamo, è strutturata così:

I MetaTag andranno inseriti tra i tag <head> e </head>.

Vi sono quattro MetaTag indispensabili:

• Il titolo; • la descrizione del sito; • le parole chiave; • le istruzioni allo spider.

Due MetaTag vengono inseriti automaticamente dall'editor HTML ed identificano il set di caratteri usati, nel nostro caso iso-8859-1 e il nome del programma con il quale è stata creata la pagina HTML:

Si possono lasciare entrambi in quanto non creano problemi agli spiders.

Esaminiamo ora, uno per uno, i quattro MetaTag indispensabili.

5

Il titolo - DC.TITLE

E' probabilmente il MetaTag più importante, il più utilizzato e quello di maggior peso per i motori di ricerca che, tra l'altro, lo inseriscono pari pari nell'intestazione dei risultati della ricerca. Dovrebbe includere alcune parole particolarmente significative per indicizzare correttamente la pagina, soprattutto in considerazione del fatto che alcuni motori utilizzano spiders che limitano la ricerca alle sole parole contenute in questo MetaTag. Si tenga presente che, mentre il tag <title> presente in ogni pagina web influenza la scritta che appare in alto sulla barra del titolo del programma di navigazione il MetaTag TITLE è letto solo dallo spider e può contenere sino a 60 caratteri compresi gli spazi.

Sintassi

<meta name="DC.Title" content="Titolo del sito particolareggiato">

Contenuto

Una frase di massimo 60 caratteri che riguardi il titolo del sito e che includa parole attinenti alla pagina in cui il MetaTag è inserito

La descrizione del sito – DESCRIPTION

Anche questo MetaTag è importantissimo. Potrebbe anche influire sulla posizione in classifica se adeguatamente supportato dalle parole chiave. In assenza di questo MetaTag lo spider, va a leggere le prime 200 parole della pagina con risultati talvolta poco utili.

Sintassi

<meta name="description" content="Descrizione della pagina o del sito">

Contenuto

Una o più frasi di massimo 300 caratteri complessivi che diano il reale senso del contenuto del sito o della pagina, una specie di spot pubblicitario, ma più veritiero.

Le parole chiave - KEYWORDS

E' il più importante di tutti. Le parole chiave consentono ai motori di ricerca di associare la pagina con le parole che l'utente digiterà nell'apposito campo del motore. In altre parole quando un utente effettuerà una ricerca utilizzando una parola chiave inserita nel MetaTag KEYWORDS è probabile che il vostro sito appaia come risultato della ricerca. E' necessario quindi scegliere con cura le parole chiave in funzione di quello che il sito offre e di come si pensa che un potenziale navigatore possa digitare per trovare gli argomenti che tratta il vostro sito. Ciascuna parola chiave deve essere separata dalla successiva da una virgola e sono ammesse anche frasi brevi, ad esempio clipart gratis.

Sintassi

<meta name="keywords" content="parola1, parola2, parola3">

6

Contenuto

Più parole o frasi brevi separate tra loro da una virgola per un massimo di 1000 caratteri. Attenzione a non ripetete più di 3 volte la stessa parola perché verrebbe considerato spam e sareste penalizzati. I motori di ricerca operano con algoritmi che automatizzano la posizione in classifica dei siti. Per fare un esempio, un motore potrebbe usare un algoritmo tipo "se una parola chiave appare più di 4 o 5 volte all'interno della pagina non mostrarla nelle prime 200 posizioni per una ricerca effettuata con quella particolare parola chiave". E' ovviamente un uso controproducente.

Le istruzioni allo spider - ROBOTS

Questo MetaTag induce gli spiders dei motori di ricerca a indicizzare o meno la pagina, a seguirne o meno i links e guardare a dove puntano. Sono istruzioni importanti, anche se alle volte non seguite alla lettera dagli spiders, perché potreste volere escludere una o più pagine del vostro sito dalle banche-dati dei motori di ricerca.

Sintassi

<meta name="robots" content="valori">

Contenuto

I valori ammessi, separati tra loro da una virgola, sono:

• index - indicizza la pagina • noindex - non indicizza la pagina • follow - segue i links della pagina • nofollow - non segue i links della pagina • all - indicizza la pagina e ne segue i links • none - non indicizza la pagina e non segue i links

Questi valori possono essere combinati tra loro, basta che non siano in contrasto.

Ad esempio:

<meta name="robots" content="index,follow">

indicizza sia la pagina in cui è contenuto che le pagine collegate con link, a meno che in queste ultime non vi sia il valore noindex. Formalmente corrisponde a all.

Il MetaTag

<meta name="robots" content="noindex,follow">

non indicizza la pagina in cui è contenuto, ma indicizza le pagine collegate con link a meno che in queste ultime non vi sia il valore noindex e così via.

Se questo MetaTag viene omesso lo spider indicizzerà la pagina e seguirà i links in essa contenuti.

Tutto chiaro fino a qui? Allora passiamo ai MetaTag non indispensabili, ma utili...

7

Gli utili

Generalità

Se i MetaTag indispensabili non possono mancare nelle vostre pagine per essere correttamente indicizzate dagli spiders dei motori di ricerca, altri MetaTag si rivelano utili per dare informazioni più dettagliate. Esaminiamone alcuni.

Rivisita tra... - REVISIT-AFTER

Anche questa è un'istruzione per gli spiders o, per meglio dire, un invito perché non si ha la certezza che ciò che suggeriamo venga accolto. Con questo MetaTag, se supponiamo che tra un certo numero di giorni la pagina conterrà delle novità, possiamo dire agli spiders di rivisitarla ed indicizzarla nuovamente dopo un periodo di tempo prefissato.

Sintassi

<meta name="revisit-after" content="20 days">

Contenuto

Il numero di giorni va espresso in lingua inglese. Consigliamo di non inserire valori inferiori ai 15 giorni perché ben difficilmente uno spider accetterà un ordine così perentorio che lo costringerebbe ad un superlavoro.

Diritti d'autore - COPYRIGHT

E' sempre bene cautelarsi contro gli scopiazzatori di turno ed i clonatori di siti. Questo MetaTag, pur non servendo ad indicizzare la pagina, ne indicherà la paternità.

Sintassi

<meta name="copyright" content="Copyright Nome Autore 2003">

Contenuto

Il valore è Copyright seguito dal nome dell'autore e volendo anche dalla data.

L'autore - AUTHOR

Pur non essendo fondamentale è possibile che un giorno diventiate famosi e tramite questo MetaTag il motore sarà in grado, se qualcuno digiterà il vostro nome nel campo di ricerca, di trovare tutte le pagine "marchiate" dal vostro nome.

Sintassi

<meta name="author" content="nome autore">

Contenuto

Questo MetaTag contiene il nome della persona fisica o dell'azienda che rivendica la creazione materiale della pagina sulla quale è riportato.

8

La lingua utilizzata - LANGUAGE

Questo MetaTag consente agli spiders di conoscere e catalogare la pagina secondo la lingua (o le lingue) in cui è scritto ed ha una certa importanza ai fini della catalogazione geografica del sito.

Sintassi

<meta name="language" content="lingua1,lingua2">

Contenuto

Attualmente si utilizzano le sigle di cui al codice ISO 639-1 e ISO 639-2. Nel primo il nome della lingua è indicato con due caratteri alfabetici, mentre nel secondo con tre. Sono entrambi correttamente interpretati dagli spiders, anche se il secondo sta lentamente subentrando al primo con l'incremento dell'alfabetizzazione informatica dei Paesi in via di sviluppo. Le sigle del codice ISO 639-1 non coprono infatti tutte le lingue parlate sulla Terra, a differenza del codice ISO 639-2. Se sul documento o nel sito si parlano più lingue si possono indicare più sigle separate tra loro da una virgola. Riportiamo le sigle dei linguaggi più comuni.

Italiano it ita Tedesco de deu

Inglese en eng Spagnolo es spa

Francese fr fra Portoghese pt por

Pubblico a cui il sito è destinato - RATING

Questo MetaTag aiuta ulteriormente gli spiders a classificare il sito in funzione della fascia di età cui è adatto.

Sintassi

<meta name="Rating" content="General">

Contenuto

I contenuti universalmente riconosciuti sono solo quattro:

• General - adatto a tutti; • Safe for Kids - adatto ai bambini; • 14 Years - adatto ad un pubblico superiore ai 14 anni; • Restricted - adatto solo ad un pubblico adulto.

Il contenuto più usato è ovviamente General che è anche quello predefinito. Tutti i contenuti vanno, come sempre, espressi in lingua inglese.

Argomento trattato - CLASSIFICATION

Anche questo MetaTag aiuta gli spiders a catalogare il vostro sito in funzione del genere di argomento trattato.

Sintassi

<meta name="Classification" content="Argomento trattato">

9

Contenuto

Questo MetaTag è in continua evoluzione. Alla data di redazione di questo manuale i contenuti ammessi, sempre espressi in lingua inglese, sono i seguenti:

Advertising and Marketing Annunci economici Agriculture Agricoltura Animals Animali Antiques Antichità Arts and Crafts Arti e mestieri Astronomy Astronomia Aviation Aviazione Business Banking Banche d'affari Business Supplies Forniture d'affari Business and Economy Affari ed economia Communications Comunicazioni Computers Computers Computer Multimedia Multimedia Construction Costruzioni Consumer Acquirente Consumer Children Bambini acquirenti Consumer Electronics Acquirenti elettronica Culture Cultura Design Design Economy Economia Education Educazione Emergency Services Servizi di emergenza Engineering Ingegneria Entertainment Spettacolo Entertainment Information Spettacolo Informazioni Entertainment Site Sito di spettacolo Environment Ambiente Family Famiglia Family Services Servizi per famiglia Finance Finanza Flowers Fiori Flowers and Gardening Fiori e giardinaggio Food and Beverage Cibo e bevande Games Giochi General Hardware Hardware in genere General Merchandise Commercio General Software Software in genere Gifts Regali Government Governo Hardware Hardware Hardware Peripherals Periferiche hardware Health Salute Hobbies Hobby Home Page Pagine personali Human Resources Risorse umane Internet Internet

10

Internet Services Servizi per Internet Literature Letteratura Macintosh Macintosh Media Mass media Media Services Servizi per media Medical Medicina Medical Equipment Attrezzatura medica Museums Musei Personal Personale Photography Fotografia Programming Programmazione Science Scienza Security Services Sistemi di sicurezza Shopping Acquisti Social Science Scienza sociali Society Società Software Software Sports Sport Tourism Turismo Travel Viaggi Travel Agents Agenzie di viaggio Veterinary Veterinari Web Hosting Spazio web Web Programming Programmazione web Web Resource Risorse sul web Webmastering Webmastering

Contatto e-mail con l'autore - REPLY-TO

Indica l'indirizzo e-mail a cui contattare l'autore del sito o della pagina web in caso ci fossero domande da porgli.

Sintassi

<meta name="reply-to" content="[email protected]">

Contenuto

L'indirizzo e-mail dell'autore. Questo MetaTag non ha grande rilevanza in quanto non viene letto dagli spiders, per contro può tranquillamente essere recuperato da uno dei tanti programmini in uso agli spammers per recuperare indirizzi di posta elettronica a cui inviare posta spazzatura. Si consiglia pertanto di limitarne l'uso solo in caso di effettiva necessità.

11

Elimina l'icona salva immagini - IMAGETOOLBAR

Questo MetaTag funziona solo con Internet Explorer™ versione 6.0 e successive. Come si sa, con questo browser, quando si appoggia il mouse su un'immagine, appare un’icona come quella qui sotto che consente l'immediato salvataggio, aggirando tutti gli ostacoli che avete frapposto alla razzìa delle immagini, come la disabilitazione del tasto destro del mouse, quella della tastiera, ecc.. Con questo MetaTag l'iconcina

non apparirà più.

Sintassi

<meta http-equiv="imagetoolbar" content="no">

Contenuto

L'unico contenuto consentito è ovviamente no.

Questi i MetaTag utili per l'indicizzazione delle pagine, ma in alcuni casi sono necessari altri MetaTag per pagine particolari

12

Quelli per pagine particolari

Generalità

Vi sono siti o singole pagine che necessitano di alcuni MetaTag appropriati per far sì che l'indicizzazione avvenga in maniera corretta e senza fornire informazioni errate agli spiders. Quante volte vi è capitato di effettuare una ricerca e di trovare tra i risultati siti non più attivi o pagine sparite nel nulla? Se il webmaster avesse utilizzato il giusto MetaTag il vostro risultato della ricerca sarebbe stato molto più efficace. Esaminiamone alcuni.

Scadenza del documento - EXPIRES

Immaginate di aver preparato una pagina per un evento che accadrà in una certa data. Passato quel particolare giorno la sua presenza in una banca-dati di un motore di ricerca non avrà alcun motivo di esistere. Con questo particolare MetaTag diamo una scadenza ad una pagina e diciamo allo spider di non visitarla più dopo quella certa data e quindi di cancellarla dal database.

Sintassi

<meta name="Expires" content="Mon, 27 Dec 2003 23:00:00 GMT">

Contenuto

La data va inserita nel formato GMT inglese, e quindi giorno della settimana, giorno mese anno, ora il tutto seguito dalla sigla GMT. Ricordiamo che i giorni della settimana in inglese vengono abbreviati così:

• Mon - lunedì • Tue - martedì • Wed - mercoledì • Thu - giovedì • Fri - venerdì • Sat - sabato • Sun - domenica

E visto che ci siamo facciamo anche un ripassino sulle abbreviazioni dei mesi dell'anno:

• Jan - Gennaio • Feb - Febbraio • Mar - Marzo • Apr - Aprile • May - Maggio • Jun - Giugno • Jul - Luglio • Aug - Agosto • Sep - Settembre • Oct - Ottobre • Nov - Novembre • Dec - Dicembre

Impostando il valore 0 (<meta http-equiv="expires" content="0">) si forza InternetExplorer™ a leggere i contenuti direttamente dal sito e non dai propri files temporanei. Si veda a questo proposito il MetaTag successivo, valido per Netscape™Navigator.

13

Non salvare le pagine nei temporanei - PRAGMA

Poniamo che abbiate un sito i cui contenuti sono in continuo aggiornamento, Come si sa, quando si visita una pagina web, tutti i contenuti vengono salvati nei File Temporanei di Internet in modo tale che, una volta che ci si ricollega al sito, il browser Netscape™Navigator acceleri i tempi di caricamento della pagina cercandone gli elementi proprio in quella cartella. Con questo MetaTag si può dare il comando al browser perché non salvi le pagine nei File Temporanei di Internet e scarichi tutto dalla rete. Si eviterà il rischio di un possibile caricamento di una pagina "vecchia".

Sintassi

<meta name="Pragma" content="no-cache">

Contenuto

Se il vostro sito non ha aggiornamenti quotidiani evitate l'uso improprio di questo MetaTag perché rallenterà i tempi di caricamento del sito e potrebbe scoraggiare qualche potenziale visitatore. L'unico contenuto consentito è no-cache. Questo MetaTag è interpretato solo da Netscape™Navigator e quindi va usato in combinazione con il precedente MetaTag impostato su contenuto 0.

Aggiorna - REFRESH

Poniamo che il vostro sito non solo abbia aggiornamenti frequenti, ma addirittura ogni pochi minuti o secondi, per esempio un sito che vuole dare in tempo reale i risultati delle partite di calcio che ovviamente cambiano in continuazione. Questo MetaTag serve ad aggiornare la pagina dopo un certo numero di secondi in maniera del tutto automatica.

Sintassi

<meta http-equiv="refresh" content="5">

Contenuto

Questo MetaTag aggiornerà la pagina dopo il numero di secondi che avrete impostato come valore di content. Ovviamente, se voleste un aggiornamento ogni 5 minuti, dovreste impostare content="300".

Aggiorna e reindirizza - REFRESH

Con lo stesso MetaTag che abbiamo appena visto si può addirittura reindirizzare il visitatore ad un'altra pagina o ad un altro sito dopo un certo numero di secondi, utile dopo una pagina di ringraziamenti o nel caso in cui abbiate cambiato il server sul quale è ospitato il sito.

Sintassi

<meta http-equiv="refresh" content="5; url=pagina.htm">

14

Contenuto

Nell'esempio di cui sopra, caricata la pagina che contiene quel MetaTag, dopo 5 secondi il visitatore sarà reindirizzato al documento che si chiama pagina.htm che si trova nella stessa cartella del file da cui è avvenuto il reindirizzamento. Il valore può essere espresso sia in formato relativo, come nell'esempio, che assoluto, tipo url=http://www.nomedominio.com

E con questo abbiamo finito di descrivere i principali MetaTag attualmente esistenti. Occorre tener conto però che ogni giorno ne nascono di nuovi e quindi questo manuale verrà periodicamente aggiornato per rimanere al passo con i tempi. Vediamone ora il risultato su una pagina HTML:

Nella prossima lezione parleremo delle problematiche connesse ai siti strutturati in frames e a come risolvere i problemi di mancata indicizzazione di tali siti da parte degli spiders dei motori di ricerca.

15

Problematiche inerenti le pagine con frames

Generalità

Gli spiders di diversi motori di ricerca, almeno fino a qualche anno fa, si comportavano in maniera molto simile ai primi browser testuali e ignoravano molte tecniche avanzate, a cominciare dai frames.

Oggi gli spiders si sono evoluti e implementano il supporto dei frames e trovano senza problemi i link interni ai tag FRAMESET e FRAME.

Tuttavia, non tutti i motori di ricerca si sono evoluti in questo senso ed arrivati davanti alla pagina index.html di un sito strutturato in frames, non trovando alcun contenuto, né links, si bloccano.

Occorre quindi studiare la soluzione per far sì che gli spiders trovino altrove i links alle altre pagine o almeno un singolo link che indirizzi ad una pagina che elenchi tutte le principali sezioni del sito, con relativi collegamenti.

Si utilizza per questo scopo il tag NOFRAMES.

Pagine con frames - Cosa sono

Una pagina con frames o FRAMESET è un contenitore che carica al suo interno almeno due pagine HTML. Se la pagina index.html è un pagina strutturata in frames, quando viene chiamata carica contemporaneamente le pagine costituenti il FRAMESET che sono almeno due pagine HTML di nome diverso. Questa è la struttura di una semplice pagina con due frames, uno destinato al menù ed uno destinato all'apertura dei collegamenti:

Visualizzata dalla parte del linguaggio di programmazione, cioè quello che esaminano gli spiders dei motori di ricerca, apparirà più o meno così:

16

Nel frame chiamato "sommario" verrà inizialmente caricata la pagina menu.html, mentre nel frame chiamato "principale" verrà inizialmente caricata la pagina premessa.html.

Come si può notare la pagina contenitore è totalmente priva di riferimenti al contenuto del sito e di links ad altre pagine, se si eccettuano quelli presenti all'interno del tag FRAME.

Come detto alcuni spiders dei motori di ricerca ignorano i tag FRAMESET e tutti i loro contenuti, compresi i link contenuti nei tag FRAME. Di fatto è come se osservassero una pagina vuota con il risultato di non indicizzarla.

Per contro è possibile che, autonomamente, visitino ed indicizzino singolarmente le due pagine che costituiscono il FRAMESET e cioè, per ritornare al nostro esempio, le pagine menu.html e premessa.html nelle quali sono presenti titolo, testo, links e MetaTag.

Vedremo ora come ovviare a questi inconvenienti.

Inserire MetaTag e links nella pagina FRAMESET

Per inserire informazioni ad uso e consumo solo dei motori di ricerca, utilizzeremo i tag NOFRAMES che sono letti dagli spiders.

Tratteremo la pagina FRAMESET come una normalissima pagina HTML inserendo tra i tag HEAD gli stessi Metatag che abbiamo utilizzato per le altre pagine.

Fatto questo, sposteremo l'apertura del tag NOFRAMES oltre la chiusura del tag FRAMESET ed in esso inseriremo un tag BODY contenente:

• la descrizione del sito contenente le più importanti parole chiave; • alcuni links che puntino a pagine che contengono a loro volta links verso altre pagine.

Il risultato sarà simile a quello sotto riportato:

17

In questo modo lo spider, oltre ai MetaTag, troverà testo e links e sarà soddisfatto.

In alternativa al posto dei collegamenti alle due pagine iniziali che costituiscono il FRAMESET, cioè menu.html e premessa.html, si può mettere un singolo collegamento ad una pagina creata ad hoc contenente tutti i links che conducono alle varie sezioni del sito.

Questa pagina speciale sarà solo ad uso e consumo dei motori di ricerca e non verrà visualizzata all'interno del vostro sito. Consigliamo di inserire in questa pagina "specchietto" i links in forma testuale e nessun MetaTag.

Purtroppo non è finita qui perché nulla vieta agli spiders dei motori di ricerca di indicizzare, oltre alla pagina FRAMESET, anche le singole pagine costituenti il FRAMESET stesso, cioè menu.html e premessa.html.

18

Immaginate la faccia di un visitatore che si trovi davanti ad una pagina contenente un menù di navigazione e niente altro...

Per rimediare a questo inconveniente occorre utilizzare uno script.

Inseriamo nella pagine uno script di reindirizzamento

Lasciamo pure che lo spider indicizzi le singole pagine costituenti il FRAMESET, ma facciamo sì che il visitatore, quando clicca sul risultato della ricerca, apra la nostra pagina index.html completa.

Dobbiamo lavorare sulle due pagine costituenti il FRAMESET, cioè menu.html e premessa.html, ed anche su tutte le altre pagine che potrebbero essere singolarmente indicizzate da un motore inserendo nel tag HEAD, magari dopo i MetaTag, questo breve script:

<script> if (parent.frames.length==0) window.location.replace ("index.html") </script>

oppure, in alternativa, se la pagina non si trova nella cartella principale del sito, lo stesso script così modificato:

<script> if (parent.frames.length==0) window.location.replace ("http://www.nomedominio.com/index.html") </script>

Lo script dà queste istruzioni al browser, sia Internet Explorer™ che Netscape Navigator™:

• se la pagina che viene aperta non è componente di un frameset, apri la pagina index.html o la pagina http://www.nomedominio.com/index.html, nel secondo esempio.

Ovviamente andrà sostituito l'indirizzo ed il nome della pagina con la VERA pagina iniziale del vostro sito.

Nell'immagine come inserire lo script nelle varie pagine del sito:

19

Conclusioni

E con questo abbiamo veramente finito. Concludendo ricapitoliamo i "segreti" per un buon posizionamento nei motori di ricerca, in ordine d'importanza:

• Dare un titolo alla pagina esauriente rispetto ai contenuti; • Inserire nelle prime 200 parole della pagina tutte le informazioni importanti sui

contenuti della stessa, cercando di ripetere, ma non in modo ossessivo, le parole chiave;

• Inserire i MetaTag indispensabili in tutte le pagine principali, cioè in quelle che volete siano indicizzate;

• In casi particolari, a seconda della natura del vostro sito, aggiungete altri MetaTag che ritenete possano essere rilevanti;

• Se utilizzate la struttura in frames, inserite MetaTag, descrizione e link del sito anche all'interno della pagina FRAMESET e non dimenticate di includere lo script di reindirizzamento in tutte le pagine che ritenete possano essere singolarmente indicizzate dagli spiders.

20

A noi non resta che ringraziarvi per aver il nostro manuale sicuri che le nozioni in esso contenute potranno esservi di aiuto nella vostra attività di Webmaster.

Manuale scritto da

nel mese di agosto 2003

A SBAFO! Tutto per il web gratis e in italiano... www.asbafo.net

Copyright© Seatiger Team 2003 Sono vietate la riproduzione, la pubblicazione e la distribuzione anche parziale del presente

manuale senza il consenso scritto degli autori.

21