Post on 16-May-2015
description
Proud Member of
Case History sulle Sitemap XML
Maurizio Petrone
Riccione, 11 dicembre 2010
Palazzo dei Congressi - V Convegno GT
Maurizio Petrone
Le sitemap XML
Ce ne sono vari tipi: web, video, news, ecc.
• www.sitemaps.org/it/protocol.php
• www.google.com/support/webmasters/bin/topic.py?topic=8476
• code.google.com/p/google-sitemap-gen/
In questo caso, parliamo di semplici
Sitemap XML per il Web.
Maurizio Petrone
Come è nata la Case History
• È stata osservata una relazione diretta e
marcata, tra la configurazione della
sitemap ed il posizionamento su Google
• Metodologia: osservazione del fenomeno
e ipotesi, isolamento dei fattori, ripetizione
dei test, conferma sperimentale.
Maurizio Petrone
Ambiente di laboratorio
Un sito reale che oggi si presenta così:
• 3 anni di anzianità
• 2,5 milioni di visite nella propria esistenza
• 250 pagine indicizzate su Google
• Contenuto: 20% statico, 80% da feed
• Buon PR e frequenza di scansione (2.500
pag. al giorno scaricate in media da G.bot)
• Contesto competitivo, discreti piazzamenti
Maurizio Petrone
L’evento a monte della scoperta
Prima
Solo alcune pagine di
“contenuto generato da feed”
avevano link dal resto del sito.
Queste pagine erano
indicizzate, sebbene non
presenti in sitemap.
Aggiorno la sitemap,
ma senza fare ping o submit
Dopo
Maurizio Petrone
I primi effetti
Le nuove pagine
vengono indicizzate.
Si posizionano subito
bene (così come le
altre già presenti).
Tutto come previsto.
Maurizio Petrone
Tre giorni dopo
Crollo vertiginoso delle
nuove pagine in SERP.
Molte delle vecchie
pagine cadono
anch’esse, e pure key
storiche per cui si
posizionava la home
page, registrano cali.
Maurizio Petrone
La situazione è in stallo
Me ne vado comunque in vacanza ;-)
(per il settore del sito, è bassa stagione).
Al ritorno, la situazione di “penalizzazione”
permane immutata.
Me ne vado comunque in vacanza ;-)
(per il settore del sito, è bassa stagione).
Al ritorno, la situazione di “penalizzazione”
permane immutata.
Provo ad annullare tutte le modifiche fatte
(tranne una), non cambia niente.
Maurizio Petrone
L’ultima cosa da fare
Provo a ripristinare la sitemap originaria.
Pagine sia
vecchie che
nuove,
recuperano in
48 ore tutto il
terreno perduto
Maurizio Petrone
Una relazione tra crawling e ranking?
I dati sembrano suggerire
una correlazione diretta
tra crawling e ranking,
almeno per il sito in
questione.
Le schermate sono prese
da Google Webmaster
Tools.
Maurizio Petrone
Entrata e uscita dalla “penalizzazione”
Le statistiche di scansione
giornaliere di Googlebot: ho
evidenziato inizio e fine della
“penalizzazione”
Query “A” - altre pagine si
posizionano (peggio) al posto
della pagina “A”, risultato: perdita
di 50-80 posizioni
Query “B” - si posiziona la stessa
pagina (home, contenuto statico e
storico), ma perde molto terreno
Maurizio Petrone
Le sitemap utilizzate
• Sitemap “buona”
50 URL di contenuti “statici”, con indicazioni su priority e changefreq
• Sitemap “cattiva”
200 URL di contenuti misti, con indicazioni su priority e changefreq
• Sitemap “No Priority”
200 URL di contenuti misti, senza indicazioni sulla priority
• Sitemap “No Changefreq”
200 URL di contenuti misti, senza indicazioni sulla changefreq
• Sitemap “Completa senza parametri”
200 URL di contenuti misti, senza indicazioni su priority e changefreq
• Coppia: sitemap “buona” + sitemap “solo feed”
la sitemap “solo feed” ha 150 URL senza indicazioni su priority e changefreq
Maurizio Petrone
Effetti delle diverse sitemap
Tipo di Sitemap Effetti
Buona Scansione normale, indicizzazione corretta
Cattiva Scansione ridotta, deindicizzazioni, perdita
generalizzata di posizioni
No Priority Deindicizzazioni e perdita di posizioni, a
macchia di leopardo
No Changefreq Perdita di posizioni per alcuni cluster semantici
su singole pagine “statiche”
Completa senza parametri Sporadiche deindicizzazioni e perdite di
posizioni
Coppia “buona” + “solo feed” Scansione normale, rare deindicizzazioni
Maurizio Petrone
Accorgimenti tecnici
Le sitemap sono state testate una per volta,
ciascuna due volte, in momenti distinti.
Ogni volta è stata aggiornata la sitemap allo
stesso URL*, con un Submit per velocizzare* (tranne ovviamente che per la coppia di sitemap)
I test sperimentali sono stati limitati al solo tempo necessario a riprodurre i primi effetti
Maurizio Petrone
Punti di forza e limiti dello studio
• Pro: documenta per la prima volta una
relazione diretta tra i parametri in
sitemap e crawling, indexing, ranking
• Pro: solida metodologia di test
• Contro: limitato ad un solo sito web
• Contro: esigenze pratiche limitano i test
• Contro: non è emerso un modello di
ottimizzazione dei parametri sitemap
• Pro: Non ancora! ;-)
Proud Member of
Grazie!
Maurizio Petrone
www.searchbrain.it/petrone
“gray guy” credits: http://thegoldguys.blogspot.com/