I motori di_ricerca_1

Post on 18-Jun-2015

617 views 1 download

description

Comprendere i motori di ricerca ed il web

Transcript of I motori di_ricerca_1

InternetI motori di ricerca

Panoramica su internet, dati, metadati, strumenti di ricerca ed altro.

Sommario

● Dati, metadati, indici, versioni del web, il web semantico

● I motori di ricerca, i motori di ricerca semantici, i meta-motori di ricerca

● Interventi SEO● Dettagli: influenzare i bot, ottimizzazione

dei tag e metatag● Attendibilità dei risultati

Dati, metadati ed indici

Dal dato al meta-dato e ritorno...

I dati nel world wide web

Le "versioni" del web

Nella sua prima "versione" il web era stato concepito come una vetrina in cui contenuti, prodotti da specialisti, potessero essere pubblicati per essere fruiti dalle masse...

Il web come lo conosciamo oggi

...Il web 2.0...

Il web presente e quello futuro.

Il web 3.0

Facciamo ordine: i motori di ricerca

La ricerca semantica

La collezione dei dati

I motori di ricerca costituiscono le proprie banche di meta-dati utilizzando speciali "agenti" chiamati anche "spiders", "bots" o "webcrawlers".

Questi programmi specializzati leggono le pagine web dei siti seguendo i links che le collegano.

Gli "snapshot" delle pagine (Circa 100 kb testuali), vengono aggiunte all'archivio di metadati del motore di ricerca.

Gli spiders detti anche bot o robot passano di link in link catturando le pagine.

Ai metadati viene applicato un algoritmo che ne calcola il peso di pertinenza e la posizione nell'indice: i risultati di una ricerca vengono poi restituiti in ordine di rilevanza.

I meta-motori di ricerca

Il flusso dei meta-motori

dalla documentazione di metasearch.com

Influenzare il posizionamento

La SEO è quell'attività di ottimizzazione che i webmaster compiono per rendere i siti più "digeribili" per i motori di ricerca.

Search Engine Optimization

Dettaglio: Influenzare i bot

Gli "spiders" scansiscono le pagine a partire da un link o dall'url ricevuto come indicazione dal webmaster.

Il webmaster può "dialogare" con i robots mediante appositi strumenti:

● Il form di richiesta di indicizzazione del motore di ricerca.

● Il file sitemap.xml ● Il file robots.txt

Esempio di sitemap.xml<?xml version="1.0" encoding="UTF-8"?><urlset mlns="http://example.com/sitemap/0.9"> <url> <loc>http://example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url></urlset>

Esempio di robots.txt

# robots.txt per http://example.com/ diniego per tuttiUser-agent: * Disallow: /cyberworld/map/ # Spazio da non indicizzare

# Solo al bot cybermapper è permesso indicizzare.User-agent: cybermapper Disallow:

Dettaglio: Ottimizzare tag e meta-tag

Il seguente è un esempio di intestazione di una pagina web contenente i "meta-tag" ed i "tag" più indicativi per i motori:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//IT" "http://www.w3.org/TR/html4/loose.dtd"><html><head><META NAME="Description" CONTENT="Autore: A.N. Autore, Illustratore: P. Picture, Categoria: Libri, Prezzo: £9.24, Lunghezza: 784 pagine"><META http-equiv="Content-Type" CONTENT="text/html; charset=iso-8859-1"><META NAME="google-site-verification" CONTENT="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/><title>Esempi di libri: libri usati di alta qualità per bambini</title><META NAME="robots" CONTENT="noindex,nofollow">

Riferimenti:sample header: cortesia di "Google Webmaster Documentation".

Attendibilità dei risultati

I motori di ricerca, forniscono come risultato delle nostre richieste dei collegamenti a delle pagine web; ma quanto sono attendibili le pagine risultanti?

E' possibile influenzare in modo "malevolo" le determinazioni dei motori di ricerca?

Q&A

Grazie per l'attenzione