Università degli Studi di Milano BicoccaDipartimento di Informatica, Sistemistica e Comunicazione
Corso di Strumenti e applicazioni del Web
10. Ricercare nel Web (Parte II)
Roberto Polillo
Edizione 2014-15
2
Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Ilsito del corso, con il materiale completo, si trova inwww.corsow.wordpress.com . Data la rapida evoluzione della rete, il corsoviene aggiornato ogni anno.
Il presente materiale è pubblicato con licenza Creative Commons“Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0”(http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ):
La licenza non si estende alle immagini provenienti da altre fonti ealle screen shots, i cui diritti restano in capo ai rispettivi proprietari,che, ove possibile, sono stati indicati. L'autore si scusa per eventualiomissioni, e resta a disposizione per correggerle.
R.Polillo - Marzo 2015
Queste slides
Motori di ricerca: struttura
R.Polillo - Marzo 2015
3
InterfacciaQuery
processing
Rankingdei risultati
Query
Risultati
(SERP)
Front-end process
Indici + cached pages
CrawlerCrawler
IndicizzatoreCrawler
Richieste
Pagine
web
Pagine
webWWW
Back-end process
Semplificando al massimo…
R.Polillo - Marzo 2015
4
URL PAGINE
CACHE
Keyword URLs
INDICE
IndicizzatoreCrawler
Query processing
E’ possibile vedere le pagine cashed(Google search)
R.Polillo - Marzo 2015
5
http://www.digitaltrends.com/computing/directly-access-google-cached-pages/#!BqSUt
Ranking
Gli utenti considerano di solito solo i risultati nella prima SERP
i risultati devono essere presentati in ordine di rilevanza
il successo di un motore di ricerca è fortemente legato al suo algoritmo di ranking
R.Polillo - Marzo 2015
6
Google PageRank
Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi di PhD a Stanford (progetto BackRub, 1995-96), brevettato a nome della Stanford University
L'idea: la "importanza" di una pagina Web è tanto maggiore quante più sono numerose e importanti le pagine Web che la linkano
S.Brin, L.Page, “The anatomy of a large-scale hypertextualWeb search engine”
In sostanza, è il meccanismo con cui vengono valutati i paper accademici
1998: Brin e Page fondano Google Inc
R.Polillo - Marzo 2015
7
PageRank: esempio10
http://en.wikipedia.org/wiki/PageRank
R.Polillo - Marzo 2015
L’algoritmo: altri criteri
Google utilizza oltre 200 criteri per il ranking delle pagine
I criteri sono segreti e in continua evoluzione
Esempi:
Parole chiave nella pagina (titolo, header, testo …)
Età del sito
Qualità dei contenuti
Ranking fra i siti di analogo argomento
Numero di accessi via URL della pagina
Numero di accessi da parte di chi cerca
Tempo speso sulla pagina dagli utenti
….
R.Polillo - Marzo 2015
11
SEO / SEM
SEO: Search Engine OptimizationMetodi e tecniche per migliorare il ranking di un sito Web, per i vari motori di ricercahttp://http://en.wikipedia.org/wiki/Search_engine_optimization
SEM: Search Engine MarketingAttività di promozione di un sito Web per migliorarne il ranking dei motori di ricercahttp://en.wikipedia.org/wiki/Search_engine_marketing
Page rank checker: esempio:http://www.whatsmypr.net
R.Polillo - Marzo 2015
12
SEM/SEO13
La posizione (rank) in cui un sito viene mostrato dal motore di ricerca èestremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltrela prima pagina)
Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito clienteacquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search EngineOptimization)
Le tecniche usate non sono sempre corrette: per es. vengono creati siti compostisolo da link per far “salire” i siti che pagano
Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello checonsidera spamming da parte degli specialisti SEM/SEO
http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it
R.Polillo - Marzo 2015
Risultati della ricerca: non solo link
Provate a cercare (su Google e Bing):- weather Milano- time San Francisco- sunrise New York- 5*9+(sqrt 10)^3=- Ernest Hemingway- Population Milan- define philosophy- ristoranti 20143- movies 20143- mappa 20143- mappa corso italia 6 milano- concessionari Fiat- ….
R.Polillo - Marzo 2015
14
Search engine → Answer engine
Search history
La search history di ciascuno viene salvata nella ”search history" (Google, Bing)
(Non confonderla con la cronologia Web, che è raccolta dal browser)
È possibile cancellare singoli elementi, o tutti
R.Polillo - Marzo 2015
19
Search history in Google: entrare nel proprio account, ed entrare nella "dashboard”, e…. guardate quello che Google sa di voi
La coda lunga delle ricerche
R.Polillo - Marzo 2015
20
Search terms
Fre
qu
en
za
Alta frequenza, bassa
probabilità di trovare
l’informazione desiderata
Bassa frequenza, alta probabilità di
trovare l’informazione
“negozi scarpe uomo centro milano”
Google Trends (www.google.com/trends)
R.Polillo - Marzo 2015
21
Vedi
http://www.google.com/trends/topcharts?date=2014
SERP: struttura tipica
R.Polillo - Marzo 2015
22
Search box
Risultati sponsorizzati
Opzioni per la ricerca
Risultati "organici"
(non influenzati dalle
sponsorizzazioni)
Google:AdWords
Google search: per saperne di più
Help di Google: http://support.google.com/websearch
Wikipedia:http://en.wikipedia.org/wiki/Google_Search
R.Polillo - Marzo 2015
23
Lavoro individuale
Esplorare accuratamente le funzioni del motore di ricerca di Google, [e confrontarle con quelle di Bing]
Esplorare la propria dashboard (nel proprio account Google), e verificare quali informazioni sulla vostra storia sono memorizzate (importantissimo!)
Esplorate www.wolframalpha.comGuardate che cosa Wolfram alpha vi dice della VOSTRA attività su Facebook cercare su Google: wolfram personal analytics
R.Polillo - Marzo 2015
24
Top Related