Motori Di Ricerca

24
Utilizzare google, funzioni avanzate (operatori logici), per dimostrare: 1. L’effetto rumore e l’effetto silenzio della ricerca in rete 2.Le ambiguità del linguaggio libero Pierluigi Tavella 1

Transcript of Motori Di Ricerca

Page 1: Motori Di Ricerca

Utilizzare google, funzioni avanzate (operatori logici), per dimostrare: 1. L’effetto rumore e l’effetto silenzio della ricerca in rete 2.Le ambiguità del linguaggio libero

Pierluigi Tavella 1

Page 2: Motori Di Ricerca

Cosa cerchi?

DOVE NAVIGHI?

2 Pierluigi Tavella

Page 3: Motori Di Ricerca

Tutti conosciamo i MOTORI DI RICERCA MOTORI DI RICERCA

Ma come funzionano? 3 Pierluigi Tavella

Page 4: Motori Di Ricerca

MOTORI DI RICERCA Tutti i motori di ricerca funzionano tramite dei software chiamati

“spider” o “bot”. Lo “spider” è un robot che simula il comportamento di un qualsiasi navigatore della rete (clicca su tutti i pulsanti e i link presenti) e raccoglie tutta una serie di informazioni che vengono registrate

nella banca dati del motore di ricerca.

I criteri di classificazione non includono mai il giudizio umano sulla qualità o la pertinenza di un sito.

4 Pierluigi Tavella

Page 5: Motori Di Ricerca

MOTORI DI RICERCA

Gli algoritmi di ricerca e di classificazione delle pagine sono segreti segreti e modificati regolarmente modificati regolarmente per 2 ragioni:

1. Tutti i motori sono gestiti da società a fini di lucro che ci tengono a tenere segreto il codice informatico per il proprio successo economico

2. I gestori dei motori non vogliono che i risultati della ricerca siano manipolabili da parte di chi vuole promuovere prodotti, informazioni o altro nel Web

5 Pierluigi Tavella

Page 6: Motori Di Ricerca

MOTORI DI RICERCA

I Webmaster Webmaster, attraverso l’esperienza, cercano di scoprire come ottenere il miglior posizionamento per il proprio sito.

Il criterio di ricerca più importante è quello per cui la parola o le parole che stiamo cercando ricorrano effettivamente nella pagina. Se il termine cercato è scritto in grassetto o è

contrassegnato come sottotitolo all’interno della pagina, gli viene assegnato un valore più alto.

Importante per un sito è la “Link “Link popularity popularity” ” ossia il numero di link presenti nel Web che portano ad esso.

(scrivere su Google: “link: nomedominio” per ottenere la “link popularity” del sito)

6 Pierluigi Tavella

Page 7: Motori Di Ricerca

MOTORI DI RICERCA Nessun motore di ricerca può offrire un giudizio di qualità e di autorevolezza

dell’informazione in termini di affidabilità e serietà.

Nessun motore di ricerca è capace di liberarci da un’analisi critica dei risultati fornitici e di ricostruire per ciascuna pagina il contesto nella quale è nata.

Esistono però strumenti alternativi come i portali specializzati o verticali (generalmente a carattere monografico);

esistono le “virtual library” (servizi di consultazione virtuali di carattere universalistico in cui le informazioni sono raggruppate per categorie e sottocategorie) ed anche le directory.

Tratto comune a tutte queste risorse è proprio la selezione umana e non automatica dei Siti a differenza dei portali generalisti od “orizzontali” che offrono poco o nessun accesso ragionato alle risorse del Web.

7 Pierluigi Tavella

Page 8: Motori Di Ricerca

RICERCHE ALTERNATIVE Tim Berners Lee, progettista e inventore del World Wide Web, già all’inizio degli anni ’90, ha avvertito la necessità di mettere a disposizione degli utenti del web strumenti che consentissero un accesso ragionato a quest’ultimo.

Così è nato il progetto “Virtual Library” consistente in un catalogo ragionato delle risorse web (http://vlib.org/). Un’esperienza simile in ambito italiano è la Virtual Library (http://www.segnaweb.it/), costruita dall’Associazione Italiana Bibliotecari e dal CILEA, il consorzio delle università lombarde.

8 Pierluigi Tavella

Page 9: Motori Di Ricerca

Pierluigi Tavella 9

Le strutture categoriali ci piacciono: troviamo più facile cliccare su una categoria già pronta e poi su di una sotto­categoria come ad esempio: Arte e Cultura ­> Archeologia ­> Musei ­> Museo Egizio di Torino invece che inserire faticosamente in un motore di ricerca una stringa con gli operatori logici: "Muse* AND Egizio AND Torino" e poi navigare nella selva dei risultati della ricerca.

Questo tipo di ricerca attraverso directory apparentemente più semplice e immediatamente più

soddisfacente rivela però una nostra pigrizia !

Page 10: Motori Di Ricerca

Pierluigi Tavella 10

quindi

Come sfruttare al meglio i motori disponibili?

Come evitare gli effetti indesiderati?

Page 11: Motori Di Ricerca

Innanzitutto è necessario conoscere le caratteristiche dei vari motori di ricerca e il loro funzionamento.

Non esiste IL MIGLIOR motore di ricerca, quindi si scgelgono quelli che sembrano più validi, tra quelli più importanti. Caratteristiche importanti sono la velocità di accesso e l'interfaccia che vi sembra più gradevole e funzionale.

11 Pierluigi Tavella

Page 12: Motori Di Ricerca

Pierluigi Tavella 12

È difficile suggerire quale motore di ricerca utilizzare in prima battuta. Comunque val la pena di iniziare da Google ed AltaVista. Entrambi permettono di selezionare la lingua delle pagine da trovare, restringendo di molto la ricerca. Se volete analizzare dei siti di una categoria specifica, nessuno meglio di Yahoo! può aiutarvi; tenete presente però che Yahoo! gestisce un numero di siti molto inferiore rispetto agli altri search engine e quindi un occhio agli altri motori è sempre necessario. Con i "metasearch engine" (detti anche metacrawler o metamotori) è possibile fare una ricerca contemporanea sui principali motori di ricerca. I risultati non sempre sono precisi (dovendo equilibrare i differenti sistemi con i quali i motori classificano i siti), ma in genere si risparmia tempo. I più famosi metacrawler sono Meta­Crawler, Savvy Search e soprattutto Mamma.com.

Page 13: Motori Di Ricerca

Pierluigi Tavella 13

Un problema tipico delle ricerche in rete è la difficoltà di "centrare" il documento o la risorsa che ci interessa, e di essere quindi sommersi da un mare di risposte non

significative, in mezzo alle quali annega ciò che stiamo cercando.

Questo problema si chiama:

Page 14: Motori Di Ricerca

Per evidenziare l’effetto rumore, proviamo a fare una ricerca su google.

Pierluigi Tavella 14

Il nostro obiettivo è di trovare pagine e documenti relativi all’antica civiltà greca. Iniziamo la ricerca inserendo il termine: Grecia

Page 15: Motori Di Ricerca

Pierluigi Tavella 15

Page 16: Motori Di Ricerca

Pierluigi Tavella 16

Osservando l’immagine della slide precedente possiamo notare che il risultato della ricerca ci ha restituito una quantità esagerata di documenti: circa 35.900.000 per Grecia

Un risultato veramente RUMOROSO (overload di informazioni).

Questa ricerca non ha dato risultati soddisfacenti anzi direi proprio che questa mole impressionante di risposte poco significative ha provocato un effetto che potremmo definire: SILENZIO

Troppe informazioni = nessuna informazione

Aver utilizzato un linguaggio libero cioè il termine (Grecia) senza aver specificato semanticamente la ricerca.

Page 17: Motori Di Ricerca

Cosa fare per evitare il rumore e quindi il silenzio?

In questa situazione possono tornare utili gli strumenti di ricerca avanzata, in particolare gli operatori logici. L’obiettivo della ricerca avanzata è quello di permettere un interrogazione abbastanza specifica, in modo da escludere documenti non rilevanti. Per fare questa selezione è necessario definire il maggior numero possibile di caratteristiche che il documento che stiamo cercando deve possedere, più specifica è la descrizione, meno sono i documenti che vi corrispondono, e più pertinente è il loro contenuto.

Pierluigi Tavella 17

Page 18: Motori Di Ricerca

Pierluigi Tavella 18

Prima di tutto dobbiamo sapere cosa stiamo cercando. Gli operatori logici tornano utili soprattutto quando abbiamo un’idea chiara di ciò che vogliamo, e lo possiamo quindi descrivere in modo adeguato. Chiarirsi le idee è quindi la cosa fondamentale.

Il modo migliore di procedere è cominciare l’interrogazione con una parola o frase altamente specifica, come può essere un termine tecnico o il nome di una persona. Spesso questo è sufficiente. Se non otteniamo alcun risultato o ne otteniamo troppo pochi, prima di cambiare parola chiave si può provare con le sue declinazioni grammaticali (maschile/femminile e singolare/plurale per i sostantivi, e i diversi tempi e modi per i verbi). A questo scopo può essere utile il segno * (asterisco). Se i risultati sono troppi, oppure non ci vengono in mente che parole generiche, possiamo cominciare ad aggiungere parole chiave legate da AND. Un modo alternativo per scremare i risultati è l’uso di NOT. Se facendo così abbiamo ridotto troppo il campo della ricerca si può utilizzare OR per allargarlo leggermente. Procedendo per aggiustamenti successivi, utilizzando se necessario le parentesi, mettendo o togliendo parole chiave per mezzo di AND o ponendo alternative per mezzo di OR, si riesce in genere a ridurre i risultati ad un piccolo numero veramente rilevante.

Page 19: Motori Di Ricerca

Pierluigi Tavella 19

OPERATORI LOGICI O BOOLEANI Gli operatori logici o booleani prendono il loro nome da George Boole, matematico inglese della prima metà dell’800 che formalizzo la logica binaria che sta alla base dei moderni calcolatori. I principali e più diffusi sono: AND, OR, e NOT a cui si può aggiungere negli strumenti di ricerca NEAR.

ASTERISCO *

VIRGOLETTE " “

PARENTESI ( )

Page 20: Motori Di Ricerca

Pierluigi Tavella 20

Page 21: Motori Di Ricerca

Pierluigi Tavella 21

Utilizzando gli operatori logici e affinando la ricerca dal punto di vista semantico il risultato è sicuramente più adeguato alla nostra domanda.

Ricerca: civiltà and grecia and antica

Risposta: 274.000 per (civiltà and grecia and antica)

Page 22: Motori Di Ricerca

Pierluigi Tavella 22

Page 23: Motori Di Ricerca

Raffinando ancora la ricerca osserviamo come la risposta sia sempre più vicina alle attese; nella slide precedente abbiamo utilizzato le virgolette per racchiudere i termini grecia e antica e And per aggiungere il termine civiltà, il risultato è stato: 19.700 per "grecia antica" and civiltà

Pierluigi Tavella 23

Page 24: Motori Di Ricerca

CONCLUSIONI

Pierluigi Tavella 24

PER EFFETTUARE UNA PROFICUA RICERCA SULLA RETE OCCORE: Fare una ricerca partendo da termini o frasi specifiche. Se non si trova ciò che interessa, allora usare termini più generici. Se si cerca un nome proprio, ad esempio una città oppure un cognome, usare l'iniziale maiuscola (es.: "San Francisco"). Mettere le frasi tra apici (es.: "motori di ricerca"). In questo modo i motori di ricerca cercheranno solo l'esatta sequenza immessa. Le parole inserite tra apici, permettono inoltre di cercare anche quei termini che molti motori di ricerca ignorano, come ad esempio gli articoli e le congiunzioni, oppure voci come internet, web, www, ecc. L'ordine con il quale si inseriscono i termini per la ricerca, è significativo per quasi tutti i motori di ricerca. Quindi digitare i termini più importanti all'inizio. Se non si trova quello che si vuole cercare tra i primi 20 o 30 siti, cambiare la ricerca o provare su un altro motore di ricerca.