INFORMATICA 16-Internet - ricerca · Motori di ricerca Ricerche sul WEB: Google Bing Yahoo I motori...

Post on 13-Jul-2020

2 views 0 download

Transcript of INFORMATICA 16-Internet - ricerca · Motori di ricerca Ricerche sul WEB: Google Bing Yahoo I motori...

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 1

INFORMATICA16-Internet - ricerca

Marco Trapanitrapani.marco@gmail.com

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 2

Interrogazioni� Informazioni �Base dati di indicizzazione� Interrogazione�Risultati

Una ricerca passa attraverso quattro fasi fondamentali:

1) Informazioni: sembra ovvio, ma non lo è: prima di poter fare una qualsiasi ricerca è necessario che ci siano le informazioni in cui cercare; se io volessi fare una ricerca sul “linguaggio degli xylopheti” (abitanti del 4°pianeta abitabile su Vega) probabilmente la ricerca finisce prima ancora di cominciare… non ci sono informazioni di alcun genere in merito !

2) è anche necessario che qualcuno abbia raccolto le informazioni in un modo organizzato: se cerco un libro in un grande capannone dove un milione di libri sono stati gettati e rimescolati alla rinfusa da una scavatrice, probabilmente la mia ricerca è impossibile: diciamo come il proverbiale “ago nel pagliaio”

3) Ovviamente dovrò fare qualcosa, ossia porre la mia domanda in un modo organizzato e coerente.

4) Solo alla fine potrò ottenere dei risultati che abbiano una qualche ragionevolezza.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 3

Interrogazioni� Informazioni

�Libri di una biblioteca�Riviste, Giornali�Clienti, Fornitori, Dipendenti�Pazienti, Medici�Esperimenti scientifici…

Possiamo considerare “informazioni” praticamente qualsiasi cosa; ovviamente dovremo porre dei limiti, perché probabilmente quale sia il peso della polvere depositata sulle ali di una farfalla della collezione di Mr Johnson, oscuro collezionista di Tuscon, Arizona, non gliene frega niente a nessuno (forse neanche a Mr Johnson)

Le informazioni “rilevanti” sono poi da valutare come facenti parte di un insieme “coerente” e significativo; è da notare che ci sono molti casi di sovrapposizione, dove le informazioni, ad esempio, riguardanti una persona possono essere inserite in più raccolte: potrebbe essere cliente di alcune aziende, fornitore o dipendente di altre, paziente di un medico, autore di un libro e, anche, iscritto in una biblioteca per il prestito.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 4

Interrogazioni�Base dati di indicizzazione

�Catalogo libri�Base dati bibliografica�DB Aziendali�………

Le informazioni vengono catalogate (inserite) in appositi spazi (che possono essere fisici, come il catalogo cartaceo di una biblioteca “vecchio stile”) o in “archivi” denominati “Data Base” interrogabili su computer.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 5

Interrogazioni� Interrogazione

�Linguaggi di ”query”�Termini di ricerca�Regole di interrogazione

� AND / OR / NOT

Per interrogare un qualsiasi DB dobbiamo usare uno specifico “linguaggio”; spesso non ci si accorge nemmeno di farlo perché i programmi di interrogazione mettono a disposizione delle “maschere” di interrogazione che facilitano l’utente.

Un aspetto importante delle interrogazioni è la ricerca dei giusti termini di ricerca; questo può essere molto facile per interrogazioni elementari (per cercare un libro si può cercare tramite il cognome dell’autore) ma diventare molto complesso se stiamo cercando in una base dati “documentale”, ad esempio che comprenda tutti gli articoli pubblicati da una rivista negli ultimi 10 anni: se cerchiamo “Pesca”, come facciamo a sapere se i risultati riguarderanno la pesca sportiva, i problemi della pesca in mare o la coltivazione delle pesche ? (e perché non articoli sulla produzione della marmellata di pesche, sulla pelle “vellutata come una pesca” di una giovane attrice…)

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 6

AND

Mettere due termini di ricerca in relazione AND significa voler “restringere il cerchio”; in pratica all’interno di tutti i possibili risultati ottenibili con il primo termine (l’ovale più largo) si esegue una seconda selezione che permette di individuare tutti i soggetti interessanti.

BIANCHI AND VESTITOBLU

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 7

OR

La relazione OR invece permette di eseguire DUE ricerche in contemporanea, e di ottenere, in un’unica ricerca, tutti gli elementi che sono significativi per il primo termine e quelli che sono significativi per il secondo;

VESTITOROSSO OR BLU

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 8

AND / OR

La relazione OR invece permette di eseguire DUE ricerche in contemporanea, e di ottenere, in un’unica ricerca, tutti gli elementi che sono significativi per il primo termine e quelli che sono significativi per il secondo;

BIANCHI = 8 risposte

VESTITIBLU = 4 risposte

BIANCHI OR VESTITIBLU = 10 risposte

BIANCHI AND VESTITOBLUR = 2 risposte

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 9

NOT

X

X

X

X X

X

X

NOT permette di escludere soggetti; aggiunto a AND e OR permette di “affinare”ulteriormente la ricerca.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 10

Interrogazioni�Risultati

�Contenuto completo�Riferimenti all’origine

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 11

Problemi�Silenzio / Rumore

� In ogni ricerca si può avere: � Silenzio : quando i dati non vengono estratti

� Rumore : quando vengono estratti dati non pertinenti

Tutti i criteri di catalogazione e di ricerca devono essere attentamente studiati per diminuire le interferenze provocate da

Silenzio: otteniamo una lista di risultati, che però NON comprende alcuni elementi che sarebbero stati per noi interessanti

Rumore: nella lista di risultati sono presenti degli elementi che NON ci interessano.

Esempio molto chiaro: provate a ricercare su GOOGLE il vostro “nome e cognome”: molto probabilmente otterete una grande, grandissima quantità di RUMORE, ossia di riferimenti a pagine che niente hanno a che vedere con voi….

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 12

Interrogazioni�Silenzio

� le informazioni desiderate ci sarebbero

� non ottengo risposta � errore nella domanda

Provate a cercare l’esame “abilità informatiche”…

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 13

Interrogazioni�Rumore

� Domanda troppo generica� Troppe risposte

� Impossibile selezionare

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 14

Cosa ?

H HHHH H HH H

HWEB

Il WEB (che noi consideriamo spesso come la “summa” del contenuto di internet, in effetti è solo la superficie: spesso in siti internet troviamo il modo di interrogare banche dati che non sono “visibili” dal web ma solo attraverso specifiche interrogazioni presenti in una pagina web.

Per questo le ricerche solo sul WEB (es. Google) sono necessariamente parziali, potendo indicizzare si tutte le pagine web, ma non i Data Base che sono al di sotto di esse.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 15

Motori di ricerca�Ricerche sul WEB:

�Google�Bing�Yahoo

I motori di ricerca più noti ed usati su internet sono, ad oggi:

Google

BING (della Microsoft

Yahoo

E’ però una situazione fluida, sia per la notevole competizione sia per possibili accordi commerciali che spostano l’utenza dall’una all’altra parte.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 16

Motori di ricerca�Ricerche sul WEB:

�Meccanismo: �Ragno �Base dati pagine � Interrogazione “guidata”

Il meccanismo di funzionamento è simile:

Esistono dei programmi “ragno” (Crawler) che, ad intervalli regolari, “percorrono”la rete esaminandone tutti i “link” e indicizzando tutte le pagine che riescono via via a raggiungere.

Il contenuto delle pagine viene memorizzato in appositi data-base per consneitrel’indicizzazione e la ricerca “veloce” di termini e simili; questo è il motivo per cui una pagina “appena creata” non viene trovata tramite i motori di ricerca: si devono aspettare talvolta alcuni giorni perché il “ragno” dei vari motori di ricerca “passi” sulla pagina creata e la indicizzi.

L’interrogazione, infine, viene fatta con apposite maschere di ricerca guidata.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 17

GOOGLE� Maschera BASE

La maschera base di GOOGLE è una delle pagine più “clikkate” del WEB: estremamente semplice, permette di inserire delle “parole chiave” e cliccare su “cerca con google”; il pulsante “Mi sento fortunato” ritorna una sola referenza, quella più “indicizzata”.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 18

GOOGLE� Maschera BASE

La ricerca avanzata è sicuramente quella più utile per poter meglio selezionare tra le centinaia (spesso decine o centinaia di migliaia) di referenze che google trova.

Di particolare utilità la ricerca per “tipo file” che permette di selezionare solo file PDF o PPT, nonche la ricerca in uno specifico dominio (es. solo in unifi.it)

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 19

1° livello �Wikipedia it.wikipedia.org

� risorse multimediali commons.wikimedia.org� manuali e libri di testo www.wikibooks.org� fonte di notizie www.wikinews.org� aforismi e citazioni www.wikiquote.org� biblioteca digitale www.wikisource.org� specie viventi species.wikimedia.org� risorse e attività didattiche www.wikiversity.org� dizionario e lessico www.wiktionary.org

Wikipedia è una interessante fonte di primo approccio, ma per il suo meccanismo “cooperativo” e “non certificato” necessita SEMPRE di essere verificata dall’utente, sia tramite i link di “approfondimento”, sia tramite fonti diverse, sia tramite il semplice buon senso.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 20

2° livello�Ricerca BIBLIOGRAFICA:

� opac.unifi.it� www.comune.firenze.it/sdiaf/� www.bncf.firenze.sbn.it/� www.liberliber.it/home/index.php� www.internetculturale.it/moduli/opac/opac.jsp� www.ncbi.nlm.nih.gov/sites/entrez� www.cortedicassazione.it/� www.cerdef.it

Esistono centinaia, per non dire migliaia, di banche dati accessibili dal WEB per le più diverse materie e argomentazioni; ognuna ha regole proprie, ma i concetti generali esposti sono sempre più o meno validi.

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 21

2° livello�Accesso gratuito:

�www.treccani.it�www.wordreference.com/it/�www.gens.labo.net/it/cognomi/�www.santiebeati.it/index.html

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 22

Immagini�Ricerca Immagini

�Google�Ricerca per parole associate

�Progetti: �Riconoscimento automatico

immagini

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 23

Problema delle fonti� Informazioni reperite:

�Completezza�Correttezza �Verificabilità

�Autore�Verificabilità�Autorevolezza

16-Internet - la ricerca

MARCO TRAPANI -trapani.marco@gmail.com 24

Homework�Trovare materiale aggiuntivo per i

temi del corso, esclusivamente: �In formato PDF�Liberi da copyright o con licenza

FREE (cc o gnu) �Autorevoli …

�Mail to: trapani.marco@gmail.com