Post on 02-May-2015
La ricerca di informazioni in internet
La ricerca di informazioni in Internet
Premessa
Internet non è ancora il deposito universale della conoscenza umana
Per redigere una tesi, uno studio o un dossier ben fatti è necessario integrare le fonti informative reperibili via web con quelle più tradizionali.
Internet mette a disposizione informazioni di natura assai eterogenea (documenti, immagini, filmati, ecc.) diffuse attraverso canali diversi, accessibili con strumenti diversi.
Commette un errore di valutazione chi ritiene che trovare le informazione su Internet sia relativamente semplice.
Per svolgere una ricerca in Internet
Non basta conoscere che cosa si vuole trovare
Occorre anche sapere: quale è la natura dell'informazione che vogliamo
ricercare dove può essere reperita con quali strumenti
Non possiamo cercare in un unico postoNon possiamo usare un solo strumento di ricerca.
La ricerca di informazioni in Internet
STRUTTURATE
Banche dati specializzate accessibili via web
Il cui contenuto è accessibile attraverso Internet, ma non utilizzando i motori di ricerca.
Raccolte di documenti in formato XML
DESTRUTTURATE
Pagine web (ricercabili con i motori di ricerca)
Quasi sempre le pagine che vediamo vengono costruite dinamicamente e quindi non esistono prima della ricerca stessa. I contenuti sono registrati nei data base che restituiscono le informazioni dietro richiesta (Query)
Natura delle informazioni
La ricerca di informazioni in Internet
Affidabilità delle informazioni
L'informazione contenuta in una banca dati è in genere puntuale e affidabile
L’informazione contenuta sulle pagine Web è più difficile da valutare dal punto di vista dell'affidabilità
Occorre: cercare di capire chi è l’autore della pagina, in quale contesto si colloca la pubblicazione e le finalità ( prestare attenzione al sito che ospita la pagina) tener conto che sul Web l’informazione viene aggiornata, rimossa o spostata. considerare le difficoltà di padroneggiare una gran mole di informazioni reperibili.
La ricerca di informazioni in Internet
Gli strumenti di ricerca disponibili in rete
Le basi dati strutturate sono consultabili solo utilizzando le specifiche interfacce messe a disposizione.
Prima di avviare la ricerca, è opportuno consultate le pagine
di aiuto per cercare di conoscere: La struttura della base di dati e la tipologia dei campi presenti il sistema di classificazione adottato (se presente) i tipi di ricerca possibili, gli operatori utilizzabili e la loro sintassi
La ricerca di informazioni in Internet
Per fortuna molte banche dati offrono delle interfacce 'amichevoli' che ci assistono nella compilazione dei moduli.
I motori di ricerca per terminie
Gli indici sistematici (Directory)
La ricerca di informazioni in Internet
I motori di ricerca per termini
Permettono di ricercare parole o combinazioni di parole
Il loro utilizzo è relativamente semplice
Risultano efficaci se scegliamo bene i termini di ricerca (l’elenco di pagine inizierà
con quelle per noi più significative.)
La ricerca di informazioni in Internet
i motori di ricerca cercano di aiutarci ‘pesando' i risultati.
Le ricerche avvengono su un indice interno al motore costruito da un software (Crawler) che percorre di continuo la rete alla ricerca dei siti, seguendo ogni link che incontra, a partire dalla Home page, e indicizzando tutte le pagine
percorse
Nessun motore di ricerca è in grado di indicizzare tutte le pagine presenti sulla rete
La ricerca di informazioni in Internet
I motori di ricerca per termini
I motori di ricerca per termini più noti
Google è diventato in pochissimi anni "il motore di ricerca" sul Web, e deve in gran parte la sua notorietà all'algoritmo di ordinamento dei risultati molto sofisticato ed efficace che ha la funzione di elencare per prime le pagine più rilevanti per la nostra ricerca.
Google Fight (http://www.googlefight.com/) confronta il numero di occorrenze di due termini all'interno degli indici di Google
Google toolbar plug-in che si integra con il browser ed offre una casella per la ricerca su Google di pagine Web, immagini, notizie, quotazioni di borsa, la Open Directory, newsgroup ed altre funzionalità
Google dance descrive ciò che succede quando i tre server principali di Google non essendo perfettamente allineati forniscono risultati discordanti.
Google influenza le abitudini di navigazione e i siti vengono spesso valutati sulla base della loro visibilità su Google.
La ricerca di informazioni in Internet
(http://www.alltheweb.com/), dopo Google viene considerato uno dei migliori motori di ricerca. Si caratterizza per il modulo di ricerca avanzata che risulta molto completo e articolato.
(http://www.altavista.com/) prima di Google era considerato il miglior motore di ricerca web. è stato fra i primi siti a offrire un servizio gratuito di traduzione automatica, denominato Babelfish
Yahoo! Dopo aver acquistato la Inktomi (società specializzata nei servizi diricerca Web) offre oltre alla ben nota la Directory anche un motore di ricerca per termini.
(http://search.msn.com/). dispone sia di indici sistematici sia di un mtore di ricerca su Web
permette di ricercare tutti i termini che hanno in comune una stessa radice ('stemming')
La ricerca di informazioni in Internet
I motori di ricerca per termini più noti
I motori di ricerca meno noti
Ask Jeeves (http://www.ask.com/) offre come peculiarità la possibilità di formulare le domande in linguaggio naturale ma una banca dati relativamente piccola. 8 - Gli indici sistematici (Directory)
HotBot (http://www.hotbot.com/) è stato uno dei primi motori di ricerca dotati di funzioni di ricerca avanzate, dopo l’avvento di Google ha perso popolarità.
Motori di ricerca italiani si avvalgono delle funzionalità di ricerca offerte dai motori più noti:
Arianna (http://arianna.libero.it/) – AllthewebExcite.it (http://www.excite.it/) - Alltheweb Tiscali (http://www.tiscali.it/) - Alltheweb Kataweb (http://www.kataweb.it/) - Yahoo!.itSupereva (http://www.supereva.it/) -Yahoo!.it
Virgilio (http://www.virgilio.it/) - Yahoo!.it
La ricerca di informazioni in Internet
Gli indici sistematici (Directory)La ricerca avviene su un insieme di risorse che vengono
classificate e organizzate gerarchicamente in categorie e sottocategorie (catalogo)
Questi indici sono organizzati ad albero, si passa dalle categorizzazioni più generali a quelle più specifiche.
La qualità degli indici è determinata dal sistema di classificazione adottato e dalle metodologie di classificazione.
Mentre i motori di ricerca per termini indicizzano pagine web gli indici sistematici indicizzano interi siti
Gli indici sistematici indicizzano un numero di pagine nettamente inferiore a quello dei motori di ricerca per termini
Il vantaggio offerto da questi indici è dovuto al fatto che le informazioni restituite sono pertinenti.
La ricerca di informazioni in Internet
Gli indici sitematici di risorse più noti
Yahoo! (http://dir.yahoo.com/) da alcuni anni offre anche un motore di ricerca per termini. Si avvale di redattori
specializzati per la catalogazione delle risorse Open Directory (http://dmoz.org/), si avvale invece delle
segnalazioni di un nutrito gruppo di volontari e di un sistema di controllo per verificare l'affidabilità delle segnalazioni.
About (http://www.about.com/): censisce un numero di siti nettamente inferiore rispetto agli indici prima citati ma commenta e accompagna con articoli efficaci le risorse indicizzate.
Nel panorama italiano i piu noti sono:
Virgilio http://www.virgilio.it/Arianna http://arianna.libero.it/Supereva http://dir.supereva.it/
La ricerca di informazioni in Internet
Per approfondire le conoscenze
sui motori di ricerca
La ricerca di informazioni in Internet
Search Engine Watch (http://www.searchenginewatch.com/) è un sito che mette sotto osservazione diversi motori di ricerca valutandone caratteristiche e prestazioni. Offre anche notizie e suggerimenti oltre che pubblicare le recensioni delle principali riviste di settore.
Motoridiricerca (http://www.motoridiricerca.it/) è il sito italiano che mette a disposizione informazioni sui motori di ricerca.
I metamotori di ricerca
La ricerca di informazioni in Internet
permettono di interrogare sequenzialmente o contemporaneamente diversi motori di ricerca e di raccogliere i risultati in un'unica lista.
offrono una interfaccia unica, ma non riesconoa sfruttare appieno le potenzialità dei diversi motori di ricerca
Il più interessante di questi strumenti è
Fagan Finder (http://www.faganfinder.com/). offre strumenti di ricerca e di metaricerca con la possibilità di selezionare e avviare le ricerche dall'interno delle sue pagine.
Gli agenti software
La ricerca di informazioni in Internet
Sono dei programmi a cui possono essere affidati dei compiti da svolgere, per proprio conto, quali l'esecuzione, a intervalli prefissati, di determinate ricerche.
Copernic Agent (http://www.copernic.com/) è il più noto di questi agenti è in grado di svolgere automaticamente e in maniera programmata ricerche su un insieme molto vasto di fonti.
si integra in Internet Explorer, aggiungendovi una barra degli strumenti che offre funzioni simili a quelle della toolbar di Google, con in più un campo per la selezione e il lancio delle metaricerche.
Banche dati specialistiche
IL MOTORE DI RICERCA DEGLI ATTI DI INDIRIZZO E CONTROLLO
DI CAMERA e SENATO
mozioni, interpellanze, risoluzioni, interrogazioni e ordini del giorno
(pubblicato sul sito della Camera dei deputati)
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
i documenti della banca dati sono costituiti dai fascicoli degli atti di indirizzo e controllo predisposti dalla Camera per gli atti presentati ad entrambi i rami del Parlamento (in quanto solo sul sito della Camera, per accordi tra le due Amministrazioni, è presente il motore di ricerca di tali atti)
ogni fascicolo contiene il ramo, il tipo, il numero, il testo e i firmatari dell’atto, nonché la classificazione materia con i descrittori TESEO e i dati di iter alla Camera o al Senato
Motore di ricerca degli Atti di Indirizzo e Controllo
La ricerca semplice può avvenire (i diversi canali sono in AND):
per parole del testo (con diversi operatori logici) per tipo di atto (tramite menu a tendina, se mozione,
interpellanza, interrogazione orale, interrogazione a risposta scritta, interrogazione a risposta in Commissione, risoluzione in Assemblea, risoluzione in Commissione, risoluzione conclusiva di dibattito, ordine del giorno in Assemblea su PDL o mozione, ordine del giorno in Commissione su PDL)
per data di presentazione e/o di conclusione dell’atto
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
la ricerca avanzata può avvenire (i diversi canali sono in AND):per tipo e numero atto (tramite menu a tendina)per parlamentare (specificando, in OR, se presentatore, cofirmatario o partecipante allo svolgimento) per membro di Governo intervenuto nello svolgimento (specificando, in OR, se per dichiarazione, comunicazione, risposta o parere)per data (di presentazione e/o di conclusione dell’atto)per gruppo parlamentare di appartenenza del 1° firmatarioper ministero destinatario dell’atto (tramite menu a tendina)per commissione assegnataria dell’atto (specificando, in OR, quale e con distinzione del ramo)per fase iter (specificando, in OR, se ancora in corso oppure se concluso e in tale caso qualificando – tramite menu a tendina - il tipo di conclusione)per classificazione materia (sistema TESEO)per parole del testo (con diversi operatori logici)
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
la scelta dei descrittori materia di TESEO può avvenire navigando il Thesaurus (a differenza del motore di ricerca dei PDL del Senato, di cui all’all. n. 18, si accede solo alla lista “Monotermini (KWOC)“)
è possibile accedere anche alle liste di TESEO relative “SIGLE e DENOMINAZIONI” e “NOMI GEOGRAFICI” (comuni, province e regioni)
è possibile accedere anche ad una lista (non di TESEO) denominata “ALTRI TERMINI”, usati in sede di classificazione dell’atto
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
Sono presenti le funzioni:“Conta Atti” (per avere in tempi brevi un’anteprima del numero dei documenti risultato della ricerca)
di distribuzione del risultato della ricerca per tipo atto, per Gruppo parlamentare del 1° firmatario, per Ministero delegato a rispondere e per Commissione assegnataria dell’atto
di highlighting sul risultato della ricerca
di stampa del singolo fascicolo ottenuto in risposta (od anche di conversione in PDF) di accesso da ogni fascicolo ottenuto in risposta alle schede personali (dei firmatari e degli intervenuti nello svolgimento)
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
la ricerca avanzata può avvenire (i diversi canali sono in AND):per tipo e numero atto (tramite menu a tendina)per parlamentare (specificando, in OR, se presentatore, cofirmatario o partecipante allo svolgimento)
per membro di Governo intervenuto nello svolgimento (specificando, in OR, se per dichiarazione, comunicazione, risposta o parere)
per data (di presentazione e/o di conclusione dell’atto)
per gruppo parlamentare di appartenenza del 1° firmatario
per ministero destinatario dell’atto (tramite menu a tendina)per commissione assegnataria dell’atto (specificando, in OR, quale e con distinzione del ramo)
per fase iter (specificando, in OR, se ancora in corso oppure se concluso e in tale caso qualificando – tramite menu a tendina - il tipo di conclusione)
per classificazione materia (sistema TESEO)per parole del testo (con diversi operatori logici)
Motore di ricerca degli Atti di Indirizzo e Controllo
Principali caratteristiche
1
2
3
1
1
2
A
1
1
funzione di highlighting
1 2
A
1
2
AAB
1
1
1
funzione di highlighting
IL MOTORE DI RICERCA DEI DIBATTITI ALLA CAMERA
(sul sito della Camera dei deputati)
Il Motore di ricerca dei Dibattiti della Camera
i documenti della banca dati sono costituiti dai dibattiti (in testo integrale) svolti alla Camera presso qualsiasi organo (Assemblea, Commissioni permanenti, Giunte, Comitato per la legislazione e Commissioni bicamerali)
è presente un documento per ogni dibattito svolto in una determinata seduta dell’organo (ricomponendone l’unitariètà qualora nella seduta il dibattito sia stato svolto in più riprese)
NOTA: se il dibattito è proseguito in altre sedute, esisteranno in banca dati tanti documenti quante sono state le prosecuzioni
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
nel caso dell’Assemblea i documenti contengono il testo del resoconto stenografico dei dibattiti (pubblicato nel Resoconto stenografico dell’Assemblea), per gli altri organi il testo del resoconto sommario (pubblicato nel Bollettino delle Giunte e delle Commissioni parlamentari)
Nota: i testi contengono le correzioni pubblicate in sedute successive tramite gli avvisi di errata corrige
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
l’Unità Documento è costituita dal titolo e dal testo dei singoli interventi del dibattitoNOTA: il titolo del dibattito è espresso nella forma di sintesi in cui è presente nell’indice dello Stenografico dell’Assemblea ovvero nel Sommario di ogni resoconto del Bollettino delle Giunte e Commissioni
nei documenti sono presenti le seguenti classificazioni (tutte utilizzabili in sede di ricerca tramite menu a tendina):
della materia dei dibattiti non legislativi (rappresentata da voci di attività che esprimono l’oggetto del dibattito)delle fasi procedimentali dei dibattiti legislativi svolti in Assembleadelle sedi dei dibattiti legislativi svolti in Commissione e nel Comitato per la legislazione
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
1. Principali caratteristichela ricerca semplice può avvenire (i diversi canali sono in AND):
per parole del titolo e del testo dei singoli interventi del dibattito (con diversi operatori logici)
per attività (specificando, in OR, se legislativa o non legislativa e, in quest’ultimo caso, eventualmente la tipologia di attività, selezionata da apposito menu a tendina)
per data di svolgimento del dibattito
Il Motore di ricerca dei Dibattiti della Camera
la ricerca avanzata può avvenire (i diversi canali sono in AND):
per attività ed organo (specificando, in OR, se attività legislativa o non legislativa e nel loro ambito l’organo ed eventualmente la tipologia di attività) (le voci d’interesse vanno selezionate da appositi menu a tendina)per deputato, per presidente di turno, per membro di Governo intervenutoper parole del titolo (con diversi operatori logici)per parole del testo degli interventi del dibattito (con diversi operatori logici), specificando se del caso, in AND o in OR, uno o più oratori cui riferire le parole impostateper data del dibattitoper numero atto (specificando se progetto di legge, documento parlamentare in numero romano, cioè DOC, atto del Governo presentato per il parere, atto di indirizzo e controllo)
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
sono presenti le funzioni:“Conta Atti” (per avere in tempi brevi un’anteprima del numero dei documenti risultato della ricerca)“Cronologia delle ricerche” (vengono conservate tutte le ricerche effettuate in una sessione di ricerca con possibilità di combinarle in AND, OR e NOT, eventualmente utilizzando anche le parentesi) di highlighting sul risultato della ricerca (e secondo le condizioni impostate nella query)“Crea dossier personale” (dai documenti risultato di una ricerca è possibile estrarre l’insieme degli interventi effettuati da un determinato oratore per stamparli o convertirli in formato Word) “Stampa/Esporta risultati” (è possibile stampare o convertire in PDF o Word la lista dei documenti risultato di una ricerca)“Preferenze” (è possibile impostare, tra l’altro, l’ordine di presentazione del risultato della ricerca e il numero massimo di documenti ottenibili in risposta)
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
dai documenti risultato della ricerca si può accedere:
alle schede personali (tramite la scheda dibattito che elenca gli intervenuti) alle schede dei lavori preparatori dei PDL ai testi dei DOC (documenti in numero romano) e degli atti normativi del Governo presentati per il parere ai testi richiamati all’interno del dibattito (ad esempio, i documenti esaminati nel corso della seduta e i prospetti delle votazioni qualificate)
Il Motore di ricerca dei Dibattiti della Camera
Principali caratteristiche
1
2
3
1
A
1
vedere la diapositiva n. 13
HELP DI CONTESTOdal link A della diapositiva n. 11
1
2
3
la schermata segue nella diapositiva appresso
funzione di highlighting
1
funzione di highlighting
1
parti della schermata seguono nelle successive due diapositive
1
l’impostazione della ricerca segue nella diapositiva successiva
1
1
1
IL MOTORE DI RICERCA DEI PROGETTI DI LEGGE PRESENTATI ALLA
CAMERA e AL SENATO
(pubblicato sul sito del Senato)
Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
i documenti della della banca dati sono costituiti dalle schede dei lavori preparatori dei PDL, predisposte dal Senato per i PDL di entrambi i rami del Parlamento
NOTA: si ricorda che la Camera predispone e presenta sul proprio sito le schede dei lavori preparatori relative ai propri PDL (le quali non sono corredate della classificazione materia, a differenza delle schede Senato)
la ricerca semplice può avvenire per numero di PDL (precisando se Camera o Senato oppure entrambi i rami) e per parole del titolo (con diversi operatori logici)
Il Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
Principali caratteristiche
la ricerca avanzata può avvenire (i diversi canali sono in AND):
per parole del titolo (con diversi operatori logici)per estremi (natura, lettura, legge, decreto-legge, Gazzetta Ufficiale)per stato iter (per tipo di conclusione o di non conclusione)per classificazione materia (sistema TESEO)per iniziativaper dati di assegnazioneper dati di trattazione per relatori ed interventi
non è consentita la ricerca per parole del testo del PDL
Il Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
Principali caratteristiche
la scelta dei descrittori materia di TESEO può avvenire navigando il Thesaurus (si può risalire al descrittore anche partendo da un sinonimo, utilizzando ad esempio la lista “Monotermini (KWOC)“ proposta inizialmente dal sistema)
Teseo consente di accedere, oltre che a diverse liste dei descrittori materia, anche alle liste “NOMI PROPRI” e “NOMI GEOPOLITICI” (comuni, province e regioni)
non è presente la funzione di highlighting sul risultato della ricerca
Il Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
Principali caratteristiche
1
2
3
l’operatore AND è di default
1Premere CERCA
1
manca la funzione di highlighting
si va alla scheda Senato della lettura Camera
1
la schermata segue nella diapositiva appresso
A manca la funzione di highlighting
1
è il link 1 della diapositiva n. 8
1
si va al testo del resoconto della seduta
1
si va al testo del resoconto della seduta
non si va al testo degli interventi
scheda Senato della lettura Camera
1
è il link A della diapositiva n. 8
si va alla scheda della Camera (già presentata nell’All. 7)
1
non si va al testo del resoconto della seduta
scheda Senato della lettura Camera
non si va al testo degli interventi
1
thesaurus generalista con circa 3.700 descrittori organizzati gerarchicamente su 45 canali tematici, utilizzando le relazioni BT (termine + generico), NT (termine + specifico e RT (affinità).
per trattare le sinonimie e le equivalenze si usano le relazioni di preferenza US (usa) e UF (usato per)
1
2
consente di accedere, oltre che alla sezione materia di TESEO, anche alla sezione NOMI PROPRI e GEOPOLITICI (comuni, province e regioni)
lista alfabetica dei descrittori di TESEO e dei sinonimi, ordinata per ciascuna parola componente
1
2contrassegnando il check-box, si seleziona il descrittore
premere il bottone CERCA
1
1
Sinonimo Descrittore
INFEZIONE DA HIV AIDS
FEDERALISMO FISCALE FINANZA REGIONALE
CONGEDO FERIE
Altri esempi:
contrassegnando il check-box, si seleziona il descrittore corrispondente al sinonimo
LE SERIE STORICHE DEGLI ATTI PARLAMENTARI
l’Assemblea Costituenteil Parlamento in seduta comune
le Legislature repubblicane
(sul sito della Camera dei deputati)
Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
1
1
A
1
A
è il link A della diapositiva n.4
è il link A della diapositiva n. 3
IL MOTORE DI RICERCA DELLE LEGGI REGIONALI
(sul sito della Camera dei deputati)
Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
Solo testo storico Unità Documento (U.D.) = titolo, singoli articoli, singoli allegati Nota: il risultato della ricerca riporta solo le U.D. pertinenti, consentendo però l’accesso alle altre U.D. della leggeRiferimenti attivi navigabili,ma fuori dal testo, e con puntamento preciso all’U.D. Riferimenti passivi navigabili e con puntamento preciso all’U.D. Canali della ricerca avanzata (tutti in AND): parole del titolo, parole dell’articolo, parole dell’allegato Funzione di highlighting delle parole della query e secondo le condizioni impostate
Il Motore di ricerca delle Leggi Regionali
Principali caratteristiche
1
2
3
1
1
2
3
A
B
selezionare più regioni tenendo premuto il tasto Ctrl
si può usare anche la parola tronca ricorrendo al carattere *
Articoli pertinenti in rosso e presenti in out, vedere la diapositiva appresso
1
funzione di highlighting
funzione di highlighting
è il link 1 della diapositiva n. 6
vedere la rimanente parte del documento nella successiva diapositiva
unica Unità Documento pertinente
Unità Documento richiamata dal riferimento passivo, ma senza la funzione di highlighting
riferimento attivo navigabile, ma esposto fuori dal testo
stessa legge della diapositiva n. 8, però ottenuta come risultato della ricerca
Unità Documento risultate pertinenti dalla ricerca
ulteriore abrogazione
la virgola vale come operatore logico AND
1
A
1
funzione di highlighting
vedere la rimanente parte del documento nella diapositiva successiva
funzione di highlighting e secondo le condizioni della query
va in rosso solo nel titolo
AIUTI ALLA NAVIGAZIONE elenchi di siti utili
(sui siti di Camera e Senato)
Motore di ricerca dei Progetti di Legge presentati alla Camera e al Senato
1
1
1
1
A
1
2
è il link A della diapositiva precedente
1
1
2
Grazie per l’attenzione.