Operatori booleani e metodologia per la ricerca ... · Questa sezione propedeutica ci ... AND...

Post on 29-Jul-2018

217 views 0 download

Transcript of Operatori booleani e metodologia per la ricerca ... · Questa sezione propedeutica ci ... AND...

Corso:Banche Dati e sistemi per l’informazione

e la valutazione della ricerca6-7 aprile 2016

Operatori booleani e metodologia per la ricerca

informativa con uso di parole libere

Fabio D’OrsognaFrancesca Servoli

biblioire@ifo.it

Questa sezione propedeutica ci introdurrà all’utilizzo degli operatori

booleani su Google

Tutte le più

importanti banche

dati biomediche e

non solo

utilizzano gli

operatori booleani

per raffinare le

ricerche!

Quanti di voi hanno utilizzato Google per effettuare una ricerca?

Quanti di voi utilizzano o hanno mai utilizzato gli operatori booleani per

raffinare una ricerca con troppi risultati su Google?

A volte una ricerca troppo generica

può risultare poco efficace

Possiamo però aumentare la precisione della nostra

ricerca riducendo il così detto rumore...

...raffinando la nostra ricerca con l’aiuto degli operatori booleani che prendono il nome dal matematico che li teorizzò nell’Ottocento, George Boole, considerato

oggi il padre della logica matematica.

AND esegue il prodotto logico di due o più descrittori ottenendo risultati che contengono contemporaneamente i termini

correlati

L’operatore AND o moltiplicazione logica:

L’operatore OR o somma logica:

OR esegue la somma logica di due o più descrittori reperendo articolo che contengono o l’uno o l’altro o ambedue i termini

L’operatore NOT o sottrazione logica

NOT mi esclude i descrittori non pertinenti ai fini della mia ricerca

Cane AND gatto

Cane OR gatto

Cane NOT gatto

Ed ora facciamo un esercizio su

1. Cercare dei siti che parlino di cani e gatti2. Cercare dei siti che parlino di cani o gatti

3. Cercare dei siti che parlino di cani ma non di gatti

Altri operatori

Troncamento: permette di ricavare da una radice significativa tutte le varianti per quel termine (es. Canc* fa la ricerca su cancro, cancri, cancerogeno ecc. *fibrinogeno prende anche antifibrinogeno)

Simbolo = di solito un asterisco dove si tronca es: neoplas*

Mascheramento: nasconde una o più lettere all’interno della parola es. “Tumo#r” prende anche “tumour”

Il simbolo è di solito un cancelletto.

Adiacenza: ricerca due o più termini uno dietro l’altro. Es. “Tumore del polmone” recupera le parole in sequenza come

una frase. Ricerca cioè la frase completa e non le singole parole.

Simbolo = di solito “due virgolette”

L’operatore NEAR o di prossimità

E' un operatore di prossimita': relaziona due termini collocati nella stessa frase, indipendentemente dal loro ordine o dal numero di termini interposti.

Es. Inflammation near repair (tutte le citazioni che, contenendo i due termini presenti nella stessa frase, presumibilmente corrispondono ad articoli che trattano di correlazione tra questi due termini)

Variabilità degli operatorie dei simboli urtilizzati

• Non sempre sono presenti tutti gli operatori descritti, in alcuni casi può esserci solo l’AND. In alcuni casi vi sono altri operatori oltre quelli indicati.

• Alcuni simboli possono avere un significato diverso. Ad esempio l’asterisco * (o gli asterischi) in Google rappresenta un operatore di prossimità near e non il troncamento.

• I simboli con cui si indicano gli operatori possono cambiare a secondo del sistema in cui entriamo.

• Oltre l’asterisco è possibile trovare il segno di dollaro $ oppure la chiocciola @

• in alcuni casi se si scrive una radice questa viene automaticamente troncata es se scrivo neoplas la ricerca si svolge automaticamente anche su neoplasia, neoplasie, neoplastico…

Riassumendo...

1. L’operatore AND usato per due o più termini aumenta o diminuisce il numero di record ricavati?

2. L’operatore OR aumenta o diminuisce il numero di record?

3. E il troncamento (*)?4. E l’operatore di adiacenza (“...”)?

Altri operatori, come ad esempio i caratteri jolly, non

esistono in Caratteri jolly

(*, $...)A differenza d

i

altri motori di

ricerca Google non

permette l’

utilizzo di

questo sistema che

coinvolgerebbe una

quantità troppo

elevata

Strategia di ricerca di base

• Scrivi una frase che esprima la ricerca, ad esempio:

« Cerco articoli che riguardino i disturbi del sonno legati ai trattamenti chemioterapici»

• Dividi il soggetto in concetti essenziali

(es. disturbo del sonno, chemioterapia)

• Cerca i termini o i descrittori MESH che rappresentino i concetti essenziali

• Una volta individuati i concetti essenziali della ricerca è possibile combinarli con gli operatori booleani

I sinonimi in

Scrivi: ~child Trovi: i sinonimi, le parole affini (family, kid, young ecc…)

Come si digita la

tilde? (~)

Tieni premuto il

tasto ALT

numerica e

contemporaneamente

digita 126

dalla tastiera

*

Google manda in pensione la tilde (“~”)Pochi la conoscono e pochissimi l’hanno utilizzata, ma fino a poco tempo fa la tilde (“~”) era un

carattere che permetteva di rendere più complete le informazioni restituite dal motore di ricerca di Mountain View in seguito alle query; ora questa feature è stata rimossa e non verrà più presa in considerazione dall’algoritmo di Big G.

In pratica, posizionata davanti ad una parola da ricercare su Google, la tilde consentiva di accedere a tutti i suoi sinonimi, essa rappresentava quindi una sorta di chiave semantica grazie alla quale individuare tutte le alternative utilizzabili in luogo di un determinato termine.

La tilde, che come anticipato veniva adottata da un numero estremamente ristretto di utenti, si rivelava invece uno strumento particolarmente utile per i Webmasters e gli esperti di Search Engine Optimization, questo per via del fatto che essa permetteva di capire le dinamiche messe in moto dall’algoritmo di Google per associare tra loro le differenti keywords.

Comunicandone il “pensionamento”, i portavoce di Big G hanno fatto riferimento al suo scarso utilizzo per motivarne l’eliminazione; l’operatore dismesso si sarebbe dimostrato con il tempo un elemento eccessivamente complesso da gestire; essendo impiegato da una parte minoritaria degli utenti, un ulteriore investimento per la sua implementazione non sarebbe stato giustificabile.

La tilde non è più disponibile neanche attraverso l’Help Center di Larry Page e soci, per cui una ricerca effettuata tramite una chiave preceduta da tale operatore produrrà lo stesso risultato possibile in sua assenza.

Pubblicato il 25 giugno 2013

La ricerca avanzata su GoogleSe lanciando una ricerca si ottengono troppi risultati è possibile raffinarla mediante

una ricerca avanzata. Partendo menù verticale della rondella in alto a destra

selezionare Ricerca avanzata

Altre opzioni

Nella schermata di ricerca avanzataPossiamo compilare i campi disponibili invece

di utilizzare gli operatori booleani

Gli operatori booleani su Scopushttp://goo.gl/fEorne

http://images.webofknowledge.com/WOKRS520B4.1/help/WOK/hs_search_operators.html#dsy863-TRS_search_operator_precedence

Searching the Organizations - Enhanced FieldSearch for preferred organization names and/or their name variants from the Preferred Organization Index.Enter complete names or partial names using wildcards (* $ ?). When searching for multiple preferred names or multiple name variants, separate the names using the OR Boolean operator.

Booleans in Organization NamesWhen searching for organization names that contain a Boolean (AND, NOT, NEAR, and SAME), always enclose the word in quotation marks ( " " ). For example:

● (Japan Science "and" Technology Agency (JST))● ("Near" East Univ)● ("OR" Hlth Sci Univ)

You can also enclose the entire query in quotation marks. For example:● "Japan Science and Technology Agency (JST)"● "Near" East Univ"● "OR Hlth Sci Univ"

Search Field versus Search Aid ResultsTyping a name variant in the search field does not always return the same number of results as selecting a name variant from the search aid.For example, entering the variant Columbia Coll in the search field returns all records that contain Columbia Coll anywhere in the Addresses field.Entering Columbia Coll in the Find field in the search aid displays the preferred name Columbia University in the selection list. A search on this name returns records containing the preferred name and records containing the variant.

Organization-Enhanced ExamplesA search on a preferred organization name returns all records that contain the preferred name and all records that contain its name variants. For example,Cornell University returns all records that contain the preferred name (Cornell University) and all records that contain a variant, such as:

● Caltech, Dept Astron, Pasadena, CA 91125 USA● Univ Calif Berkeley, Dept Astron, Berkeley, CA 94720 USA● Cornell Univ, Dept Astron, Ithaca, NY 14853 USA

A search on a name variant returns all records that only contain the variant. For example, Cornell Law Sch returns all records that contain Cornell Law Sch in the Addresses field.

Web of ScienceTM Core Collection Help

Esercitazione

Ricercare su Google

via Milano a Torino

Conoscete o avete mai utilizzato Google Scholar per le

vostre ricerche?

Google Scholar permette di effettuare un'ampia ricerca sulla letteratura accademica. E’ possibile effettuare ricerche tra molte discipline e fonti:

documenti approvati per la pubblicazione, tesi, libri, abstract e articoli di case editrici accademiche, ordini professionali, database di studi non

ancora pubblicati, università e altre organizzazioni accademiche.

Come vengono classificati gli articoli?Google Scholar mira ad elencare gli articoli in base alla stessa classificazione

adottata dal mondo scientifico, ossia valutando il testo completo di un articolo, l'autore, la pubblicazione in cui è riportato e il numero di volte in

cui viene citato in altri documenti accademici. I risultati più pertinenti vengono sempre visualizzati nella prima pagina.

Limiti: contenuti e qualità?

Non si hanno dati sulla copertura:

Quante e quali riviste?

Quanti e quali libri?

Quante e quali tesi?

In molte aree di ricerca le versioni di un lavoro possono apparire

come documenti precedenti alla pubblicazione oppure relazioni

di conferenze prima di essere pubblicate come l'articolo di una

rivista. Queste versioni preliminari di un lavoro sono spesso

citate in aggiunta alla versione definitiva della rivista.

Il numero di citazioni di un determinato lavoro è importante per

determinarne la classificazione tra i risultati della ricerca in

Google Scholar. Il raggruppamento delle versioni ci consente di

raccogliere tutte le citazioni di tutte le versioni di un lavoro. In

pratica questo può notevolmente migliorare la posizione di un

articolo nei risultati di ricerca.

Diverse versioni di un lavoro scientifico

• Documenti precedenti alla pubblicazione (es. manoscritti prima della revisione tra pari).

• Relazioni di conferenze prima di essere pubblicate come l'articolo di una rivista.

• Queste versioni preliminari sono spesso citate in aggiunta alla versione definitiva della rivista.

• In Google Scholar il raggruppamento delle versioni consente di raccogliere tutte le citazioni di tutte le versioni di un lavoro.

Google Scholar collabora anche con le biblioteche

E’ possibile configurare il Linksolver su Google Scholar in modo da permettere l’accesso ai

documenti cui si ha diritto (es. Bibliosan)

In tal modo si disporrà direttamente su Google dei testi interi di articoli che si sono sottoscritti

Esempio di citazione da Google Scholar

Archivi aperti

Google Scholar permette il recupero di documenti da archivi aperti ed istituzionali

disponibili liberamente su Web

Proviamo a fare un ricerca!

Inseriamo su Google Scholar

la parola Cancro

Elenco di risultati inserendo la parola Cancro

La ricerca per parola libera:

Non risolve le ambiguità: cancro malattia, segno zodiacale o tropico del

cancro?Nel caso della malattia non mi permette inoltre di ricercare i

singoli tipi di cancro es. Mieloma, leucemia…

https://scholar.google.it/intl/it/scholar/help.html

Esercitazione

Trovare in Google Scholar

una tesi pubblicata nel 2010

sulla storia del gruppo musicale R.E.M. (1983-1993)

Esercitazione

Cercare su Google Scholar documenti relativi a studi in vivo ad esclusione di quelli

che trattino anche di studi in vitro

Il più davanti una stop word la rende ricercabile