Rumore Silenzio

22
Simonetta Leonardi IULIN E elaborato mod. 1 1 M M etodi di ricerca in etodi di ricerca in ambienti multimediali ambienti multimediali Effetto silenzio e rumore Effetto silenzio e rumore Le ambiguità del Le ambiguità del linguaggio libero linguaggio libero A cura di Simonetta Leonardi IULINE

description

Information retrievalle ambiguita del linguaggio libero, l'effetto silenzio e l'effetto rumore

Transcript of Rumore Silenzio

Page 1: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

1

MMetodi di ricerca in ambienti etodi di ricerca in ambienti multimedialimultimediali

Effetto silenzio e rumoreEffetto silenzio e rumore

Le ambiguità del linguaggio liberoLe ambiguità del linguaggio libero

A cura di Simonetta Leonardi IULINE

Page 2: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

2

Utilizzare Google, funzioni avanzate (operatori logici), per dimostrare:*L’effetto rumore e l’effetto silenzio della ricerca in rete*Le ambiguità del linguaggio libero

• Effetto rumore: difficoltà di utilizzo dei dati dovuta alla ridondanza delle informazioni risultanti da una ricerca o causata dalla inappropriatezza delle stesse

• Effetto silenzio: impossibilità di chi consulta di accedere ai dati archiviati a causa della mancanza di elementi che consentano di risalire ai criteri di catalogazione delle informazioni

Page 3: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

3

Ricerca generica: digito ciclo acqua e ho 2.670.000 occorrenze

Page 4: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

4

Passo alla ricerca avanzatauso gli operatori logici e le pagine si riducono

Page 5: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

5

Ottengo 2.340.000 occorrenze…

Page 6: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

6

..troppe!!!, ci impiegherei una vita ad esaminare tutti i siti. Io cerco

una presentazione Powerpoint. Effettuo un altro tentativo cambiando l’indicazione “cerca tutti i tipi di file” con “cerca solo ppt”.

Compaiono solo 212 pagine con ppt.

Page 7: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

7

• La maggior parte delle ppt affrontano l’argomento trasversalmente, energia,ambiente, ambiti lavorativi o sono troppo difficili

• non sono utili per il mio scopo che è quello di supportare con illustrazioni e parole chiave la spiegazione del ciclo dell’acqua.

Page 8: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

8

Inserisco nella voce “che contengano una qualunque delle seguenti

parole” la stringa “scuola primaria” e le pagine si riducono a 84

Page 9: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

9

Ora la maggior parte delle ppt che compaiono sono

pertinenti alle mie esigenze non rimane che scegliere

Page 10: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

10

Riassumendo:

• Ricerca generica : 2.670.000 occorrenze

• Ricerca avanzata: 2.340.000 occorrenze

• Riduco la ricerca a ppt: 212 occorrenze

• Riduco la ricerca a ppt scuola primaria:84 occorrenze

Page 11: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

11

Considerazioni finali:

• Nella ricerca da me effettuata si sono manifestati contemporaneamente :

• l’effetto rumore, per la quantità incredibile di materiale online evidenziato.

• L’effetto silenzio, poiché il materiale risultato a me utile è comparso solo dopo l’inserimento dei termini “scuola primaria”, risultati determinanti per la chiave di ricerca

• L’effetto rumore di per sé genera perdita di tempo però può anche provocare l’effetto “serendipity” ovvero trovare casualmente informazioni che possono esserci utili in altri campi, anche se non sono oggetto di ricerca

Page 12: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

12

Le ambiguità del linguaggio liberoLe ambiguità del linguaggio libero

• Il problema della gestione delle informazioni e del loro recupero, è stato sempre oggetto di studio nel campo archivistico. L’avvento dell’”era digitale” ha esteso l’interesse ai data base informatizzati e alle immense risorse contenute negli spazi del Web.

• L’ information retrieval ha come campo di applicazione il trattamento e il recupero delle informazioni

Page 13: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

13

Trattamento informazioni

I metodi di archiviazione e di ricerca dei documenti si possono distinguere in due categorie:

MODELLO SEQUENZIALEMODELLO SEQUENZIALE o IRS (Information Retrieval System ) in cui il documento è rappresentato dalle parole in esso contenute, le informazioni vengono archiviate sequenzialmente MODELLO RELAZIONALEMODELLO RELAZIONALE, rappresentazione indiretta attraverso termini di indicizzazione assegnati al momento dell’inserimento che ne descrivono in modo sintetico e

completo il contenuto.

Page 14: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

14

Modello relazionale

Di solito si basa sulla metadatazione cioò l’indicizzazione dei contenuti in base a parole chiave che ne facilitino la consultazione.

I metadati vengono assegnati secondo un criterio stabilito a priori, l’operazione normalmente viene effettuata da chi inserisce il documento.

Chi inserisce il documento di solito lo conosce, è quindi è in grado di stabilire relazioni semantiche che riducano o annullino la polisemia.

Le numerose banche dati che adottano questo sistema riducono o annullano l’ambiguità semantica

Page 15: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

15

Modello sequenzialeModello sequenzialeNel Linguaggio liberoi termini sono estratti liberamente dal testo del documento o dal sito in cui sono contenuti. Essi non sono provvisti di metadati perciò non definiti a priori

•Effettuando una ricerca attraverso un motore di ricerca del tipo Google si ottengono in risposta sia documenti rilevanti, cioè che soddisfano il bisogno di informazione che l’utente ha espresso, che documenti assolutamente inutili.

•Il motore di ricerca non garantisce la rilevanza del documento, quindi può accadere che documenti potenzialmente rilevanti per l’utente non vengano recuperati dal sistema o viceversa.

• il recupero dell’informazione attraverso gli operatori logici booleani cerca di limitare questi due inconvenienti che, in generale, non possono essere eliminati.

Page 16: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

16

metadatiContenuti classificati

A a a a a a

B b b b b b

C c c c c c

input output

input output

Contenuti non classificati

Page 17: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

17

Operatori booleaniOperano una selezione nella ricerca in base

alla presenza o assenza di parole chiave in base alle quali un documento o un sito vengono selezionati

Essi sono: • AND: i termini sono entrambi presenti• OR: almeno uno dei due termini è presente• NOT: il termine non è presente

Essi costituiscono un efficace aiuto nella riduzione dell’effetto rumore anche se non lo annullano

Page 18: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

18

Indicizzazione automatica

Le ricerche effettuate attraverso motori di ricerca si basano su indicizzazioni automatiche.

• Esse non si basano su metadati assegnati a priori ma su tecniche statistiche che assegnano rilevanza all’informazione in base alla frequenza

• Questo metodo non prende in considerazione le relazioni semantiche dei dati presenti

• Se si effettua una ricerca sulla stringa “vite” compaiono siti web dedicati alla coltivazione della vite, siti sulle vite da salvare, sull’utensile vite, e compare anche un ristoranti chiamato “ vite”.

• Il sistema informatico riconosce i dati binari 0-1 che compongono la parola vite ma non ne comprende il significato.

Page 19: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

19

Vite = ristorante

Vite = essere in vitaVite = utensile

Vite= pianta

Page 20: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

20

Accessibilità

Da anni si dibatte sul tema dell’accessibilità ai dati sul web.

L’aumento esponenziale dei dati immessi ne rende sempre più difficile la consultazione.

Le posizioni sono distinte:

• alcuni sostengono che la mania classificatoria indebolisce le potenzialità .

• altri, come il fondatore del World Wide Web, Tim Berners-Lee, sostengono che è giunto il momento di porre delle regole.

Page 21: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

21

Web semantico by

Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) siano associati ad informazioni e dati (metadati) che ne specifichino il contesto semantico in un formato adatto all'interrogazione, all'interpretazione e, più in generale, all'elaborazione automatica.

Con l'interpretazione del contenuto dei documenti che il Web Semantico propugna, saranno possibili ricerche molto più evolute delle attuali, basate sulla presenza nel documento di parole chiave, ed altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice link ipertestuale.

http://www.w3.org/standards/semanticweb/

Page 22: Rumore Silenzio

Simonetta Leonardi IULINE elaborato mod. 1

22

Metodi di ricerca in ambiente multimediale

Prof. Giovanni Biondi

Tutors dott.sa Giusy Cannella

dott.sa Elena MosaA.A. 2009-2010