Leadership in Deep Indexing Milano 15 Marzo 2007.

35
Leadership in Deep Indexing Milano 15 Marzo 2007

Transcript of Leadership in Deep Indexing Milano 15 Marzo 2007.

Page 1: Leadership in Deep Indexing Milano 15 Marzo 2007.

Leadership in Deep Indexing

Milano 15 Marzo 2007

Page 2: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Agenda

Introduzione a CSA Illustrata

Deep Indexing: nuovo approccio all’indicizzazione

Lo sviluppo del progetto

Il feed-back del mondo accademico

Le modalità di ricerca e le funzionalità

Vantaggi per Biblioteche e Ricercatori

Page 3: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

servizio che permette di ricercare tabelle, grafici, figure, illustrazioni, fotografie che si trovano all’interno degli articoli di letteratura accademica

fornisce informazioni dettagliate a livello di: abstract record (record bibliografico) + object record (record specifico per l’immagine)

arricchisce la ricerca integrandosi con altri database

…che cos’è:

Page 4: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Perchè indicizzare gli Object?

Contengono informazioni e dati rilevanti per la ricerca

I ricercatori hanno la necessità di accedere anche a questi dati

Immagini: dati spesso “nascosti”

Page 5: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Perchè questi dati sono “nascosti”?

1. non sono compresi in nessun indice. Non ci sono “agganci” negli indici del titolo, abstract o

didascalia per “dissolved oxygen”

2. la ricerca per full text tralascia le immagini Il testo incluso nelle tabelle e grafici è considerato

un’immagine, non testo ricercabile

Table 1. Depth, physico-chemical and sedimentological variables.

Page 6: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Come rendere questi dati visibili e ricercabili:

Deep Indexing:

Individuazione di tabelle e figure (immmagini, diagrammi, mappe, etc.) presenti in articoli di periodici accademici

Estrazione e indicizzazione dei dati/informazioni relativi alle tabelle e figure per fornire un’indicizzazione specifica per ogni immagine

Page 7: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Deep Indexing :

immagini divise in Tables (tabelle e grafici) & Figures (immagini o fotografie)

didascalia completa

collegamento al record bibliografico dell’articolo completo di abstract

categorie (Graph, Satellite Image, …)

descrittori specifici (Descriptor Terms): di soggetto, tassonomici, geografici,statistici

link al Full Text

Page 8: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Immagini: suddivise in categorie Graph Graph; 3D Surface Plot Graph; Area Chart Graph; Box Plot Graph; Cluster Diagram Graph; Contour Plot Graph; Histogram/Bar Chart Graph; Line Graph Graph; Pie Chart Graph; Polar Plot Graph; Spectral Analysis Graph; Spectrogram Graph; Time Series Plot Illustration Illustration; Chemical Structure Illustration; Equipment Illustration Illustration; Flow Chart Illustration; Molecular Structure Illustration; Organism Illustration

Illustration; Schematic Illustration; Venn Diagram Map Map; Bathymetric Map Map; Geological Map Map; Study Site Map Map; Topographic Map Photograph Photograph; Dot Blots Photograph; Equipment Photograph Photograph; Gel Photograph; Organism Photograph Photograph; Photomicrograph Photograph; Satellite Image Photograph; Study Site Photograph Photograph; Vertical Section

Photograph Transmission/Emission Image Table

Page 9: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Termini Statistici per indicizzare le immagini Analysis of Covariance (ANCOVA)

Analysis of Molecular Variance

Analysis of Similarities Analysis of Variance (ANOVA)

Arithmetic Mean Average Bartlett's Test Boolean Factor Analysis Box-Cox Transformation Box-Jenkins Time Series Analysis

Brown-Forsythe and Welch

statistics Central Limit Theorem Chi-square Test Cluster Analysis …

Spectral Analysis Square-root Transformation Standard Deviation Standard Error Stepwise Discriminant

Analysis Stepwise Linear Regression Student's t Curve t-Test Time Series Analysis Variance Wavelet Analysis Wilk's lambda Test X2-value Yule's Q Z Score Z Test

Page 10: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Deep Indexing: Record bibliografico

Record bibliograficoArrichito con:

• riproduzione dell’immagine (object)• didascalie• index terms• link all’Object

Page 11: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Accesso al record specifico

della immagine

Record bibliografico

Riproduzione delle immagini

Page 12: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Deep Indexing : record specifico dell’immagine

Object Recordcomprende:

• immagine completa • didascalie• index terms• link a full text

Page 13: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Record specifico per l’immagine

Riferimenti editore

Object Descriptors

Page 14: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Lo sviluppo del progetto

Metodologia

Utenza coinvolta: ricercatori

Questionari – per valutare le caratteristiche, background, familiarità ricerca per Object

Monitoraggio dell’utilizzo del database per valutare usabilità, problemi e funzionalità della banca dati

Agende / Diari strutturati per ogni singola ricerca

Page 15: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Trovare informazioni “nuove” e di rilevanza per la propria ricerca

Risparmiare tempo

Migliorare/aumentare la ricerca multidisciplinare

Difficoltà / problematiche legate a:

localizzazione immagini e object

ricercabilità di tabelle, figure e grafici o diagrammi

Lo sviluppo del progetto

Quali sono le necessità dei ricercatori

Page 16: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Chi è stato coinvolto?

Universities Research Institutes Totals

United States 5 1 6

Europe 2 1 3

Totals 7 2 9

• 9 istituzioni

• 60 ricercatori

• Più di 380 ricerche

Page 17: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Importanza del link al full-text - collegamento object articolo

Valore aggiunto dato dalla possibilità di visualizzare un’elenco di articoli e di object rilevanti per la propria ricerca

Utilizzare le immagini per ricerche, lezioni, presentazioni

Possibilità di ritrovare informazioni / dati che non sono presenti nelle indicizzazioni del titolo o dell’abstract dell’articolo

Le risposte dei ricercatori:

Lo sviluppo del progetto

Page 18: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Le funzionalità di ricerca

Possibilità di ricercare attraverso l’interfaccia tradizionale (record bibliografici) o direttamente interrogando gli indici delle immagini (record specifici per gli objects)

Dai risultati è possibile capire qando sono presenti object rielvanti per la propria ricerca

Advanced Search: possibilità di ricercare per didascalie, keyword articolo, object descriptor….(incrociando diversi parametri)

Page 19: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

L’interfaccia

CSA Illustrata: Natural Sciences

Page 20: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Advanced Search: ricerca interrogando gli indici dei campi specifici:

Page 21: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Abstract Search: record bibliografici arricchiti con immagini

Page 22: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Elenco dei risultati per una ricerca specifica per objects

Page 23: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Abstract record: arrichito con le miniature di tutti gli objects presenti nell’articolo…

Page 24: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Page 25: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Object Record

Page 26: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Riferimenti Editore:

Page 27: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Copertura

• Più di 1,100 titoli di periodici

• 10 anni di backfile (per alcuni titoli al 1890)

• Accordi con gli editori:

Agreements Under Discussion:Akadémiai KiadóAmerican Assoc. for the Advance. of

Sci.American Assoc. of Petroleum

GeologistsAmerican Geophysical UnionAmerican Meteorological SocietyAmerican Society for MicrobiologyASLOBrill - Martinus Nijhoff, etc.EDP SciencesElsevier ScienceEmerald Group Publ Ltd

Agreements Completed:BioOneBioMedCentralBlackwell PublishingCambridge University

PressGeological Soc. of AmericaIOS PressOxford University PressNat’l Res. Council CanadaPLoSSpringer-VerlagTaylor & FrancisWalter de Gruyter

Haworth PressIOPInderScience Institute of PhysicsJohn Wiley & SonsLippincottSAGE PublicationsUniversity of Chicago Press

Page 28: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

CSA Illustrata: previsioni di crescita…

0

500,000

1,000,000

1,500,000

2,000,000

2,500,000

3,000,000

2007 2008 2009

Growth of Objects in CSA I llustrata

Objects

Page 29: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Agriculture3%

Biology31%

Psychology3%

Environmental Studies3%

Business and Economics

10%

Philosophy2%

Medical Sciences39%

Earth Sciences5%

Political Science4%

Objects indicizzati – copertura per area tematica

Page 30: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

Backfile

Objects per anno

Page 31: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Per riassumere:

Deep Indexing : nuovo approccio all’indicizzazione e alla localizzazione dei contenuti

Contenuto multidisciplinare

Permette di effettuare ricerche specifiche o combinate con gli altri database CSA (provoked search)

Interfaccia intutitiva > realizzata con il contributo dei ricercatori

CSA Illustrata:

Page 32: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Csa Illustrata: Vantaggi per le Biblioteche

Nuovo approccio all’indicizzazione

Aggiunge valore alle collezioni già sottoscritte(provoked search)

Nuovo contenuto, specifico di Illustrata

Gli utenti accedono direttamente a contenuti di rilevanza per la propria ricerca

Utilità e valore aggiunto per i servizi di reference

Interfaccia intutitiva

Page 33: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Csa Illustrata: Vantaggi per I Ricercatori

Ritrovare dati / informazioni altrimenti “nascosti”

Risparmiare tempo e trovare informazioni di maggiore rilevanza

Visualizzare e selezionare particolari categorie di objects (es. Grafici o diagrammi contenenti particolari variabili; Tabelle contenenti uno specifico elemento; etc.)

Poter scaricare e stampare gli objects per realizzare presenzazioni o come supporto alle lezioni

Page 34: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

CSA Illustrata: Natural Sciences

Lancio: 22 Gennaio 2007

http://info.csa.com/csaillustrata

Carol Tenopir and Robert SanduskyUniversity of [email protected]/~tenopir/

Enhanced Searching through Deep Indexing: Scientists’ Reaction

Page 35: Leadership in Deep Indexing Milano 15 Marzo 2007.

Proprietary and Confidential

ProQuest Information & Learning

Grazie per l’attenzione

Agnese PerroneCenfor International

[email protected]