Alla ricerca del libro perduto - Google book search

17
Università degli Studi di Modena e Reggio Emilia Facoltà di Scienze della comunicazione e dell’economia Alla ricerca del libro perduto Google book search di Simone Strozzi 10 – settembre – 2007 Realizzato nell’ambito dell’insegnamento di Dati e testi on-line tenuto da Corrado de Francesco per il corso di Laurea specialistica in Nuovi media e comunicazione multimediale (Reggio Emilia marzo-maggio 2006).

description

Una biblioteca immediatamente consultabile tramite Internet, accessibile a tutti, che contenga tutti i libri del mondo? Non è fantascienza. Le grandi realtà dot.com si sfidano con progetti diversi. La creazione di una biblioteca globale è un progetto ambizioso, destinato a cambiare le abitudini di produzione, acquisto, fruizione del libro. Sono in molti a prevedere una rivoluzione simile a quella musicale: la possibilità di scaricare su un “lettore” digitale apposito, il libro preferito, magari dopo averne letto l’anteprima, smaterializzando l’oggetto libro così come sta avvenendo per il cd musicale

Transcript of Alla ricerca del libro perduto - Google book search

Page 1: Alla ricerca del libro perduto - Google book search

Università degli Studi di Modena e Reggio Emilia Facoltà di Scienze della comunicazione e dell’economia

Alla ricerca del libro perduto Google book search

di

Simone Strozzi

10 – settembre – 2007

Realizzato nell’ambito dell’insegnamento di Dati e testi on-line tenuto da Corrado de Francesco per il corso di Laurea specialistica in Nuovi media e comunicazione multimediale (Reggio Emilia marzo-maggio 2006).

Page 2: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 1

titolo: Alla ricerca del libro perduto. Google book search

autore: Strozzi Simone e-mail [email protected]

Letteratura liquida ..............................................................................................

sommario

2 Biblioteca globale ........................................................................................... 2

Google book search ............................................................................................ 4 La storia ........................................................................................................ 4

Come funziona ................................................................................................... 6 Da dove provengono i libri visualizzati? ........................................................... 6 La ricerca ...................................................................................................... 7 Come ci appaiono i volumi? ............................................................................ 8 Cosa possiamo fare ...................................................................................... 13

Ipotesi di sviluppo ............................................................................................ 14 Passaggi necessari ....................................................................................... 14 Utilità .......................................................................................................... 15 Scenari ........................................................................................................ 15

Riferimenti ....................................................................................................... 16 Siti .............................................................................................................. 16 Articoli ......................................................................................................... 16 Altro materiale ............................................................................................. 16

abstract Il futuro del libro passa attraverso Internet. L’ambizioso progetto di Google di creare una biblioteca contenete tutti i volumi al mondo e renderli immediata-mente fruibili è destinato a cambiare le regole del mercato librario e a rivoluzio-nare il rapporto con l’oggetto libro. Quali partner ha al suo fianco? Quali sono le insidie? Che cos’è, allo stato attuale, Google book search?

keyword digital library copyright eBook

parole chiave biblioteca digitale diritto d’autore libro elettronico

data: 10 settembre 2007

Page 3: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 2

Letteratura liquida

Biblioteca globale

Una biblioteca immediatamente consultabile tramite Internet, accessibile a tutti, che contenga tutti i libri del mondo? Non è fantascienza. Le grandi realtà dot.com si sfidano con progetti di-versi. La creazione di una biblioteca globale è un progetto ambizio-so, destinato a cambiare le abitudini di produzione, acquisto, frui-zione del libro. Sono in molti a prevedere una rivoluzione simile a quella musicale: la possibilità di scaricare su un “lettore” digitale apposito, il libro preferito, magari dopo averne letto l’anteprima, smaterializzando l’oggetto libro così come sta avvenendo per il cd musicale.

Quali vantaggi? La scannerizzazione e la conseguente gestione del libro in formato digitale scongiura l’usura del tempo, agevola il processo di indicizzazione facilitando la ricerca dei volumi, apre a nuove possibilità di fruizione.

A che punto siamo Per le opere di pubblico dominio ci sono gia re-altà importanti come il Gutenberg Project o la nascente Open Li-brary. Google ha sviluppato, per il momento ancora in versione Be-ta, il progetto “Google book search”, motore di ricerca per libri che mira alla digitalizzazione di tutti i volumi esistenti, per renderli in seguito immediatamente disponibili alla visualizzazione on line da parte degli utenti. Un progetto ambizioso e di sicura utilità, non privo di problemi. Non sono certo problemi tecnologici, Google si può permettere le migliori menti e le migliori tecnologie al mondo, ma che riguardano i diritti d’autore delle opere. Gli editori, memo-ri della sorte toccata al settore musicale e cinematografico, so-spettano violazioni di copyright, sviluppo della pirateria e conse-guente calo drastico delle vendite. Google risponde che solamente le opere di pubblico dominio sono scaricabili o interamente consul-tabili, mentre per quelle soggette a copyright la visualizzazione ri-guarda solo un numero limitato di pagine. Così facendo, secondo Google, non solo non si viola il copyright ma anzi si incrementano le vendite dando la possibilità all’utente di trovare facilmente un li-

Page 4: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 3

bro e di poterlo consultare parzialmente, indicandogli dove lo si può acquistare.

E-book

Fonte:

Versione digitale di un libro.

“È errato confondere un qualunque documento in formato digitale con un e-Book, dato che l'e-Book non si limita a presentare la so-stanza del documento cartaceo ma cerca anche di replicarne la forma, in modo da rendere la lettura il più possibile simile a quella che si avrebbe sfogliando le pagine di un libro.[…] tutte le azioni che in un normale libro cartaceo sono immediate e scontate, come ad esempio, lo scorrere le pagine o l'inserimento di un segnalibro devono essere opportunamente emulate dal software.”

Wikipedia

Fonte: Catherine Holahan,

(30.08.2007)

Il mercato degli e-Book è inevitabilmente legato allo sviluppo dei reading device (strumenti che permettono la lettura degli eBook).

In 2005, the last year for which full annual statistics are available, digital copies of books brought in a measly $12 million. That's less than 0.5% of the $25 billion generated by the industry that year,according to the Association of American Publishers (AAP).

Business Week, 23.01.2007

Hopes for e-books began to revive last year with the introduction of the widely marketed

Nonostante le cifre siano ancora modeste, le grandi case di produ-zione di hardware sembrano disposte a rischiare.

Sony Reader. […] the size of a trade paper-back, has a six-inch screen, enough memory to hold 80 books and a battery that lasts for 7,500 page turns, according to the company. It uses screen display technology from E Ink, a company based in Cambridge, Mass., that emerged from the Media Lab at the Massa-chusetts Institute of Technology and creates power-efficient digital screens that uncannily mimic the appearance of paper.

Fonte: Brad Stone, The New York Times,

Anche Ron Hawkins (vice president for portable reader systems at Sony) non ha dubbi a riguardo: “Digital readers are not a replacement for a print book; they are a replacement for a stack of print books” (

05.09.2007

The New York Times).

Page 5: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 4

Google book search

La storia

2002 “How long would it take to digitally scan every book in the world?” E’ la domanda che si pone un piccolo gruppo di ricercatori Google quando inizia a sviluppare l’idea di una biblioteca globale, ispirandosi a grandi progetti di digitalizzazione come American Memory, Project Gutenberg, the Million Book Project e Universal Library, per meglio organizzare il lavoro.

2004 Il team Google visita la Bodleian library all’ Oxford University formalizzando un accordo per la digitalizzazione di più di un milio-ne di opere non protette da copyright del IX secolo, in tre anni. In ottobre debutta alla fiera del libro di Francoforte il progetto “Goo-gle Print” con l’annuncio dei fondatori Larry Page e Sergey Brin. Circa quindici editori si uniscono al progetto tra cui Blackwell, McGraw-Hill, Penguin, Perseus, Princeton University Press. In Di-cembre nasce “Library Project”che coinvolge importanti bibliote-che di università come Harvard, Michigan, Oxford, Stanford e la New York Public Library per un totale di circa 15 milioni di volumi.

2005 “Google Print” sbarca in Europa e apre a possibili accordi con partner di diversi paesi: Austria, Spagna, Italia, Belgio, Olanda, Germania, Francia e Svizzera. Iniziano però i problemi con i libri protetti da copyright: l’ Association of American Publishers (AAP) richiede di bloccare per sei mesi la digitalizzazione delle opere protette da copyright in attesa di spiegazioni convincenti su Google Library (i libri scannerizzati da biblioteche). Anche per questi moti-vi Google decide di cambiare nome al progetto: nasce “Google book search” che definisce meglio l’utilizzazione del motore di ri-cerca. “Google Print” diffondeva l’idea errata della possibilità di stampare interamente tutti i volumi visualizzati.

2007 Per le opere di pubblico dominio, “Google book search” offre la possibilità, oltre che di scaricare l’intera opera, anche di visua-lizzarla direttamente on line in formato testo, consentendo il copia incolla.

Page 6: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 5

Fig.1 – Google, i libri a portata di mouse

Piattaforma per e-book? Attualmente “Google book search” non ha una piattaforma di vendita e non visualizza i volumi composti di-rettamente in versione elettronica per i quali non esiste la versione cartacea. Vengono digitalizzati solo volumi a partire dal supporto cartaceo. L’autorevole New York Times ipotizza i prossimi sviluppi

“Google plans to start charging users for full online access to the digital copies of some books in its database, according to people with knowledge of its plans. Publishers will set the prices for their own books and share the revenue with Google.

Fonte: Brad Stone, The New York Times 05.09.07

Non solo la visualizzazione on line a pagamento dei libri, ma anche la possibilità di scaricarli direttamente su diversi device, un po’ come si fa adesso per i brani musicali.

“Book publishers also seem to be preparing for the kind of disrup-tion that hit the music business when Apple introduced the symbi-otic combination of the iPod and its iTunes online service”

Fonte: Brad Stone, The New York Times, 05.09.2007

Page 7: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 6

Come funziona

Da dove provengono i libri visualizzati?

Sono due le fonti da cui Google attinge volumi: Editori – “Partner Program” Biblioteche “Library Project”

Editori

Anteprima non disponibile, con la visualizzazione delle sole in-formazioni di base del volume.

A seconda del tipo di autorizzazione concesso dall’editore “Google book search” visualizza il libro in diverse tipologie:

Visualizzazione frammento (snipped view), che riporta alcune frasi circostanti il termine cercato

Visualizzazione limitata (limited view), con la possibilità di ve-dere alcune pagine complete del libro.

visualizzazione completa (full view) del volume se non protetto da copyright

Inoltre, in qualsiasi momento l’editore può scegliere di rimuovere il volume da “Google book search”. Il “Partner Program” consente all’editore di avere una promozione gratuita dei propri titoli grazie alla presenza di link al proprio sito, a quello di librerie e a negozi on line per l’acquisto.

Biblioteche

Fonte:

Le biblioteche aderenti a “Library Project” sono in continuo aumento, molte delle quali di grande prestigio.

“Lo scopo del Progetto Biblioteche è semplice: aiutare gli utenti nella ricerca di libri pertinenti, in particolare quelle opere che sa-rebbero altrimenti introvabili, come i libri fuori stampa, rispettan-do allo stesso tempo il copyright di autori ed editori”

Google ricerca libri (30.08.2007)

Anche in questo caso si possono trovare libri protetti da copyright la cui visualizzazione sarà limitata a frammenti di testo e informa-zioni di base sul volume. Per i libri non soggetti al copyright la vi-sualizzazione sarà completa, sia in formato immagine sia in forma-to testo, unitamente alla possibilità di effettuare il download del volume.

Page 8: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 7

Fig. 2 – Biblioteche coinvolte in “Library Project”

La ricerca

Google style

Fig. 3 – Homepage “Google book search”

La pagina di ricerca libri utilizza la stessa impagina-zione tipica di tutti gli altri servizi Google, cioè un bassissimo clut-ter (percentuale di spazio occupata da testo e immagini).

Fonte: Google book search http://books.google.com

L’ “advanced search” offre la possibilità di selezionare tra quale ti-po di visualizzazione cercare il volume. All books Limited preview. Visualizzazione limitata ad alcune pagine del

libro. All’interno di questo tipo di ricerca si trovano anche vo-

Page 9: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 8

lumi visualizzati tramite “snipped view”, che mostra la sola pa-gina informativa del volume.

Full view. Visualizzazione dell’intero libro. Library catalogs. In questo caso attraverso il software WorldCat

Fig.4 – “Advanced search” e visualizzazione risultati “Library catalogs”

appariranno i link delle biblioteche che contengono la versione cartacea del volume cercato.

Fonte: Google book search http://books.google.com

Oltre alla scelta della visualizzazione, si possono scegliere diversi criteri di ricerca: Titolo Autore Editore Soggetto Data di pubblicazione Codice ISBN

Come ci appaiono i volumi?

Full view Per i libri non più soggetti a copyright la visualizzazione è completa con la possibilità di leggere tutte le pagine.

Page 10: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 9

Fig.5 – Divina commedia

Fonte: Google book search http://books.google.com

Alla sinistra della schermata che mostra il volume, c’è sempre una colonna che presenta diversi link. “About this book”: informazioni generali sul volume “Write review”: possibilità di scrivere la recensione “Review”: recensioni già presenti in Rete sul volume. “Add to my library”: si può aggiungere, previa registrazione, il

libro alla propria “Library” on line “Contents”: link alle varie sezioni interne al volume “Popular passages”: vengono visualizzati i brani del volume più

citati da parte di altri autori in altri volumi. “Buy this book”: collegamenti ai negozi on line per l’acquisto

(Amazon.com, Burners&Noble, Booksense.com) “Search in this book”: ricerca i termini all’interno del volume “Publisher info”: link al sito web dell’editore.

Page 11: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 10

Fig 6 – Link

Fonte: Google book search http://books.google.com

Per i volumi non protetti da copyright c’è la possibilità di visualiz-zare il volume in formato testuale (“view plain text”) permettendo il copia-incolla di parti di testo oppure scaricare l’intera opera (“download”) in formato pdf.

Fig. 7 – Da immagine a testo

Fonte: Google book search http://books.google.com

Una nuova funzionalità, solo per testi non soggetti al diritto d’autore, permette di selezionare una parte del testo e gestirla sia in formato immagine che testuale.

Page 12: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 11

Limited preview

Fig. 8 – Collected tales and poems of Edgar Allan Poe

Solo alcune pagine sono visualizzabili, in base all’accordo con l’editore. Le pagine sono visualizzate come imma-gini e non è possibile ne selezionare parti testuali ne scaricare l’opera. All’interno delle pagine, in basso a destra, è presente la scritta “Copyrighted material”.

Fonte: Google book search http://books.google.com

Snipped view

Fig. 9 – Snipped view

Visualizza solamente tre frammenti di testo. Non ci sono pagine visualizzabili e i tre frammenti testuali vengono propo-sti all’interno della pagina informativa “About this book”.

Fonte: Google book search http://books.google.com

Page 13: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 12

L’immagine mostra co-me si struttura la pagina delle informazioni gene-rali riguardanti il volu-me. Il box in alto alla pagina contiene un bre-ve sommario con il no-me dell’autore, dell’editore e spesso sia la data di pubblicazione che quella di digitaliz-zazione. Molti box con-tengono link già presen-ti nella pagina di visua-lizzazione dell’opera come “other editions” e “search in this book” e quelli riguardanti le re-censioni. Inoltre sono presenti link a pagine web ed altri volumi che contengono i termini cercati.

Fig. 10 – Visualizzazione della pagina “about this book”

Fonte: Fonte: Google book search http://books.google.com

Sinergia

Fig. 11 – “Book search” + “Maps”

Mentre leggiamo un libro tutti viaggiamo con la mente all’interno dei luoghi descritti, lavorando d’immaginazione.

Fonte: Google book search http://books.google.com

Page 14: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 13

Ora non serve più, grazie all’interazione tra “Google book search” e “Google Maps

Cosa possiamo fare

”. In alcuni libri digitando “about this book”, en-trando così all’interno della pagina informativa, si trova un box (“Place mentioned in this book”) con cartina geografica che mostra tutti i luoghi citati all’interno dell’opera e il numero di pagina in cui si trovano.

Sintetizziamo quali operazioni sono possibili con “Google Book se-rach”.

Fig.12 – Operazioni possibili in base alla tipologia del volume

Volumi soggetti a copy-

right Volumi di pubblico

dominio

Informazioni generali sul volume Si Si

Sfogliare pagine In base all’accordo con

l’editore Si possono sfoglia-re tutte le pagine

del volume

Visualizzazione intero volume No. Sono visualizzabili le

solo le pagine concesse dall’editore

Si

Selezionare parti del testo – copia/incolla No Si

Download in pdf dell’intera opera No Si

Acquisto del volume No No

Page 15: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 14

Ipotesi di sviluppo

Passaggi necessari

Editori Il rapporto con gli editori sarà fondamentale per lo sviluppo del motore. Il sospetto delle case editrici verso il libro digitale è in parte condivisibile se si guardano altri settori più sviluppati in que-sto ambito (musicale e cinematografico), dove la pirateria rappre-senta un problema. Credo, però, che “Google Book search” porti con sé più opportunità che problemi. Permette la comoda consulta-zione dei volumi, l’opportunità di trovare libri altrimenti difficili da scovare, ci indica dove possiamo comprarli e in quali biblioteche tradizionali consultarli in formato cartaceo. Tutto questo non può che giovare alle vendite degli editori, offrendogli strumenti di pro-mozione gratuiti. Inoltre, “Google book search” offre pagine dedi-cate all’editore per la gestione dei propri volumi con diverse fun-zioni tra le quali quella opt-out che permette all’editore di elimi-nare immediatamente il proprio volume dalla googleteca.

Scannerizzazione I libri soggetti a copyright vengono visualizzati in formato immagine perdendo in qualità. Questo problema non si presenta con i volumi visualizzati completamente, nei quali c’è la possibilità di scegliere il formato testuale. Un altro problema ri-guarda i libri molto antichi presenti all’interno delle biblioteche: il processo di scannerizzazione potrebbe rovinare il volume e quindi questi volumi non vengono digitalizzati. E’ auspicabile, in linea ge-nerale, che Google migliori la qualità della digitalizzazione dei vo-lumi.

Google over the world E’ fondamentale che “Google book search” coinvolga più paesi garantendo sempre maggiore varietà linguistica. In questo senso qualcosa è già stato fatto: in poco più di un anno si è passati da 5 prestigiose università americane a 17, coinvolgendo diversi soggetti fuori USA: Bavarian State Library, Ghent University Library, Keio University Library, University Complutense of Madrid, University Library of Lausanne.

Page 16: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 15

Utilità

Didattica La possibilità odierna di scaricare gratuitamente testi o parti testuali di pubblico dominio e la possibilità futura che questo avvenga (a pagamento) anche ai libri protetti da copyright non può che facilitare il lavoro didattico.

Biblioteche La digitalizzazione gratuita da parte di Google consen-te alle biblioteche di avere copie digitali dei volumi per usi interni.

Lettori

Scenari

Attraverso “Google book search” gli utenti possono consul-tare i volumi trovando quelli che più gli interessano o scoprirne di nuovi, favorendo così l’acquisto. Inoltre con lo sviluppo di una pos-sibile piattaforma di vendita si potranno scaricare direttamente i volumi senza dover aspettare le spedizioni.

Piattaforma e-Book

Fonte: Jens Redmer, direttore Google Book Search per l’Europa,

Come già si accennava in precedenza, pareri autorevoli prevedono per “Google book search” un futuro da piat-taforma di vendita per libri digitali.

“We are working on a platform that will let publishers give readers full access to a book online.”

Timesonline, 21.01.2007

I libri di pubblico dominio rimarranno visibili e scaricabili gratuita-mente mentre per il “copyrighted material” gli editori potrebbero fissare un prezzo per il download dividendo con Google una percen-tuale dei ricavi. Utilissima sarebbe la possibilità di scaricare anche solo le parti che ci interessano del volume pagando una percentua-le del costo totale del volume. Questi sviluppi si legano inevitabil-mente al mondo dell’hardware, cioè alla diffusione degli strumenti per la lettura degli e-Book (e-Book digital device). Un futuro, quel-lo del libro, che sembra percorra la strada già battuta dalla musica, con la possibilità di scaricarci album (ma anche semplici canzoni) all’interno di lettori mp3.

Page 17: Alla ricerca del libro perduto - Google book search

Alla ricerca del libro perduto Google book search

p. 16

Riferimenti

Siti

GOOGLE BOOK SEARCH

GOOGLE RICERCA LIBRI

http://books.google.com Motore di ricerca per libri ancora in versione Beta (di prova). Progetto svilup-pato a partire dal 2004 da parte del team Google con l’intenzione di creare una biblioteca globale immediatamente consultabile da chiunque. Nel corso di tre anni ha visto crescere il numero di partner aderenti.

WIKIPEDIA

www.google.it/books Versione italiana del motore di ricerca per libri.

Articoli

http://it.wikipedia.org Enciclopedia libera on line sviluppata con il contributo degli stessi utenti.

“The New York Times”

“Times”

Envisioning the Next Chapter for Electronic Books

“BusinessWeek”

Google plots e-books coup

Google Download: No iTunes for Books

“Il sole 24 ore”

Altro materiale

Microsoft contro Google: “Viola sistematicamente il copyright”

Luci e ombre di Google. Futuro e passato dell’industria dei metadati