Bibliotime, XII, 2 - Antonella De Robbio, La gestione dei diritti nelle digitalizzazioni di massa. Un'analisi alla luce del caso Google Book Search

La digitalizzazione massiva di libri, e l'uso di tecnologia avanzata per renderli disponibili e utilizzabili online, ha forti legami con il passato di Google. Nel 2004, a seguito di una intensa battaglia legale, Google trasformò � cambiandone anche il nome - il progetto Google Print nel progetto Google Book Search, entro due distinte linee di azione: Programma Partner Google Libri (editori) e Progetto Google Biblioteche (biblioteche). Mentre la consultazione per intero dei libri di pubblico dominio non presenta aspetti particolarmente problematici, la possibilità per qualsiasi utente di ricercare all'interno di opere protette da diritto d'autore digitalizzate a questo scopo ha provocato, nell'autunno del 2005, una class action promossa da autori ed editori, e risoltasi il 28 ottobre 2008 con il cosiddetto Google Book Settlement (accordo Google Libri o Transazione). La discussione imperversa sui blog e la proliferazione di news tutte uguali, sui generis, non aiuta a capire i reali meccanismi dell'accordo. Le opinioni degli esperti, o meglio dalle parti in causa, sono divergenti: si passa dal massimo entusiasmo, espresso da autori, editori e dagli utenti della rete, ai fondati timori, da parte di cauti bibliotecari o opinionisti, per un monopolio di Google.

Questo lavoro analizza la gestione dei diritti nel Progetto Google Biblioteche, esaminandone i termini dell'accordo, il quale porterà alla creazione di un Registro dei Diritti indipendente e senza scopo di lucro per rappresentare autori, editori e altri detentori dei diritti. L'accordo prevede anche la costituzione di un corpo ricerca dislocato in due centri (oltre a Google) scelti dalle biblioteche, database che conterrà l'insieme di tutte le copie digitali connesse al Google Library Project.

L'accordo identifica quattro categorie di biblioteche aderenti basate sul loro livello di partecipazione alla transazione: Biblioteche aderenti in pieno, Biblioteche contribuenti, Biblioteche di dominio pubblico e Altre biblioteche. Le opere digitalizzate da Google e fornite dalle quattro possibili tipologie di biblioteche, hanno superato la quota di sette milioni nel novembre del 2008. Per quanto riguarda gli aspetti legali sono classificabili entro tre categorie: libri protetti da copyright fuori commercio, le cosiddette opere orfane (5 milioni ca. = 70%); libri di pubblico dominio (1.4 milione ca. = 20%); libri protetti da copyright in commercio (700mila ca. = 10%). Il lavoro analizza l'accordo transattivo alla luce di una possibile trasposizione del modello in un contesto normativo di diritto d'autore europeo.

2. Il progetto Google Book Search

Come si è detto, la digitalizzazione massiva di libri e l'uso di tecnologia avanzata per renderli disponibili e utilizzabili online ha forti legami con il passato di Google. I suoi co-fondatori Sergey Brin e Larry Page si laurearono alla Stanford University nel 1996, sviluppando tecnologie utili per le biblioteche digitali. Il loro lavoro si focalizzava sull'uso di analisi citazionali per stimare la pertinenza di libri digitali a specifiche query poste dall'utente. La tecnologia risultante fu applicata sperimentalmente agli archivi web, e il resto è storia.

Nel 2002 Google iniziò a gettare le basi del suo programma di digitalizzazione di massa. Nel 2004, a seguito della battaglia legale sorta poco dopo, Google trasformò � cambiandone anche il nome - il progetto GooglePrint nel progetto Google Book Search, o Ricerca Libri [2] dividendolo in due (editori e biblioteche) per digitalizzare milioni di libri e rendendoli ricercabili on line, attraverso il proprio portale, entro due distinte linee di azione: Programma Partner Google Libri e Google Library Project, o Progetto Google Biblioteche.

Il progetto Google Book Search, come dice la parola stessa, è centrato sui "Libri". Google ha sviluppato una tecnologia innovativa per la scansione dei contenuti che non danneggia i libri. In ogni caso, non viene eseguita la scansione di quei volumi considerati troppo delicati o fragili (ad esempio libri antichi) e, una volta eseguita la scansione, il libro viene immediatamente restituito alla biblioteca. Non sono incluse nella definizione di "Libri" le seguenti opere:

Nel progetto Google Books i Libri possono contenere Inserti. Esempi di Inserti includono prefazioni, postfazioni, prologhi, epiloghi, poemi, citazioni, lettere; estratti testuali da altri Libri, periodici o altre opere; testi di canzoni; note musicali; illustrazioni di libri per bambini; tabelle, diagrammi e grafici che non siano lavori illustrati

Il Programma Partner Google Libri [3], è un programma online che consente alle case editrici di tutte le dimensioni di includere il contenuto dei loro libri nei risultati principali delle ricerche di Google. Gli editori inviano i loro libri e Google, gratuitamente, provvede a digitalizzarli e ad aggiungerne il contenuto ai risultati delle ricerche. Google, nel corso di questi quattro anni, ha stabilito partnership con oltre 20.000 editori entro il Programma Partner. È possibile sfogliare alcune pagine in anteprima di questi libri, proprio come si farebbe in una libreria o in una biblioteca. Sono inoltre disponibili link alle biblioteche e alle librerie, dove è possibile prendere in prestito o acquistare il libro. Su questo fronte la modalità è definita come OptionIN, ovvero il partner chiede espressamente di essere inserito nel programma.

Nonostante quanto affermato da alcuni quotidiani, numerosi sono gli editori italiani che hanno già aderito al programma, anche se una lista completa non è disponibile. Basta andare sul sito per vedere come libri in commercio pubblicati da Feltrinelli siano presenti in anteprima a full-text [4], come pure quelli di Franco Angeli, che recentemente ha aderito al programma [5]. Sul sito in versione italiana sono presenti informazioni per partecipare al Programma Partner [6].

3. Il Google Library Project � Progetto Google Biblioteche

Google Library Project, o Progetto Google Biblioteche, coinvolge biblioteche prestigiose di tutto il mondo, a partire da Harvard, Stanford, Università del Michigan, Università di Oxford e la New York Public Library. I contratti sottoscritti con le biblioteche, disponibili solo in inglese, sono pubblicamente raggiungibili dal sito di Google Books [7]. Si tratta di contratti non esclusivi, questo significa che tutte le biblioteche partner sono libere di continuare a lavorare ai propri progetti di digitalizzazione libri, oppure di collaborare con altri, mentre partecipano al Progetto Biblioteche di Google.

Inizialmente, Google aveva un atteggiamento di estrema segretezza nei riguardi dei suoi contratti con le biblioteche partner. Tuttavia, questo atteggiamento fu presto messo in discussione da coloro che sostenevano che, poiché le università erano sovvenzionate dallo stato, i loro accordi legali dovevano essere pubblici e i loro contratti dovevano essere pubblicati online. Di conseguenza, Google è stato costretto a fare un rapido dietro-front e oggi, nel sito ufficiale di Google Books, c'è un link ai materiali pubblicati da ogni singola biblioteca partner, oltre al contenuto dei contratti che prima erano riservati. L'accordo tra l'università del Michigan e Google Libri, il suo primo partner istituzionale, offre alcuni importanti dettagli riguardanti il formato output del progetto. L'accordo è stato da noi tradotto in italiano, [8] e ha dato modo di comprendere nei dettagli prassi e metodologie operative oltre alle clausole contrattuali.

La posizione di Google era quella di digitalizzare i materiali protetti da copyright, invocando l'istituto del fair use, rendendo accessibili all'utenza solo brevi frammenti di testo. Per questa ragione Google ha proceduto a digitalizzare i contenuti delle biblioteche. Gli utenti possono ricercare liberamente il materiale e visualizzare i risultati in un cluster di due o tre frasi in cui compare l'elemento ricercato. In questo modo è possibile avere accesso a documenti che altrimenti non si sarebbero mai potuti raggiungere. Sul fronte biblioteche perciò Google ha proceduto con la modalità OptionOUT, digitalizzando in massa tutto il materiale "selezionato" dalle biblioteche cooperanti, chiedendo a posteriori ai detentori dei diritti (autori o editori) di prevedere eventualmente l'esclusione dal progetto Google Libri e/o di avere le relative royalties sugli autori detentori di diritti. Ed è proprio su questo fronte che si instaura la battaglia legale tra le associazioni di editori e di autori americani e Google. Con l'OptionOUT Google puntava al Fair use claim, in virtù del fatto che, secondo Google, la digitalizzazione corrisponde all'atto di fare una copia (riproduzione) e, negli Stati Uniti, fare una riproduzione nelle biblioteche, per i servizi di biblioteca e/o comunque di ricerca, rientra nell'istituto del fair use.

In questo lavoro ci occuperemo del Progetto Google Biblioteche, per un'analisi sulla gestione dei diritti, e non di altri progetti in cui Google è coinvolto. Non ci occuperemo del Programma Partner Google Libri proprio perché esso prevede una partecipazione volontaria, in modalità OptionIN.

Il Google Library Project è una delle modalità in cui Google sta digitalizzando i libri per il suo programma Ricerca Libri su Google. Anche il Google Partner Program tramite il quale Google ha il permesso dagli editori ed autori di usare le loro opere tuttora soggette a copyright, è un modo per aggiungere Libri al programma Ricerca Libri su Google.

Il Partner Program non è incluso nell'accordo (transazione) di cui è oggetto il presente lavoro, sebbene la transazione possa coinvolgere membri del Partner Program. Esiste infatti una ovvia sovrapposizione di contenuti (a livello di gestione di diritti) tra i due progetti. Un libro digitalizzato entro il programma biblioteche può essere coinvolto in un accordo con un editore partner; ma come vedremo in seguito, poiché nelle biblioteche la stragrande maggioranza di testi riguarda i libri fuori commercio (i fuori stampa), di fatto l'accordo transattivo di cui ci occuperemo riguarderà proprio quelle opere, presenti nelle biblioteche, che pur rientrando nella tutela del diritto d'autore sono fuori da diritti editoriali in qualche modo, o comunque fuori dai canali commerciali di vendita.

Attualmente Google dichiara di aver intenzione di estendere il Programma Biblioteche per includere raccolte speciali delle biblioteche degli Stati Uniti e di altri Paesi. Esiste una pagina [10] per la segnalazione di raccolte speciali di biblioteca, dove si devono indicare informazioni relative alla dimensione della raccolta, le lingue incluse, eventuale contenuto specialistico o esclusivo e la percentuale di contenuto già digitalizzato.

4. L'accordo di Google con l'Università di Oxford

Attenzione particolare merita l'adesione al progetto Google Libri della biblioteca Boodleiana dell'Università di Oxford. Difatti, dopo oltre dieci anni di negoziati, questa università ha concluso recentemente un accordo con Google per una digitalizzazione di massa che prevede una scansione entro i prossimi tre anni (con un ritmo produttivo di 10.000 volumi alla settimana) di oltre un milione di volumi della biblioteca Boodleiana. La selezione dei testi scelti per la digitalizzazione è stata operata dai bibliotecari su un patrimonio complessivo di 11 milioni di volumi, individuando i testi maggiormente consultati da utenti esterni (il 60% dell'utenza della Boodleiana è esterna).

L'operazione verrà condotta direttamente nei laboratori di Oxford dall'equipe di Google. Saranno prodotte due copie, una per il progetto Google e l'altra per i servizi del sistema bibliotecario, con il risultato che i testi digitalizzati saranno visibili sia entro il progetto Google Books sia dal sito della Boodleiana, direttamente connessi al catalogo dell'Oxford Libraries Information Service (OLIS). Poiché la digitalizzazione di materiale di ricerca come manoscritti, incunaboli, documenti d'archivio, mappe o collezioni speciali non sono inclusi negli scopi di Google, l'Oxford University Library Services (OULS) continuerà a digitalizzare in-home tali materiali sulla base delle richieste locali provenienti della comunità scientifica. L'obiettivo finale però è quello di rendere accessibile questo materiale allo stesso modo di quello digitalizzato in massa da Google al fine di fornire all'utenza un unico strumento di recupero dell'informazione digitalizzata.

Per Google questo accordo rappresenta un aumento di qualità in termini di esperienza nei processi di digitalizzazione, ma anche per ciò che riguarda i contenuti presenti nel progetto GoogleBooks. Per i servizi bibliotecari di Oxford, d'altra parte, si tratta di un grande accordo in quanto, in poco tempo e a costo zero, si riuscirà a mettere a disposizione dell'utenza elevate quantità di materiale, che andranno a costituire una massa utile per lo sviluppo di tecniche e standard per la conservazione di lungo termine.

E' importante sottolineare che, a causa delle note restrizioni sulla proprietà intellettuale, l'accordo prevede la sola digitalizzazione di materiali di pubblico dominio, cioè totalmente fuori da ogni diritto (d'autore e/o editoriale). Va considerato che la Gran Bretagna non è in regime di diritto d'autore come il resto dell'Europa, bensì di copyright britannico, diverso da quello statunitense in particolare per l'istituto del Fair Dealing (che non è il corrispettivo del Fair Use statunitense). L'accordo Google/Oxford quindi non rientra nell'accordo transattivo Google Settlement, sia perché si tratta di giurisdizione fuori USA, ma primariamente perché non riguarda libri soggetti a diritti. Per la legge britannica si considerano di dominio pubblico tutti i volumi pubblicati prima del 1920. Per il copyright statunitense, invece, il pubblico dominio ha come barriera temporale il 1923.

5. Altri importanti progetti di digitalizzazione

La digitalizzazione su larga scala, nel corso degli ultimi anni, è stato un elemento di grande interesse non solo per Google. Per contrastare l'orientamento commerciale di Google Libri, nell'ottobre del 2005 fu lanciata l'Open Content Alliance (OCA), un consorzio accademico aperto basato su una partnership di biblioteche e sponsor aziendali sotto l'amministrazione dell'Internet Archive. Le biblioteche rendono disponibili all'alleanza le proprie collezioni per la scansione, e le aziende partner o l'Internet Archive procurano i fondi per digitalizzarli. Il processo operativo generale dell'OCA è piuttosto simile a quello di Google. Ogni biblioteca lavora con l'OCA per sviluppare un piano di digitalizzazione, selezionando un insieme di materiali da digitalizzare nell'ambito del progetto. L'OCA fornisce le attrezzature tecniche e lo staff per la digitalizzazione, attraverso un appalto esterno. Il personale della biblioteca invia i materiali alla struttura preposta dell'OCA, dove viene digitalizzato dallo staff dell'OCA per poi essere rispedito alla biblioteca. L'Open Content Alliance, da sempre, si è adoperata in maniera proattiva con gli editori per ottenere l'autorizzazione a riprodurre e digitalizzare i materiali prima che vengano pubblicati online, sebbene Google, con il programma Partner, abbia tentato di attutire l'effetto chock provocato dalla manovra della digitalizzazione all'interno delle biblioteche.

Quando fu annunciata la nascita di Open Content Alliance, il suo ideatore e fondatore, Brewster Kahle [11], sottolineò i modi con cui OCA avrebbe rivoluzionato la modalità di accesso alla conoscenza. Riferendosi alla sua idea di rendere i libri digitali open and free, Kahle affermò che il principio guida di OCA è quello di rendere di pubblico dominio le opere digitali. Tuttavia, egli quietò il suo entusiasmo iniziale affermando che, per motivi di proprietà digitale sui contenuti, era consentito porre delle restrizioni sulla ridistribuzione su larga scala dei contenuti. Secondo Kahle era lecito e moralmente giusto consentire alle organizzazioni che avevano finanziato la digitalizzazione di controllare a chi veniva ridistribuito il materiale. Inoltre, altre biblioteche non erano autorizzate a ridistribuire i materiali OCA per motivi accademici. Nel momento in cui una biblioteca paga il progetto OCA per la digitalizzazione delle opere in essa contenute, non deve essere costretta ad autorizzare altre biblioteche ad offrire lo stesso contenuto nel loro sito web.

Questo mandato rispecchia la generale tendenza delle biblioteche accademiche a proibire la ridistribuzione dei materiali digitali, anche se effettuata da gruppi di ricercatori all'interno dell'istituzione stessa. Ad esempio, durante la partnership Microsoft-OCA, Microsoft adottò delle politiche di copyright sui materiali scansionati che fossero maggiormente restrittive riguardo ai possibili tipi di utilizzo del materiale. Inoltre, biblioteche accademiche che hanno finanziato la digitalizzazione con Open Content Alliance, ne hanno poi autorizzato la distribuzione solo per uso personale, anche se si trattava di materiali di dominio pubblico, in base Copyright Act del 1976.

Google, fuori dal progetto Google Books, in partnership con numerosi editori di testate giornalistiche del Nord American, con ProQuest e Heritage, ha iniziato una digitalizzazione di quotidiani che riproduce l'esatto originale comprensivo di foto e pubblicità, ma dotato di tutte le funzionalità per ricerca e navigazione. Questo progetto dunque non va confuso con il progetto Google Books di cui si sta parlando in questa sede.

Un altro canale di digitalizzazione su cui Google è presente in termini di sponsor economico è nel progetto dell'Unesco World Digital Library (WDL), nato nel 2005 sulla base di quanto fatto dalla Library Congress con il progetto American Memory e in collaborazione con IFLA [12].

Nel 2007 è stato lanciato il primo prototipo di WDL, composto da un nucleo di biblioteche nazionali o statali: la Library of Congress, la Bibliotheca Alexandrina, la National Library of Brazil, la National Library and Archives of Egypt, la National Library of Russia, e la Russian State Library.

La WDL è un canale che non va confuso con il Google Books, sebbene in questo progetto Google figuri comunque tra i partner, avendo tutto l'interesse ad acquisire conoscenza su questa tipologia di materiale speciale. Lo scopo è quello di rendere disponibili materiali di dominio pubblico, multilingua, coinvolgendo le biblioteche nazionali di vari paesi, che rappresentano il patrimonio culturale collettivo. L'obiettivo di questa biblioteca digitale mondiale è quello di promuovere una consapevolezza e un'attenzione sulla multiculturalità. Difatti il progetto prevede essenzialmente materiale non in lingua inglese, ed è orientato in particolare ai paesi in via di sviluppo. Il materiale, completamente fuori tutela e proveniente da culture e paesi diversi, comprende tutto ciò che non è incluso in Google Books, ad esempio manoscritti, mappe, libri antichi, spartiti musicali, registrazioni, film, stampe, fotografie, progetti architettonici e altri materiali di interesse culturale e scientifico. Ovviamente tale canale è finanziato, oltre che dalla Library of Congress, dai singoli governi che hanno messo a disposizione finanziamenti per la digitalizzazione del proprio patrimonio nazionale.

Un discorso a parte va fatto per Amazon che, come libreria virtuale, vende una serie di testi fisici sfruttando il fenomeno della lunga coda [13]. Amazon usa transazioni virtuali per la vendita di oggetti fisici, compresi i libri, sebbene da anni sia impegnata nella digitalizzazione dei testi che vende nella prospettiva di una distribuzione di capitoli di libri o libri interi, una volta che siano scaduti i diritti editoriali. Ovviamente la manovra di Google Libri ha interferito non poco con le prospettive di business degli e-books di Amazon [14], anche perché tale business è orientato alla vendita di versioni parallele del libro in formato e-book proprietario, scaricabile dal sito verso un dispositivo e-book reader, anch'esso proprietario, il Kindle.

A riguardo va ricordato come recentemente anche Amazon sia entrata in conflitto, per questioni di diritti, con le associazioni americane degli editori, in relazione all'ultima versione del suo dispositivo Kindle 2, che metteva a disposizione, accanto all'edizione digitale di un libro, una edizione speciale in formato "audio". Paul Aiken di Authors Guild, è insorto contro la funzione text to speech dell'e-book reader di Amazon perché, secondo gli editori, la narrazione scandita dal sintetizzatore incluso in Kindle 2 rappresenta una violazione del diritto d'autore. L'audiolibro che ne deriva, secondo Authors Guild, è un'edizione illegale, dal momento che qualsiasi lettore (e non solo il lettore con disabilità) può accedere alla funzione text to speech, creando all'istante un'opera derivata non autorizzata dal detentore dei diritti [15]. A nulla sono valse le considerazioni arrivate anche dai lettori, i quali giustamente osservavano che una funzione automatica di lettura è cosa ben diversa da un'edizione di un audiolibro: "a computer reading to you is a computer reading to you".

Anche in questo particolare, Google è stato molto più accorto: difatti la funzionalità aggiunta nel luglio del 2007 alla modalità "Visualizza solo testo", basata su tecnologie adattative come gli screen reader e i display Braille, e che consente agli utenti con problemi di vista di leggere questi libri con la stessa facilità degli altri utenti, è attivabile solo per i libri non protetti da copyright.

Non parleremo di Europeana proprio perché riguarda opere di pubblico dominio, sebbene la questione dei diritti d'autore sulle opere pubblicate sia stata una delle più discusse anche nell'ambito della Commissione Europea. Si tratta comunque di un portale che riunisce contributi già digitalizzati da diverse istituzioni dei 27 paesi membri dell'Unione Europea in 23 lingue. Ad oggi contiene due milioni di opere tra libri, film, dipinti, giornali, archivi sonori, mappe, manoscritti ed archivi, forniti per metà dalla Francia, il 10 per cento dalla Gran Bretagna, l'1,4 per cento dalla Spagna e l'1 per cento dalla Germania.

Non va dimenticato inoltre che esistono numerosi progetti di digitalizzazione sorti prima dell'avvento dei grandi progetti di digitalizzazione di massa, i quali hanno prodotto, sebbene con tecniche assai difformi l'uno dall'altro, digitalizzazioni di opere sparse in giro per il mondo. Mi riferisco ai progetti delle università, soprattutto quelle americane, o ai progetti di digitalizzazione di settori disciplinari ben precisi - ad esempio il progetto Digital Math Library [16] - che hanno realizzato copie digitali di tutto rispetto in centri di eccellenza europei come Grenoble [17], Gottinga [18] o Oxford [19]. Ma mi riferisco anche ai grandi progetti nazionali come il francese Gallica [20], o quello della British Library "Turning the page" [21], o ai progetti tedeschi [22], o e alle esperienze minori, ma di certo non meno interessanti, di digitalizzazioni di fondi o collezioni locali [23]. Difatti, accanto ai grossi progetti di digitalizzazione di massa, coesiste una vasta e frammentaria costellazione di piccoli e medi progetti di digitalizzazione che, nella maggior parte dei casi, sia a livello tecnologico sia soprattutto di visualizzazione per l'utente, sembrano essere superati dalle tecniche più recenti.

Di questi progetti bisogna tener conto in funzione di eventuali digitalizzazioni, per evitare inutili duplicazioni. Difatti, intelligentemente, Google Libri si è ben guardato dall'effettuare doppioni in tal senso e non è nemmeno escluso che, in un prossimo futuro, Google pensi ad applicare la sua tecnologia per funzioni di ricerca su tali progetti, attuando una sorta di meta-ricerca ad oggi mancante, da affiancare al Registro dei diritti.

In effetti Google Books si è già mosso in tale direzione, ad esempio per quanto riguarda le opere digitalizzate dalla Cornell con i precedenti progetti di digitalizzazione che Cornell aveva effettuato in collaborazione con Xerox. Mi riferisco al progetto Math Book Collection, che ancora negli anni Novanta, ha prodotto 573 testi di matematica con tecniche di digitalizzazione - ma anche di visualizzazione - ora del tutto superate. Il progetto in questione nasceva con lo scopo di "vendere" in modalità PoD (Print on Demand) le copie fisiche generate dalla copia digitale di opere di dominio pubblico, secondo la legge degli Stati Uniti, e facenti parte di una collezione definita come brittle, cioè fragile perché costituita con carta acida, prodotta tra fine Ottocento e primi Novecento, e che andava via via deteriorandosi.

6. La gestione dei diritti in Google Books e in Open Content Alliance: un confronto "aperto"

Prima di procedere con l'analisi dell'accordo transattivo di Google, è bene soffermarsi un attimo sulle modalità di gestione dei diritti dei due principali progetti di digitalizzazione di massa, e cioè Google Books e Open Content Alliance. Entrambe queste iniziative discendono in linea diretta dalla rivoluzione dell'accesso digitale: fermamente orientate al proposito di creare copie digitali di milioni di libri da rendere gratuitamente accessibili a tutti, i due progetti hanno catturato l'attenzione collettiva.

Non appena ci si inoltra nelle pieghe di entrambi i progetti, si può notare come Google raggiunga un maggior livello di trasparenza sotto molti punti di vista, mentre l'operatività dell'OCA sia in realtà molto più proprietaria di quanto si pensi. Sono state sollevate significative perplessità circa la sostenibilità del modello OCA per quanto riguarda i diritti, la gestione dei metadati e la trasparenza. Malgrado si faccia passare come un'alternativa trasparente a Google Libri, l'Open Content Alliance purtroppo ha reso pubbliche pochissime informazioni tecniche circa il proprio operato. Nonostante la comunità accademica abbia acclamato il modello "aperto" dell'OCA e condannato la proprietaria Google, in realtà le cose non sono come sembrano. Nonostante OCA affermi che i suoi contratti sono pubblici ed aperti, nessuna biblioteca partner ha pubblicato online il suo contratto. In sostanza, mentre si sa molto su come Google Books negozia con i suoi partner, molto poco si riesce a sapere sulle partnership di OCA.

Benché entrambi i progetti permettano di visualizzare, scaricare e stampare il materiale per uso personale, gli utilizzi concessi per altri usi variano notevolmente nei due progetti, anche in base al tipo di materiale preso in considerazione.

OCA, in quanto consorzio di partner indipendenti, invece di lavorare a un insieme di regole comuni concede ad ognuna delle organizzazioni di cui è composta di stabilire le sue politiche di copyright. Questo comporta il fatto che l'utente deve controllare di volta in volta ogni singolo documento per stabilire di quali diritti è in possesso (ad esempio il diritto di ridistribuzione). Di conseguenza, il compito di leggere e interpretare le politiche di copyright di entrambe le parti in questione è a carico dell'utente il quale, prima di utilizzare il documento, deve determinare qual è lo stato dei diritti sul documento e quali siano gli usi consentiti. Un'altra complicazione di OCA è che gli accessi alla maggior parte dei documenti non forniscono informazioni sulle limitazioni ai diritti su un dato documento, ma solo sullo stato dei diritti dell'originale cartaceo. Per stabilire il corretto stato del documento, l'utente deve consultare il link presente nel campo dei metadati "Digitizing Sponsor" e "Book Contributor": in questo modo, egli può prendere visione delle limitazioni sui diritti poste dalle organizzazioni coinvolte come sponsor e come contributor.

Per fare un esempio della complessità della relazione tra il fornitore del libro e lo sponsor che poi lo passa allo scanner, esaminiamo il caso di due libri di pubblico dominio forniti ad OCA per la scansione dalla University of California Library. Il primo, The adventures of Tom Sawyer, è un libro del 1876 digitalizzato da Yahoo!, di pubblico dominio e accessibile a tutti gli utenti; il secondo, Within the golden gate: a souvenir of San Francisco Bay, è un libro del 1893 digitalizzato da Microsoft. Per quest'ultimo caso, anche un servizio di ristampa paperback a pagamento del file effettuato da una specifica comunità di biblioteche non sarebbe permesso, se non previa autorizzazione da parte di Microsoft.

Quindi, si tratta di due libri provenienti dalla stessa biblioteca e digitalizzati entrambi da OCA, ai quali però sono state applicate restrizioni sui diritti completamente differenti. Per tornare all'esempio precedente, sia l'edizione digitale di Google Books sia quella di OCA relative all'opera di pubblico dominio Within the golden gate sono soggette a limitazioni, in quanto non possono essere utilizzate per scopi commerciali. Tuttavia, mentre Google indica che l'uso commerciale è vietato nella prima pagina del PDF, l'edizione OCA non contiene alcuna nota sul tipo di restrizioni a cui è soggetta l'opera. Di conseguenza, avendola scaricata dal sito di OCA, l'utente potrebbe pensare che l'opera sia di pubblico dominio, poiché OCA generalmente predilige le opere non soggette ad alcun tipo di limitazioni. Di converso, capita che Open Content Alliance non segnali restrizioni sui diritti per quelle opere che necessitano di limitazioni al loro utilizzo, mentre classifica come protetti da copyright quelle opere che sono a tutti gli effetti di pubblico dominio [24].

E' interessante esaminare il caso dell'opera di Ernesto Pascal - matematico italiano dei primi del Novecento � dal titolo I gruppi continui di trasformazioni, pubblicato da U. Hoepli nel 1903, il cui originale fisico, composto di 358 pagine, è collocato ad Harvard in una delle biblioteche partecipanti pienamente al progetto Google Book, ma posseduta anche dalla Cornell University. In precedenza l'opera della Cornell venne digitalizzata � peraltro con tecniche invasive che distruggevano l'originale � in una copia master digitale, che generava copie fisiche a richiesta e visualizzazioni di tipo hard copy una pagina per volta, entro il progetto the Cornell Historic Math Monograph Collection [25]. Tale copia digitale è inutilizzabile per gli scopi di ricerca e recupero dell'informazione, e che invece oggi riusciamo ad ottenere con la moderna tecnologia. In ogni caso l'opera, sebbene di pubblico dominio, per la legge degli Stati Uniti non è visibile dal progetto Google Books proprio perché il detentore dei diritti dell'edizione digitale è Cornell, che vende la copia fisica. In effetti sull'informazione bibliografica di Google Books compare la scritta: "Available on demand as hard copy or computer file from Cornell University Library".

Altre edizioni della stessa opera furono digitalizzate dall'Università del Michigan, dove si possono acquistare sempre in modalità hard-copy. In altri termini opere di pubblico dominio stanno sotto chiave perché i diritti sono di università americane che le hanno digitalizzate. L'aspetto curioso è che si tratta di un testo italiano di un autore italiano, i cui diritti sono ancora vigenti in Italia in quanto Ernesto Pascal è morto nel 1940. Tutte le sue opere, oltre 250, per la legge italiana sono ancora soggette a tutela fino al 2010. Ora per avere la copia digitale di tali opere, che possediamo nelle nostre biblioteche, due sono le strade: o le digitalizziamo a nostre spese, aspettando il 2010 per metterle in rete, ammesso che gli eredi non chiedano prolungamenti o che non vendano i diritti ad un editore per altri 20 anni prima del 2010 (cosa possibile), oppure chiediamo a Google Libri di venderci un abbonamento, in quanto queste opere sono già disponibili e pronte, essendo state digitalizzate in collaborazione con le università americane.

7. L'accordo Google Settlement o accordo transattivo

Mentre la consultazione per esteso dei libri di pubblico dominio, ovviamente, non presenta aspetti particolarmente problematici, la possibilità per qualsiasi utente di ricercare entro opere protette da diritto d'autore (che erano state digitalizzate a questo scopo) ha provocato, nell'autunno del 2005, una class action promossa da un gruppo di autori ed editori, risoltasi il 28 ottobre 2008 con il cosiddetto Google Book Settlement (accordo Google Libri o Transazione). L'agreement chiude la vertenza legale tra editori USA e Google sui libri digitalizzati, e copre gli usi delle opere pubblicate prima del 5 gennaio 2009 e usate senza autorizzazione fino al 5 maggio 2009. Dopo tale data si applica la legislazione vigente, e ogni singola digitalizzazione fatta da Google dovrà essere autorizzata, anche se è facile ipotizzare una seconda tranche di accordi transattivi, col vantaggio per Google di eludere strascichi legali e ben più gravose sanzioni derivanti da effrazioni in materia di copyright, sottostando alle regole imposte da tale transazione.

Una class action è una causa di azione di categoria: uno o più "membri della classe" fanno causa rappresentando anche altri che hanno simili reclami. Tutte queste persone, nell'insieme, sono "una classe" o una "categoria" e individualmente sono "membri della classe". Il Tribunale deve decidere se permettere o meno che la causa diventi un'azione di categoria. Se così avviene, la Transazione (Settlement) coinvolgerà chiunque sia un membro della classe. Nel caso in questione, la Classe è divisa in due sottoclassi: la Sottoclasse degli Autori e la Sottoclasse degli Editori. Dopo lunghe ricerche da parte del Querelante e di Google, inclusa la revisione di milioni di pagine di documenti presentati da entrambe le parti, e dopo più di due anni di negoziazioni, le parti si sono trovate d'accordo a procedere alla Transazione. Una transazione è un accordo tra querelante e parte citata per risolvere una causa. Le transazioni concludono controversie legali senza l'intervento del Tribunale o di una giuria che decida in favore di una delle parti. Una transazione permette alle parti di evitare i costi ed i rischi di un processo.

L'accordo Google risolve perciò una causa legale negli Stati Uniti, e pertanto ha un effetto diretto soltanto su quegli utenti che accedono a Google Ricerca Libri negli USA; in qualsiasi altra località, l'esperienza dell'utente su Google Ricerca Libri resterà immutata. Google dichiara la disponibilità a collaborare con gruppi internazionali del settore e con i singoli detentori dei diritti, per offrire i vantaggi di questo accordo agli utenti di tutto il mondo. Sebbene si tratti di un accordo che riguarda in prima battuta gli Stati Uniti, e che quindi ogni eventuale trasposizione in Europa o all'interno di un Paese diverso dagli USA dovrebbe essere calata nella legislazione nazionale, e/o dovrebbe essere comunque soggetta a un accordo transattivo "locale", va sottolineato che si tratta di un accordo storico, che presenta una serie di vantaggi per le biblioteche anche fuori dagli Stati Uniti.

Esaminiamo i termini dell'accordo, per quanto non sia cosa facile. Gli stessi giuristi statunitensi hanno ammesso la complessità insita nei dettagli dell'accordo, costituito da 141 pagine più 162 di appendici, [26] tutte in gergo legale, peraltro in inglese. E' comunque disponibile una sintesi di 34 pagine in traduzione italiana, detta "notifica", [27] che presenta però alcuni errori di traduzione (sebbene facilmente individuabili), redatta direttamente dagli uffici legali di Google [28].

Come si è detto, i libri di pubblico dominio non presentano particolari problematiche relative al diritto d'autore: per questo Google ne consentirà, oltre alla ricerca indicizzata, anche la visualizzazione full-text. Le regole stabilite dall'accordo si concentrano invece sulla categoria delle opere soggette a copyright, effettuando una distinzione tra opere reperibili in commercio e opere che non lo sono più, adottando in tal senso criteri differenti:

In ogni caso secondo l'accordo Google ha degli obblighi precisi da rispettare tra i quali:

8. Il Books Rights Registry

L'accordo porterà alla creazione di un Book Rights Registry, un Registro dei Diritti indipendente e senza scopo di lucro per rappresentare autori, editori e altri detentori dei diritti. In sostanza, il Registro contribuirà all'identificazione degli aventi diritto e a garantire che percepiscano la debita retribuzione stabilita da questo accordo per le opere offerte. Ulteriori informazioni su questa importante iniziativa sono disponibili sul sito di amministrazione della transazione [29], sul sito dell'associazione degli autori americani Authors Guild o sul sito dell'associazione degli editori americani AAP.

Il Registro dei Diritti non è a scopo di lucro e si occuperà della manutenzione di un database degli aventi diritto, creando una lista di informazioni su come contattarli, e informazioni contenenti le loro richieste a proposito degli usi dei Libri ed Inserti; inoltre individuerà, stabilirà e coordinerà i pagamenti agli aventi diritto. Il Registro rappresenterà gli interessi degli aventi diritto, sia in connessione con la Transazione che in altri accordi commerciali, inclusi accordi con altre compagnie oltre a Google. Il Registro sarà amministrato congiuntamente ad un Consiglio di Amministrazione formato da un numero pari di rappresentanti della Sottoclasse degli Autori e della Sottoclasse degli Editori.

Per prima cosa Google dovrà versare al registro 34,5 milioni di dollari come fondo iniziale per coprire i diritti dovuti,. Per dirimere le problematiche relative al diritto di autore e per distribuire le royalties ai detentori dei diritti, Google mette a disposizione non meno di 45 milioni di dollari per remunerare i detentori di diritti (autori o editori) che ne faranno richiesta per i libri e gli inserti digitalizzati finora (60 dollari per opere principali, 15 per inserti interi, 5 per inserti parziali). Inoltre pagherà non meno del 63% del ricavato delle successive vendite on-line (abbonamenti a database di libri o vendite di singoli libri digitalizzati, vendita di spazi pubblicitari).

I proprietari del copyright di un'opera o di parte della stessa (i cosiddetti inserti) avranno inoltre la possibilità di decidere che uso Google potrà farne: se escluderla del tutto dall'archivio Google Libri, o sottoporla a particolari restrizioni relative alle modalità di visualizzazione, specie per quanto riguarda la quantità di materiale reso disponibile all'utenza. Autori, editori o detentori di copyright possono trovare informazioni specifiche sul sito di amministrazione della transazione [30].

Inutile dire come questa soluzione trovi gli autori entusiasti, perché finalmente riescono a far valere i propri diritti nei casi in cui l'editore mandi al macero l'opera perché non frutta abbastanza, o quando l'opera risulta fuori stampa, o nel caso in cui l'editore sia fallito. Non è superfluo però sottolineare come il Registro potrà risultare uno strumento fondamentale per le biblioteche e per gli utenti ai fini della conoscenza dello stato dei diritti di un'opera fuori stampa. Ad oggi non esiste nessuno strumento del genere, strumento che era stato caldeggiato da tempo immemorabile e che la Digital Library Federation (DFL) si era riproposta di attuare ancora un decennio fa.

Per quanto riguarda i libri fuori commercio, la creazione del Registro previsto dall'accordo, consente agli autori di farsi avanti e far valere i propri diritti tramite il sito "transattivo" a loro dedicato, facendo uscire dall'anonimato tutti questi libri. In pratica, per chi partecipa a tale progetto, la questione dei diritti è risolta a monte da Google; chi ne resta fuori deve invece vedersela con gli avvocati preposti alla gestione dei diritti e alla inevitabili cause. Piuttosto, ciò che non è chiaro è in quale categoria andranno a finire le opere i cui autori non si faranno avanti entro le date stabilite. Saranno considerate opere orfane? E come verranno gestiti i diritti della copia digitalizzata da Google? Andranno nel pubblico dominio?

9. Le Biblioteche nell'accordo transattivo

Per rendere accessibili ai propri utenti i full text anche delle sole risorse della propria collezione, le biblioteche partner di Google dovranno comunque sottoscrivere un abbonamento istituzionale, come prevede il Settlement. Ma gli accordi specifici presi in precedenza da Google con le biblioteche (esempio quello con la Michigan University) stabilivano che queste potessero utilizzare liberamente le copie digitali ricevute in cambio, accesso al full text compreso, a disposizione di tutta la propria utenza. Alla luce del Settlement, che prevede delle nette restrizioni in tal senso, è molto probabile che nasca per le biblioteche già partner la necessità di rinegoziare i propri accordi con Google. Il Settlement prende in considerazione la possibilità che le biblioteche si costituiscano come terza parte in causa, come class action e, nominati i propri rappresentanti, si pongano a loro volta come interlocutore di Google nel far valere i propri diritti collettivi ai sensi della risoluzione.

Le copie cartacee dei libri che Google ha digitalizzato provengono da biblioteche di tutto il mondo, legate a Google da particolari tipologie di contratto, che le rende ascrivibili a quattro tipologie differenti:

A) Biblioteche aderenti in pieno: firmano un accordo con il Book Rights Registry, che le mette al riparo da qualsiasi effrazione in materia di copyright. Fornisce a Google una serie di libri protetti da copyright ottenendo in cambio, dopo la scansione, il diritto di trattenere una copia digitale di ciascuna risorsa fornita e di utilizzarla liberamente entro certi termini, definiti dall'accordo con Google. Nel caso Google abbia già inserito nel proprio database una risorsa posseduta da una biblioteca aderente in pieno (ad es. per averla ottenuta da un'altra biblioteca), la biblioteca ne riceverà comunque una copia digitale. Google comunque fornirà copie digitali solo delle opere che la biblioteca già possiede, lì dove la collezione totale della Biblioteca consti almeno per il 30% di opere non ancora inserite da Google nel proprio Database.

L'insieme delle copie digitali dei libri così ottenuti dalla Biblioteca, è detta LDC (Library Digital Copy). Con la propria LDC le biblioteche aderenti in pieno possono:

B) Biblioteche contribuenti: forniscono a Google anche libri protetti da copyright ma, ricevendo in cambio copie digitali solo opere di pubblico dominio, non dovranno sottostare alle norme previste dal Security Standard. Saranno comunque obbligate a distruggere le copie digitali di tutte le risorse coperte da copyright ricevute finora (prima dell'accordo).

C) Biblioteche di pubblico dominio: forniscono a Google solo libri di pubblico dominio. Distruggeranno le copie digitali dei libri coperti da copyright precedentemente ricevuti, in cambio di un certificato da parte di Google che le solleva da qualsiasi violazione in materia di copyright perpetrata in passato, e le garantisce in caso di violazioni accidentali future (ad esempio per fornire a Google un libro protetto da copyright erroneamente considerato di dominio pubblico).

D) Altre Biblioteche: forniscono a Google libri protetti e non protetti da copyright, trattenendone copie digitali, senza però partecipare all'accordo. Per questo, in teoria sono esposte a cause legali.

Naturalmente l'accordo non prevede nessuna restrizione per le biblioteche circa l'uso delle risorse digitali non fornite da Google, né vieta loro la possibilità di partecipare ad altre iniziative di digitalizzazione.

10. Usi e servizi

Il motto di Google è quello di offrire un servizio che "permetta agli utenti di tutto il mondo di visualizzare, ricercare/sfogliare, leggere ed anche scaricare materiale di pubblico dominio". Un'integrazione [35] con Google Maps consente agli utenti di sfogliare i libri in base alle località menzionate nel testo; se viceversa l'utente sceglie una località, Google visualizza i libri in cui questa è menzionata [36]. Altra funzione di un certo interesse è la possibilità di esplorare i testi, evidenziando i brani comuni a più libri [37]. E' possibile inoltre creare la propria biblioteca personale anche con funzioni di upload da liste di titoli da altre piattaforme per lettori, come per esempio Library Thing [38] e aNobii [39].

Nell'Accordo della Transazione il termine "disponibile sul mercato" indica un libro in commercio. Se un Libro non è disponibile sul mercato, ciò significa, in generale, che è fuori stampa. Google è autorizzato a fare Usi di Visualizzazione e Usi di Non-visualizzazione di ogni libro che non sia disponibile sul mercato, in accordo con i termini di copyright USA per quel libro, a meno che l'avente diritto non istruisca Google a non procedere in tal modo o di rimuovere il libro. Le richieste di rimozione devono essere presentate entro il 5 Aprile 2011 [40].

Gli Usi di Visualizzazione includono Usi di Accesso, Usi di Anteprima, Visione di Frammenti e Visione delle Pagine sulla Bibliografia.

Google conserverà interamente il proprio database indicizzato di opere digitali (meno quelle opere che i proprietari hanno la facoltà di ritirare), all'interno del quale l'utenza potrà effettuare gratuitamente ricerche su tutti i materiali contenuti. Ben diversa questione riguarda cosa rendere effettivamente disponibile per la consultazione, e le modalità di tale visualizzazione.

Il ricavato dagli abbonamenti andrà coprire il pagamento dei diritti agli aventi diritto, in quanto l'abbonamento riguarda materiale soggetto a tutela (editoriale e/o d'autore).

L'uso che una biblioteca potrà fare delle copie digitali del materiale fornito a Google non è lo stesso di quello previsto dalla sottoscrizione di un abbonamento di accesso al database di Google o ad una sua porzione. L'abbonamento infatti mette a disposizione (modalità di ricerca, di visualizzazione, stampa, etc.) l'accesso al database istituzionale. In prima battuta, le opere fornite dalle biblioteche finiscono nell'intero database di Google, e solo successivamente possono essere incluse nel database istituzionale (ad esempio se coperte da diritto d'autore ma fuori commercio). Così sembra che, per accedere alla copia digitale completa anche delle opere da fornite dalla biblioteca (che la possiede fisicamente), la stessa biblioteca dovrà comunque sottoscrivere un abbonamento istituzionale. In ogni caso, deve essere chiaro che una Library Digital Copy non corrisponde per intero ad una porzione del database istituzionale.

11. Copyright sull'edizione digitale

Talvolta sfugge che, oltre al copyright relativo all'opera originale analogica, vi è un copyright sulla copia digitale che regola ciò che può essere fatto con quel determinato file, quali restrizioni possono essere imposte alla versione digitale dell'opera e quali gli utilizzi possibili del file ottenuto. Anche se le restrizioni dovute al diritto d'autore sull'originale a stampa possono essere da tempo scadute, gli stessi file digitali sono soggetti a una varietà di protezioni legali.

Va premesso che, per la legge europea, chi investe in personale, attrezzature, risorse economiche nello sviluppo di basi di dati è il legittimo detentore dei diritti, non d'autore, bensì di un diritto correlato noto come diritto sui generis, che agisce sulla banca dati nella sua interezza. Google quindi, essendo il costitutore della banca dati, ne detiene il diritto sui generis, diritto sganciato dai singoli contenuti delle opere contenute nel suo database. Ma vediamo qual è veramente lo stato dei diritti sul file digitalizzato da Google, e come un'eventuale proprietà sull'edizione digitale impatti su usi e accesso dell'edizione digitale.

Google, pur non includendo altri tipi di metadati al file digitale, inserisce una nota legale che definisce i possibili utilizzi del file all'inizio di tutti i PDF scaricabili. Open Content Alliance, al contrario, non include alcun tipo di nota legale all'interno dei suoi file, anche se questi sono soggetti a restrizioni. Il progetto Google Books è supervisionato da un'unica compagnia con un insieme di regole che definiscono le modalità di utilizzo dei file. Qualsiasi documento di pubblico dominio può essere scaricato per uso o fruizione personale; le restrizioni sono poste solo sulla distribuzione di materiali prodotti da Google. Viene concessa un'autorizzazione alle biblioteche partner per la distribuzione della versione digitale dei loro materiali; altri usi devono essere autorizzati di volta in volta da Google. Secondo quanto riportato nella nota legale posta all'inizio di tutti i PDF scaricabili, gli utenti sono invitati ad effettuare un uso su larga scala dei materiali per motivi di ricerca, e a contattare Google per maggiori informazioni.

Anche se tutti i materiali di pubblico dominio in Google Books dovrebbero essere soggetti alle stesse restrizioni sui diritti, Google riconosce che spesso i file vengono rinominati, inoltrati, utilizzati come post in qualche bacheca e, inevitabilmente, distribuiti ad un pubblico più vasto rispetto all'utente iniziale. Per fare in modo che tutti i possibili fruitori del documento siano a conoscenza delle restrizioni applicabili al suo contenuto, Google pone una nota legale all'inizio di ogni documento sia nella lingua nella quale l'utente ha scaricato il documento, sia nella lingua in cui è stato scritto il documento. Se le due lingue coincidono, la nota legale viene posta una volta sola. [41]

In numerosi blog si è discusso molto di ciò, accusando Google Books di chiudere per scopi commerciali i testi digitalizzati che rientravano nel dominio pubblico. In realtà le cose non stanno esattamente in questi termini. Spesso non è chiaro, a quanti non sono molto pratici di diritti, che quello che apparentemente sembra essere un diritto di Google sulla copia digitale nel blindare un'opera di pubblico dominio, in realtà è un diritto editoriale di altra natura. Come nel caso di Ernesto Pascal, i diritti sono di Cornell o di Michigan (a seconda dell'edizione), e quindi Google non può mettere in consultazione il testo completo dell'opera che ha digitalizzato, perché da uno stato di pubblico dominio è passata a un'opera soggetta a diritti editoriali (nel caso, le due università). Nell'esempio dell'opera di Ella Cheever Thayer, Wired Love, testo pubblicato da W. J. Johnston nel 1880 - il cui originale è disponibile presso la Biblioteca Pubblica di New York - la digitalizzazione effettuata la Google Books nel 2007 rimane blindata a causa di una nuova edizione di IndyPublish.com nel 2008, che toglie l'opera dal pubblico dominio per 20 anni.

12. Le opinioni nel mondo

Su tutti i blog del mondo si sta discutendo, anche in toni vivaci, dell'accordo Google, sebbene spesso in modo improprio, senza aver letto e approfondito la questione, o meglio le fonti. E, come è noto, da blog a blog si copiano e ricopiano post dal contenuto ambiguo o comunque non certificato con verifiche alla fonte. La proliferazione di news tutte uguali, sui generis, non aiuta a capire i reali meccanismi dell'accordo. Le opinioni degli esperti, o meglio dalle parti in causa, sono divergenti: dal massimo entusiasmo, espresso da autori, editori e dagli utenti della rete, ai fondati timori di un monopolio di Google, manifestato da non pochi bibliotecari e opinionisti. In effetti sta proprio nell'accordo il motivo di preoccupazione espresso da alcuni, in quanto stravolge l'originaria mission di Google, che era fondata sulle tecniche di ricerca e recupero dell'informazione e che, grazie all'accordo, diviene un modello economico di grande interesse anche per i sostenitori del libero mercato.

L'idea di Google era quella di trasporre il suo know-how tecnologico e organizzativo nel recupero dell'informazione operato sul web e nel web, su una massa informativa certificata e di qualità che potesse consentire di recuperare informazione di qualità: dalla ricerca sul web surface a una ricerca entro i testi contenuti nelle biblioteche. Lo scopo era quello di usare la tecnologia fino ad allora impiegata per ricerca nel Web anche ai fini di una ricerca entro un assetto di grande biblioteca digitale mondiale. Lo scopo originario di Google non era quello di competere con Amazon, almeno non apparentemente, ma piuttosto di rendere ricercabili i libri digitalizzati, riproducendoli in un contesto di fair use, al fine di dirottare l'utente tramite link alle sedi opportune (librerie virtuali e OPAC) e ricavarne profitti dai siti sponsorizzati. E' stato proprio l'accordo che ha stravolto lo scopo primario dell'operazione, consentendo a Google di agire in regime di monopolio [42]. Ciononostante Larry Lessig uno dei massimi giuristi esperti del cyberspazio, professore all'Università di Stanford e ideatore delle licenze Creative Commons, sostiene nel suo blog che "this is a good deal that could be the basis for something really fantastic" [43].

A novembre 2008 ALA e ARL hanno pubblicato un'agevole guida per bibliotecari dal titolo A guide for the Perplexed: Libraries & the Google Library Project Settlement, per spiegare le principali clausole e il ruolo delle biblioteche nell'accordo tra gli editori e il motore di ricerca più famoso del mondo [44].

Va anche detto che l'accordo [45] prevede � come spiegato in questa guida - la costituzione di un corpo di ricerca dislocato in due centri (oltre a Google) scelti dalle biblioteche, ossia un database che conterrà l'insieme di tutte le copie digitali connesse al Google Library Project. Il corpo di ricerca avrà funzioni, oltre che di indicizzazione e ricerca, anche di analisi linguistica, di analisi computazionale sui testi, data mining per estrapolazioni testuali, applicazione di tecniche automatiche per estrarre informazioni per comprendere o per sviluppare relazioni tra o dentro i libri, ad esempio sviluppo di concordanze, collocazione del testo estratto, estrapolazione di citazioni, classificazione automatica, estrazione d'insieme, strutturazione verbale, etc. Inoltre questa massa di contenuto sarà utile per condurre ricerche e sperimentazioni sul fronte della conservazione digitale.

Una considerazione da fare - e forse più di qualcuno si sarà posto domande in merito - è come possiamo collocare il progetto Google Books entro una cornice di Open Access. Sul blog di Peter Suber le visioni sono contrastanti: un post interessante pone spunti di riflessione in merito al Fair Use Claim:

Va sottolineato come l'Open Access riguardi principalmente il mondo della comunicazione scientifica, mentre il progetto Google Libri è focalizzato su un concetto di biblioteca digitalizzata che comprende per lo più editoria varia, anche se non solo. L'Open Access si focalizza sulle opere per cui gli autori non ricevono royalties e quindi, automaticamente, tutto ciò che rientra in un canale di mercato economico è fuori dall'Open Access. Google Books riguarda invece autori ed editori che rivendicano diritti economici. Inoltre l'Open Access nasce principalmente per contrastare l'alto costo dei periodici scientifici, mentre il Google Books si riferisce ai libri. Non confondiamo inoltre il pubblico dominio con l'Open Access.

Problemi, ambiguità e rischi sollevati dall'accordo sono comunque da vagliare con attenzione in particolare in merito a:

In sostanza, l'esperienza di Google Books ha permesso di identificare le diverse categorie di libri in relazione allo stato dei diritti

13. Considerazioni su una possibile estensione dell'accordo all'Europa

Prima di tutto va analizzata la compatibilità tra il Google Settlement statunitense e la normativa europea, al fine di capire in che termini l'esperienza di digitalizzazione di massa è esportabile in Europa sotto il profilo della legislazione del diritto d'autore.

Un primo aspetto riguarda il profilo dei libri di pubblico dominio che, come abbiamo visto in riferimento all'accordo con l'Università di Oxford, differisce per i termini temporali da paese a paese: in Australia vige la norma dei 50 anni dopo la morte dell'autore, in Gran Bretagna il limite è il 1920, negli Stati Uniti il 1923. Nel resto d'Europa non sono applicabili date a priori, ma si deve esclusivamente considerare una tutela di settanta anni dopo la morte dell'autore, ammesso che dopo tale data o in prossimità di essa, un erede non abbia ceduto i diritti a un editore per vent'anni. In tal caso la tutela dura 90 anni (70+20); se poi si tratta di un'edizione critica di un testo che era nel dominio pubblico, il diritto editoriale dura 25 anni. Si sottolinea anche che in Italia, in virtù di un trattato internazionale di recepimento di tutti i TRIPs del WTO (accordi dell'Organizzazione Mondiale per il Commercio sulla proprietà intellettuale), gli autori o gli eredi che ne fanno espressa richiesta possono chiedere il prolungamento della tutela dei diritti d'autore dai 70 anni a 76 anni e 8 mesi. Questo a seguito del recepimento del Trattato di Pace, che contiene una clausola che prolunga di 6 anni e 8 mesi il diritto d'autore, per colmare la perdita dovuta al periodo di guerra dei paesi coinvolti. E' il caso delle opere di D'Annunzio e di Pirandello, mentre le opere di Grazia Deledda, che non ha eredi che possano vantare tali diritti, sono state digitalizzate entro la biblioteca digitale della Regione Sardegna [47].

Per quanto riguarda la situazione europea va considerato che, nell'eventualità di un accordo per le opere orfane simile a quello statunitense, la Direttiva Europea (recepita anche entro il corpo normativo italiano del diritto d'autore) prevede un'eccezione che potrebbe risultare favorevole, ma ovviamente in tale evenienza sarebbe necessario chiedere un parere agli esperti. In altre parole, se Google "paga" i diritti agli aventi diritto (autori ed editori) e le biblioteche forniscono i libri ai fini di una digitalizzazione all'interno di un accordo, la copia digitale per la biblioteca partecipante rientrerebbe a tutti gli effetti � essendo la biblioteca ubicata in Europa � nell'eccezione di cui all'art. 71-ter della Legge 633/1941. [48]

Un equivoco che va chiarito è relativo alla convinzione che vi sia una "perdita" o cessione dei diritti delle biblioteche partecipanti in favore di Google. Nulla di più errato. Le biblioteche non possiedono mai i diritti delle opere che posseggono, ma i diritti sono o degli autori o degli editori. Nel caso di opere di dominio pubblico, non vi è tutela in termini di copyright e Google non potrà mai vantare dei diritti su tali opere che rimangono a tutti gli effetti accessibili a testo pieno gratuitamente.

In altri termini, partecipare a un accordo con Google, oltre al fatto di avere in-home una digitalizzazione delle opere possedute dalla propria biblioteca a costo zero, seppur con tutti i limiti di tale copia locale, non presuppone nessuna perdita di diritti. Inoltre la copia digitalizzata va comunque a costituire, oltre al corpo di ricerca, anche la banca dati delle opere consultabili su Google Books, uscendo fuori da un contesto di opera analogica per divenire risorsa digitale.

Del resto digitalizzare in proprio (in-home o in outsourcing che sia) con i costi conseguenti, non esonera le biblioteche dagli enormi problemi sui diritti per quei testi che sono soggetti a diritti d'autore o editoriali. Nelle digitalizzazioni effettuate dalle biblioteche, a meno che non si proceda con materiale di dominio pubblico e fuori diritti, il carico maggiore dei costi riguarda la spesa per gli avvocati, un costo enorme proprio per la necessità di dover procedere ad accordi libro per libro, editore per editore. E la grossa parte - pari al 70-75% - dei libri presenti nelle biblioteche riguarda testi il cui stato dei diritti è praticamente sconosciuto, i cosiddetti libri orfani. In tale assetto risulta di fondamentale importanza la creazione un Registro delle opere con lo stato dei diritti.

Se immaginiamo ad esempio uno scenario di digitalizzazione massiccia in Europa, o anche solo in Italia, via Google o tramite altri canali, va considerato che ad oggi, come sostiene Robert Darnton [49], nel suo recente articolo sul New York Review of Books [50], abbiamo perso tutti i treni. Questo perché molto è già stato digitalizzato appunto tramite GoogleBooks, e l'accordo transattivo che ne è derivato crea alleanze dirette tra Google e gli editori per l'immissione dei libri da adesso in poi.

Come ha dichiarato il presidente dell'Associazione Italiana Editori (AIE) Federico Motta, in un'intervista pubblicata sul "Sole 24 Ore" in merito al servizio Google Book Search e all'accordo transattivo:

Per le evidenti sovrapposizioni, digitalizzare in Europa, in questa fase, significa dover fare i conti con una parte di patrimonio costituito da quei testi che sono già presenti in Google Books, e quindi soggetti all'accordo transattivo. In altri casi potrebbero essere presenti in altri progetti di digitalizzazione.

In altri termini le biblioteche che da adesso in poi si aggiungerebbero al progetto Google Books non potrebbero contare sulla copia digitale da conservare in loco per quei materiali già digitalizzati, ma dovrebbero accendere abbonamenti a Google Books, in quanto non sono state loro (ma le biblioteche americane per prime) a fornire i testi, a meno che non ci si accordi diversamente. Comunque andrebbe fatta anche un'analisi costi/benefici, ovvero quanto costerebbe una digitalizzazione "indipendente" e "autonoma" in rapporto ai costi di abbonamento calcolati entro un arco temporale relativamente lungo.

In ogni caso, nell'eventualità di un interesse di Google ad aprirsi a collaborazioni con biblioteche in Italia, andrebbe valutato come e in quali forme partecipare, individuando una delle quattro possibili tipologie. Da escludere subito la quarta tipologia, "Altre Biblioteche" in quanto si sarebbe esposti a cause legali, sebbene la fornitura a Google di libri protetti e non protetti da copyright comporterebbe la copia digitale locale anche senza la partecipare all'accordo.

Difficile aderire come categoria di biblioteca aderente in pieno, proprio perché - soprattutto per la parte scientifica - molte opere sono già state digitalizzate, specie quelle in lingua inglese. Il vantaggio sarebbe quello di avere la copia digitale in-home ai fini di ricerca, ma non di consultazione. Come biblioteca contribuente ci sarebbe l'obbligo di fornire a Google anche libri protetti da copyright, ma ricevendo in cambio copie digitali solo delle opere di pubblico dominio, che potranno essere messe sul sito della biblioteca. In tal caso la biblioteca non dovrà sottostare alle norme previste dal Security Standard. La biblioteca di pubblico dominio fornisce a Google solo libri di pubblico dominio. Di fatto queste ultime due categorie avevano senso prima dell'accordo, perché di fatto l'accordo accorpa le due categorie in una sola.

La scelta di un'eventuale adesione, in sostanza, dovrebbe avvenire tra una fornitura di opere solo di pubblico dominio o partecipando come biblioteca partecipante in pieno, valutando l'opportunità di usare la copia locale anche per la consultazione all'interno del campus, invocando a tal riguardo la direttiva europea.

Su questi punti andrebbe fatta una seria riflessione prima di sottoscrivere qualsiasi accordo. Sicuramente andrebbe condotto un test a campione per verificare quanto e cosa è stato digitalizzato finora dai progetti di digitalizzazione nel loro complesso, compresi quelli di massa. Uno scenario interessante potrebbe essere quello di focalizzare un eventuale accordo con Google sui testi di ambito umanistico e giuridico (prevalentemente in italiano), certamente non presenti attualmente nel Google Books.

14. Allegato

Ogni libro include una pagina di "Informazioni su questo libro", contenente le principali informazioni bibliografiche come titolo, autore, data di pubblicazione, lunghezza e argomento. Per alcuni libri potrebbero essere visualizzate informazioni aggiuntive, parole, espressioni chiave, riferimenti al libro in pubblicazioni accademiche o altri libri, titoli dei capitoli e un elenco di libri correlati. Per ogni libro saranno presenti i link che indirizzano alle librerie nelle quali è possibile acquistarlo e alle biblioteche nelle quali prenderlo in prestito.

Come in un catalogo a schede, è possibile visualizzare le informazioni di base sul libro.

La Visualizzazione frammento, al pari del catalogo a schede di una biblioteca, riporta le informazioni sul libro, oltre ad alcuni frammenti, ossia alcune frasi per mostrare il termine di ricerca nel contesto.

La Visualizzazione completa è disponibile se il libro non è soggetto a copyright oppure se l'editore o l'autore ha richiesto di rendere il libro completamente visualizzabile. La Visualizzazione completa consente di visualizzare qualsiasi pagina del libro e, se il libro è di dominio pubblico, è possibile scaricare, salvare e stampare una versione PDF da leggere quando e come si preferisce.

Se l'editore o l'autore hanno concesso l'autorizzazione, si può visualizzare un numero limitato di pagine del libro sotto forma di anteprima.

Antonella De Robbio, CAB - Centro di Ateneo per le Biblioteche - Università degli Studi di Padova, e-mail: antonella.derobbio@unipd.it

Note

[1] Merk Lemley, Luogo e cyberspazio, in I diritti nell'era digitale: libertà di espressione e proprietà intellettuale, a cura di Vittorio Colomba, Reggio Emilia, Diabasis, 2004.

[2] <http://books.google.com>.

[3] <https://books.google.com/partner>.

[4] Un esempio fra i tanti: Jonathan Swift, I viaggi di Gulliver, edizione Feltrinelli 1997, quindi ancora sotto diritti editoriali.

[5] Franco Angeli sta contattando i suoi autori chiedendo loro una modifica del contratto per la versione digitale delle opere da inserire in Google, e proponendo un 8% di diritti per ogni copia venduta. Va considerato che Google paga il 63% di diritti al detentore.

[6] <https://books.google.com/partner/?hl=it>.

[7] <http://books.google.com/googlebooks/partners.html>. Esiste la traduzione italiana del contratto dell'Università del Michigan.

[8] Chi fosse interessato può contrattare l'autrice del presente articolo.

[9] Da maggio del 2008, la Biblioteca Cantonale e Universitaria di Losanna e la Biblioteca dell'Università di Ghent aderiscono al programma Google Ricerca Libri, contribuendo con un notevole numero di titoli in fiammingo, francese, latino, tedesco e altre lingue e portando il totale delle biblioteche europee a sei.

[10] <http://books.google.com/support/bin/request.py>.

[11] <http://www.earlham.edu/~peters/fos/2005/10/more-on-brewster-kahle-and-oca.html>.

[12] <http://www.worlddigitallibrary.org/project/english/index.html>.

[13] L'espressione The Long Tail (coda lunga), coniata da Chris Anderson in un articolo del 2004 su Wired, indica un modello economico in cui prodotti a bassa richiesta o con vendita ridotta possono collettivamente occupare una quota di mercato equivalente o superiore a quella dei pochi bestseller o blockbuster, se il punto vendita o il canale di distribuzione è abbastanza grande. Negli ultimi decenni gli alti costi di gestione di magazzino e distribuzione hanno comportato un alto numero di vendite di pochi prodotti popolari, a scapito dei gusti delle minoranze e della possibilità di scelta dei clienti. Tra le grandi compagnie che applicano il principio della coda lunga nel loro modello economico si trovano eBay (aste), Yahoo! e Google (motori di ricerca), Amazon (vendita al dettaglio di libri e altro) e iTunes Store (musica e podcast), seguite da imprese minori quali Audible (audiolibri) and Netflix (videonoleggio).

[14] Vedi post su CrunchGear Google and Amazon's control of the book digitization industry: good or bad? di Nicholas Deleon del 23 febbraio 2009, <http://www.crunchgear.com/2009/02/23/google-and-amazons-control-of-the-book-digitization-industry-good-or-bad/>.

[15] Amazon caves to Authors Guild over Kindle's text-to-speech reading, <http://www.guardian.co.uk/technology/blog/2009/mar/01/authors-guild-blocks-kindle-voice>.

[16] <http://www.ceic.math.ca/WDML/dml/index.shtml>. Al riguardo si vedano i lavori dell'autrice sul sito del Centro di Ateneo per le Biblioteche <http://www.cab.unipd.it/informazioni/progetti/digital-math-library-dml-un-progetto-mondiale-per-la-matematica>.

[17] NUMDAM (Numérisation de documents anciens mathématiques), <http://www.numdam.org/>.

[18] Center for RetrospectiveDigitization Goettingen, <http://gdz.sub.unigoettingen.de/index.php?id=2&L=1>.

[19] Oxford Digital Library (ODL), servizio principale dell'Oxford University Library Services (OULS) <http://www.odl.ox.ac.uk/>.

[20] <http://gallica.bnf.fr/>; ad oggi Gallica contiene 748.000 documenti digitalizzati.

[21] <http://www.bl.uk/onlinegallery/virtualbooks/index.html>, con 30.000 documenti.

[22] <http://wess.lib.byu.edu/index.php/Digital_Texts_and_Images_GSW#Digitized_Books_.26_Manuscripts>.

[23] Per il nostro paese si veda il portale MICHAEL, che censisce oltre 1800 collezioni digitalizzate in Italia <http://michael-culture.it/mpf/pub-it/index.html>.

[24] Kalev Leetaru, Mass book digitization: the deeper story of Google Books and the Open Content Alliance, "First Monday", 13 (2008), 10,

<http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/viewArticle/2101/2037>.

[25] <http://mathbooks.library.cornell.edu/about.php>.

[26] <http://www.googlebooksettlement.com/r/view_settlement_agreement>.

[27] <http://www.googlebooksettlement.com/intl/it/Final-Notice-of-Class-Action-Settlement.pdf>.

[28] Per esempio nella prima pagina la "notifica" riporta erroneamente che "esistono due sottoclassi: la "Sottoclasse degli Autori" (autori di Libri ed altri scritti, i loro eredi, successori e aventi causa, e tutti gli altri membri della Classe della Transazione che non sono parte di "la Sottoclasse degli Autori") e - la "Sottoclasse degli Autori" (compagnie che pubblicano Libri e periodici ed i loro successori e aventi causa). E' evidente che si tratta nel secondo caso della Sottoclasse degli Editori.

[29] <http://books.google.it/booksrightsholders/>.

[30] <http://books.google.it/booksrightsholders/>.

[31] L'accordo definisce come inserti: (1) pre/postfazioni, saggi, poesie, racconti, lettere, testi di canzoni; (2) illustrazioni di libri per l'infanzia; (3) spartiti musicali; (4) tavole, tabelle, grafici. NO: fotografie, illustrazioni non per l'infanzia, mappe, dipinti.

[32] Il Research Corpus è l'insieme di tutte le copie digitali connesse al Google Library Project. La sua creazione è stata prevista allo scopo di consentire ricerche non di consultazione.

[33] Ricerche che comportano analisi computazionali sui libri, senza che sia necessario per il ricercatore leggere o prendere visione di parti consistenti per comprendere il contenuto intellettuale di un'opera (ad es.: analisi d'immagine, analisi testuale, analisi linguistica, etc.).

[34] Il Security Standard è un documento previsto dall'accordo che regolamenta in modo piuttosto rigoroso le obbligazioni di sicurezza che le Biblioteche Partner sono tenute ad attuare per evitare effrazioni intenzionali o accidentali della propria LDC, e relative sanzioni in caso di negligenza.

[35] <http://booksearch.blogspot.com/2007/01/books-mapped.html>.

[36] <http://booksearch.blogspot.com/2007/08/book-lovers-view-of-world.html>.

[37] Esempio di output per la seguente stringa di ricerca "You gain strength, courage and confidence by every experience in which you really stop to look fear in the face. You are able to say to yourself, I have lived through this horror. I can take the next thing that comes along" <http://books.google.com/books?id=-6qA0bGjja8C&qtid=767e78db>.

[38] <http://www.librarything.it/>.

[39] <http://www.anobii.com/>.

[40] Dopo questa data, le richieste di rimozione saranno elaborate solo se Google non ha ancora digitalizzato il Libro alla data della richiesta.

[41] Per vedere la nota legale sui diritti si prenda un testo in Google Libri di pubblico dominio, per esempio un'edizione dei Promessi Sposi e si effettui il download.

[42] Per una storia ed genesi dei progetti di digitalizzazione si veda Gino Roncaglia, I progetti internazionali di digitalizzazione bibliotecaria: un panorama in evoluzione, <http://dspace.unitus.it/handle/2067/67>.

[43] A chi fosse interessato ad un approfondimento legale consiglio il blog di Lessig <http://www.lessig.org/blog/2008/10/on_the_google_book_search_agre.html>.

[44] <http://www.arl.org/pp/ppcopyright/google/index.shtml>. Di questa guida è stata fatta una traduzione in italiano; chi fosse interessato può contattare l'autrice del presente articolo.

[45] A p. 17 dell'accordo è prevista la costituzione di un Research Corpus.

[46] Al riguardo si veda il blog di Peter Suber, con alcune osservazioni contrastanti sull'argomento. <http://www.earlham.edu/~peters/fos/2008/11/more-on-google-settlement_06.html>.

[47] Esempio del testo "la Madre" <http://www.sardegnadigitallibrary.it/index.php?xsl=626&s=17&v=9&c=4463&id=137609>.

[48] L'art. 71-ter della Legge 633/1941 sostiene che "è libera la comunicazione o la messa a disposizione destinata a singoli individui, a scopo di ricerca o di attività privata di studio, su terminali aventi tale unica funzione situati nei locali delle biblioteche accessibili al pubblico, degli istituti di istruzione, nei musei e negli archivi, limitatamente alle opere o ad altri materiali contenuti nelle loro collezioni e non soggetti a vincoli derivanti da atti di cessione o da licenza".

[49] Direttore della Harvard University Library.

[50] Robert Darnton, Google & the future of books, 56 (2009), 2, <http://www.nybooks.com/articles/22281>.

1. Introduzione