Convegno “Biblioteche per il Welfare digitale”

Biblioteche digitali e collaborazione pubblico/privato.

Intorno alla tesi 25 del “Nuovo Manifesto per le Biblioteche Digitali” dell’AIB

Giulio Blasi^[1]

Raccolgo qui alcune riflessioni veloci sul tema delle partnership pubblico/privato a partire dalla tesi 25 del “Nuovo manifesto sulle biblioteche digitali” dell’AIB (d’ora in poi Manifesto), una tesi che invita a favorire la collaborazione tra soggetti pubblici e privati laddove esse si configurino “come la migliore soluzione per il perseguimento di finalità pubbliche e la gestione di beni comuni”. Per comodità di chi legge la riporto qui di seguito per esteso.

Tesi 25. Gli accordi di collaborazione pubblico-privato sono da favorire qualora si configurino come la migliore soluzione per il perseguimento di finalità pubbliche e la gestione di beni comuni

Le biblioteche digitali necessitano di risorse umane (know-how e digital skills), economiche e strumentali (tecnologie hardware e software) che non sempre sono nella disponibilità delle istituzioni pubbliche o che non conviene implementare e gestire esclusivamente in ambito pubblico. È possibile, quando non addirittura auspicabile, in tali casi, definire accordi pubblico-privato, anche a scopo di lucro per una o entrambe le parti, fermi restando come obiettivi principali il perseguimento di finalità pubbliche e il soddisfacimento degli interessi di comunità. Il preminente interesse pubblico deve essere sancito anche a livello di accordi formali o contrattuali, in particolare in relazione alle licenze di uso delle soluzioni software e dei dati, e alla proprietà dei dati stessi. A titolo esemplificativo, i partenariati possono riguardare: progetti di digitalizzazione massiva (Google Project Books o Proquest “Early European Books”), gestione del prestito digitale, (Indaco, MLOL, Torrossa, EBSCO…), conservazione di lungo periodo (Internet Archive), gestione e valorizzazione dei dati e delle collezioni (Wikimedia), infrastrutture e servizi cloud.

Biblioteche e tecnologie per l’information management: una nota storica

La prima riflessione è di carattere storico ma riesco qui a segnalare in modo telegrafico solo pochissime tappe e i contorni generalissimi del problema, peraltro ben studiato nell’ambito della letteratura amplissima riconducibile al campo multidisciplinare della information history^[2]. Me ne scuso in anticipo.

L’esigenza espressa dalla tesi 25 del Manifesto ricalca un modello di collaborazione che è stato proprio del mondo bibliotecario a partire dal XIX secolo per tutto ciò che attiene allo sviluppo di tecnologie per il trattamento dell’informazione e alla loro applicazione nel mondo bibliotecario.

Tradizionalmente le biblioteche hanno scelto di essere utilizzatrici e non creatrici di tecnologie. Nonostante le notevoli ma rarissime eccezioni – tutte collocate non casualmente negli USA – le biblioteche hanno demandato al settore privato l’investimento in ricerca e sviluppo sulle tecnologie per il trattamento dell’informazione. Sviluppare in proprio tecnologie richiederebbe competenze, strutture organizzative, dinamiche di management, modelli economici, totalmente estranei (oggi e in passato) al mondo bibliotecario.

Spesso si fraintende la competenza bibliografica normativa dei bibliotecari con la competenza nella gestione dei dati, come se le biblioteche fossero nativamente pronte al mondo della gestione dei big data che caratterizza il contesto attuale. Ma si tratta di un fraintendimento. I dati bibliografici (i metadati) di per sé nulla dicono sulle tecnologie di trattamento e uso dei dati stessi. Si sente spesso ripetere che gli algoritmi di Google sarebbero figli di pratiche bibliotecarie. In realtà il riferimento alla bibliometria implicito in queste affermazioni (peraltro fortemente semplicistiche perché gli algoritmi di Google vanno ben oltre l’ambito bibliometrico) è fuorviante anche perché gran parte dell’infrastruttura bibliometrica è stata originariamente creata e gestita da soggetti privati: valga per tutti il riferimento all’ISI di Garfield (1960) e al suo passaggio successivo a Thomson (1992) e allo spin off di Clarivate Analytics (2016). Il trattamento dei dati realizzato da imprese come Google ha che fare col mondo tecnologico dell’intelligenza artificiale, del machine learning, tematiche che non hanno mai neanche sfiorato l’ambito delle competenze focali degli studenti di biblioteconomia. Un conto è farsi domande generali sull’uso dell’intelligenza artificiale in biblioteca un conto è saper distinguere – ad esempio – tra un algoritmo k-nn e una rete neurale e comprenderne le potenzialità per l’analisi di dati del settore bibliotecario.

Ma si tratta come dicevo di una derivazione storica di lunga data. Se pensiamo alle grandi tappe del rapporto tra biblioteche e tecnologie dell’informazione, vediamo come sin dai tempi del Library Bureau di Melvil Dewey e dei suoi accordi con l’azienda di Hollerith per la distribuzione di tabulatori, il mondo delle biblioteche abbia demandato al settore privato il lavoro di ricerca e sviluppo. L’azienda di Dewey conduce – attraverso una sequenza di mergers and acquisitions – alla nascita della grande industria di elaborazione dati a partire dagli anni ’30 (Remington Rand, Sperry Rand, Unisys) come ha precisamente ricostruito Markus Krajevski nel 2011^[3].

L’entrata delle schede perforate in biblioteca a partire dagli anni ’30 (che è un preludio alla nascita del trattamento informatico dei processi bibliotecari con computer digitali a partire dagli anni ’60), vede le biblioteche come utilizzatrici di tecnologie sistematicamente create, sviluppate e adattate al mercato bibliotecario da parte di contractor privati^[4].

I grandi processi di riproduzione fotografica dei documenti attraverso microfilm (a partire dagli anni ’30) nascono egualmente da tecnologie e processi acquistati dalle biblioteche da contractor esterni che ne hanno adattato le caratteristiche al settore.^[5]

La stessa informatizzazione delle biblioteche a partire dagli anni ’60 può difficilmente essere pensata come un processo di trasformazione tutto interno al mondo bibliotecario. Se pensiamo alla relazione tra la IBM e l’origine dei progetti di automazione della Library of Congress e la nascita dell’ “Information Systems Office”^[6]; se pensiamo a figure come Kilgour (che fonda un’azienda no-profit come OCLC) o al tessuto di relazioni che fa da sfondo al Libraries of the Future di Licklider negli anni ’60^[7], direi che si tratta in gran parte di un processo nel quale lo sviluppo delle tecnologie di base è stato affidato a società private (profit/no-profit) o ad organizzazioni che per semplicità denominerò del “complesso militare-industriale” tipico del secondo dopoguerra negli USA e in ogni caso esterne al mondo bibliotecario tradizionale che si è invece concentrato sullo sviluppo di standard di settore e sull’adattamento delle tecnologie alle specificità delle organizzazioni bibliotecarie.^[8] Com’è noto, in seguito, la Library of Congress avrebbe organizzato un proprio dipartimento in house che includeva funzioni di sviluppo software autonomo con oltre 250 sistemi sviluppati in circa 50 anni di attività^[9]. L’esempio della Library of Congress non ha tuttavia – per scala ed estensione – che pochissimi esempi simili negli USA e nel mondo.

In tempi più recenti, gli stessi standard bibliotecari sono spesso una derivazione diretta di processi tecnologici globali: si pensi all’uso dei Linked Open Data, la cui logica proviene dal lavoro del W3C sul web semantico degli anni ’90. L’uso dei LOD – e in generale del web semantico – da parte delle biblioteche è un processo di adattamento allo sviluppo del web, non certo qualcosa che proattivamente sia emerso dal mondo bibliotecario. Il web semantico è il web in generale, non certo solo il web delle biblioteche.

Quanto avvenuto nei decenni successivi conferma e amplifica questo trend ed è dunque molto poco stupefacente l’affermazione di Palfrey, nel 2015, a conclusione del suo Bibliotech:

Il timore maggiore che ho sul futuro delle biblioteche ‒ e qui condivido il pensiero di Johnson ‒ è che nel settore commerciale stanno lavorando più velocemente e in modo più efficiente per risolvere molti di questi stessi problemi, solo che la loro motivazione è il profitto, non l’interesse pubblico. E in questo mettono molti più capitali e talenti.

In questo momento, potrei scommettere che saranno più facilmente i programmatori e i grafici di Amazon, Apple e Google a immaginare la prossima grande novità nella gestione dell’informazione e della conoscenza, piuttosto che la comunità bibliotecaria. Anche se ci sono stati e ci sono tuttora pionieri ispiratori nel settore no-profit (mi vengono in mente Brewster Kahle di Internet Archive, Carl Malamud di public.resource.org, Sue Gardner e Jimmy Wales alla Wikimedia Foundation, Mitchell Baker e il suo staff a Mozilla, e Aaron Swartz nell’ultimo periodo della sua vita), in molti casi questi non vengono considerati e talvolta non sono neppure benvoluti nel settore delle biblioteche, da un punto di vista sia amatoriale sia professionale. Esistono teorici fantastici e tipi dinamici che sognano il futuro delle biblioteche. Dan Cohen, Robert Berring, Robert Darnton, Lorcan Dempsey, Peter Morville, Jenny Levine, Peter Suber, David Weinberger, Jessamyn West e moltissimi altri, troppi per elencarli qui, che hanno scritto saggi notevoli sulle biblioteche, sul loro futuro e su come prendere la via dell’innovazione. Per quanto valide siano le idee di questi leader, il settore privato commerciale ha molte più risorse a supporto delle loro idee di innovazione rispetto a quello delle biblioteche. Il divario è enorme nel settore della ricerca e sviluppo fra le biblioteche e altri soggetti che vogliono risolvere gli stessi problemi.^[10]

Nulla impedisce (de jure e de facto) che le biblioteche realizzino investimenti per acquisire internamente competenze tecnologiche in grado di produrre ricerca e sviluppo autonome, ma non è questo ciò che è accaduto nel mondo delle biblioteche nel periodo tra Dewey e oggi.

La tesi 25 è dunque secondo me importante non tanto perché suggerisce la necessità di partnership pubblico/privato – che come si è visto, seppur brevemente, sono storicamente strutturali al rapporto tra biblioteche e tecnologie – ma perché invita a una logica di selezione delle partnership sulla base delle finalità pubbliche delle biblioteche. Questo apre un tema che oggi si declina, dal mio punto di vista, soprattutto sulla base dell’idea di “capitalismo della sorveglianza”. È la logica di appropriazione e sfruttamento dei dati degli utenti – ben descritta da Shoshana Zuboff^[11] e da molti altri studiosi – a delimitare oggi il confine tra finalità pubbliche e non.

Il GDPR europeo è senz’altro un passo importante nella limitazione dello strapotere sui dati delle multinazionali digitali, ma le biblioteche devono fare un passo più in là del puro rispetto della privacy degli utenti: devono impedire che i dati bibliotecari degli utenti diventino oggetto di un monopolio commerciale di pochi operatori. Ciò è possibile attraverso strategie di chiusura e protezione severe o al contrario attraverso politiche radicali di apertura (open data della PA) che garantiscano parità di accesso ai dati per tutti gli operatori sotto il cappello di una licenza unificata definita dal soggetto pubblico. Ma tornerò su questo più avanti.

Dalle biblioteche digitali alla Digital Transformation delle biblioteche: ambiti di collaborazione tra pubblico e privato

“Digitale” vuol dire però troppe cose diverse ed è necessario intendersi. Dal mio punto di vista sono quattro gli ambiti che definiscono la “digitalità” di una biblioteca o di un sistema bibliotecario^[12]:

il modo di gestire le risorse digitali (ebook, audiolibri, periodici, ecc.)
il modo di gestire i dati transazionali (non solo i metadati) delle biblioteche
il grado di digitalizzazione nella gestione dei processi bibliotecari di base (dalla catalogazione al CRM)
il grado di digitalizzazione nella gestione della comunicazione esterna e interna della biblioteca

Questo ci consente di superare il concetto estremamente ambiguo di “biblioteca digitale” sul quale c’è poco accordo nella letteratura corrente: c’è ancora oggi chi pubblica libri sulle biblioteche digitali senza dedicare una riga alla gestione delle risorse digitali in print e alle problematiche di gestione dei diritti connesse, come se le biblioteche digitali fossero solo quelle che raccolgono le collezioni digitalizzate delle biblioteche di conservazione e degli archivi. È necessaria invece una teorizzazione che colga il tessuto di problemi comuni a istituzioni diversissime come la biblioteca pubblica di ente locale, la biblioteca accademica, la biblioteca scolastica, la biblioteca di conservazione.

Se dunque usiamo questa articolazione di ambiti del digitale (risorse, dati, processi, comunicazione) emergono anche quattro possibili e diverse aree di cooperazione tra soggetti pubblici e privati.

Ognuno di questi ambiti delimita un’area di attività e processi che sono specificamente pubblici, specificamente privati o passibili di una gestione attraverso partnership negoziate.

Pensiamo all’ambito più ovvio, quello delle risorse, dei contenuti e pensiamo in particolare ai libri e ai contenuti editoriali testuali in generale. In questo ambito le partnership in atto e possibili riguardano sostanzialmente la gestione dei servizi di e-lending (per i contenuti in print) e di controlled digital lending (per i contenuti out of print eventualmente digitalizzati in proprio dalla biblioteca, servizio poco attivo in Italia mentre negli USA è svolto in modo sistematico da Internet Archive, non senza controversie di carattere legale).

Ma anche la digitalizzazione di materiali antichi o out of print può essere oggetto di partnership importanti. Non tanto sul processo di digitalizzazione stesso, la cui gestibilità interna da parte delle biblioteca dipende da fattori di scala e capacità di aggiornamento tecnologico nel tempo, ma sui servizi che possono essere collegati alla risorse digitali stesse. Sto pensando in particolare al nuovo standard IIIF il cui merito cruciale consiste non tanto nell’apertura implicita dei contenuti, nella standardizzazione, nell’interoperabilità, nella gestione dell’alta definizione – cose ovviamente tutte decisive – ma soprattutto nell’idea che la risorsa digitalizzata è agganciata a servizi digitali che a partire dalla risorsa medesima possono essere sviluppati: annotazioni, trascrizioni, tagging, strumenti per la creazione di narrazioni, crowdsourcing di metadati e altri UGC, ecc. sono tutti esempi di come l’idea del catalogo statico di risorse in esposizione per il pubblico debba essere superato con l’idea di un catalogo che costituisce il punto di accesso ai servizi.

I servizi digitali tuttavia – al contrario di quanto accade alle semplici collezioni – sono soggetti alla cosiddetta legge di Metcalfe: il loro valore è proporzionale al numero degli utenti che li usano. Ed è qui che servizi molto usati dagli utenti finali possono entrare in gioco. Penso inevitabilmente, data la mia affiliazione, al milione e mezzo di utenti registrati a MLOL in Italia, e al fatto che da dicembre scorso la piattaforma offre una infrastruttura IIIF gratuita per tutte le biblioteche aderenti^[13].

Ho usato sopra il termine big data a proposito delle biblioteche. E’ molto importante capire però che non sto qui parlando di metadati (la cui quantità – a confronto con i numeri del vero settore dei big data – è in realtà piuttosto modesta). I big data che potenzialmente le biblioteche potrebbero raccogliere sono dati transazionali che oggi neanche vengono gestiti in modo sistematico: prestiti analogici e digitali (e per ogni prestito i dati collegati), reference, accessi fisici e digitali, prenotazioni, uso del catalogo (termini di ricerca, schede consultate, ecc), uso del CRM, uso dei canali sociali, ecc.

Ho sostenuto in più occasioni che la partnership pubblico/privato sui dati transazionali degli utenti delle biblioteche potrebbere diventare un vero e proprio nuovo ambito di lavoro nel settore bibliotecario. Penso che ci siano diverse possibili interpretazioni del modo in cui una simile collaborazione possa essere sviluppata. Una possibilità – secondo me limitativa – è l’idea di avere open data con licenze totalmente libere, CC0 o pubblico dominio. È naturalmente una strada che si può percorrere a patto che i dati degli utenti siano anonimizzati e dunque in definitiva non utilizzabili (dalle biblioteche e da altri soggetti) per interagire con gli utenti. Ma è proprio in questa interazione con gli utenti però il valore essenziale dei big data e di tutte le strategie data driven: rinunciarvi significherebbe, per le biblioteche, rinunciare in blocco a un’arma competitiva essenziale nella dialettica tra servizi commerciali e servizi pubblici di accesso all’informazione. Si tratta allora secondo me – proprio partendo dai risultati delle analisi critiche à la Zuboff – di identificare strategie di uso dei big data in biblioteca alternative alla logica di profilazione a scopo pubblicitario dei grandi operatori sul mercato. In questo ambito le biblioteche sono secondo me costrette a sviluppare partnership tecnologiche strette con il mondo della ricerca e con il mondo delle imprese che si occupano di big data in modo compatibile con i vincoli imposti dal servizio pubblico.

L’ambito della comunicazione digitale e dei processi è forse quello più sfuggente e che spesso viene dato per già risolto dai bibliotecari: non abbiamo infatti già migliaia di profili social delle biblioteche e non facciamo catalogazione con strumenti informatici ormai da decenni? Non abbiamo dunque già digitalizzato processi e comunicazione delle biblioteche? Temo che la risposta sia radicalmente negativa. Il livello di digitalizzazione oggi proposto è completamente atomizzato e artigianale, corrisponde al livello di digitalizzazione del singolo individuo ma non certo al livello di integrazione sistemica che è richiesto al funzionamento di una organizzazione che abbia realmente effettuato un processo di digital transformation. CRM (quando esiste), mailing diretto, messaggistica di sistema del gestionale (analogico e digitale), profili social, comunicazione interna, sistemi di acquisizione, ecc. sono tutti elementi atomici privi di integrazione reciproca. Vediamo qui una vera e propria carenza di elaborazione che è tanto del mondo bibliotecario e biblioteconomico tanto dell’offerta tecnologica del settore privato. Troviamo qui di nuovo, a mio parere, un ambito promettente di collaborazione.

Un appello per accordi pubblico/privato sulla digital transformation delle biblioteche

In conclusione, ho suggerito qui alcuni esempi di ambiti di cooperazione tra imprese private, organizzazioni no-profit e istituzioni bibliotecarie entro il perimetro di servizio pubblico delineato dalla Tesi 25 del Manifesto. Il messaggio che mi preme lanciare è che se le “biblioteche digitali sono biblioteche” (Tesi 4 del Manifesto), oggi vale anche il reciproco: “le biblioteche sono (dovrebbero essere) digitali”. Le biblioteche dovrebbero cioè avere intrapreso un processo di trasformazione digitale, un processo di integrazione delle tecnologie digitali che non si limiti all’uso atomizzato dei singoli strumenti ma che tenti un approccio sistemico basato sui dati. Se siamo d’accordo su questo, è forse allora venuto il momento di associare a un manifesto – tipico dello stato nascente dei processi – un appello per accordi pubblico/privato rivolti alla digital transformation.

^[1] GIULIO BLASI, CEO Horizons Unlimited SpA (MLOL), blasi@horizons.it

^[2] Per una ricognizione recente di questo campo di studi v. Ann Blair, Paul Duguid, Anja-Silvia Goeing, and Anthony Grafton (eds.), Information: A Historical Companion. Princeton University Press, 2021.

^[3] Krajewski, Markus, Paper Machines. About Cards & Catalogs, 1548-1929. The MIT Press, 2011, p. 105.

^[4] Black, A., Muddiman, D., Plant H., The Early Information Society. London: Routledge, 2007, p. 18. Si veda anche Parker, Ralph H., Library Applications of Punched Cards: a Description of Mechanical Systems. American Library Association, 1952.

^[5] v. ad es. nell’amplissima letteratura Black, A., ” Mechanization in libraries and information retrieval: punched cards and microfilm before the widespread adoption of computer technology in libraries “. Library History, Vol. 23, December 2007.

^[6] Si veda ad esempio King, Gilbert William, Automation and the Library of Congress. Washington: Library of Congress, 1963. Il libro contiene un’analisi dettagliatissima del processo organizzativo e del business plan per la realizzazione del progetto da cui emerge chiaramente il ruolo di IBM come soggetto propulsore per lo sviluppo del sowftare e dell’hardware.

^[7] Licklider, Joseph, Libraries of the Future. The MIT Press, 1965.

^[8] v. ad esempio: Kilgour, F. G. (1970). History of Library Computerization. Information Technology and Libraries, 3(3), 218-229. <https://doi.org/10.6017/ital.v3i3.5256>. Per Kilgour il primo esperimento di “library computerization” fu realizzato da Harley E. Tillitt negli anni ’50 nella biblioteca di una stazione della marina americana. Tillitt usava le idee di “coordinate indexing” inventate da Mortimer Taube negli anni ’50. Taube era originariamente un bibliotecario ma fondò poi una sua azienda, la Documentation Inc. Tillitt a sua volta proviene dal mondo dell’IBM Computation Forum, cui partecipò almeno nel 1948, v. <http://www.columbia.edu/cu/computinghistory/ibm-1948.html>.

^[9] v. E. Allen, “A Half Century of Library Computing”, 15 gennaio 2014 <https://blogs.loc.gov/loc/2014/01/a-half-century-of-library-computing/>.

^[10] v. Palfrey, John, BiblioTECH. Why Libraries Matter More Than Ever in the Age of Google. Basic Books, 2015 (ed. italiana: BiblioTech. Perché le biblioteche sono importanti più che mai nell’era di Google. Milano: Editrice Bibliografica, 2015, cap. 10).

^[11] Zuboff, Shoshana, The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. PublicAffairs, 2019.

^[12] v. anche su questa quadripartizione il mio articolo ” DIGITAL TRANSFORMATION. Le biblioteche digitali conquistano gli italiani durante il lockdown: cosa offrono e cosa manca ancora”, in Agendadigitale.eu, 23 ottobre 2020. <https://bit.ly/3cTLa9H>

^[13] G. Blasi, “IIIF e il cambio di paradigma nello sviluppo di biblioteche digitali”, 29 giugno 2020 <https://bit.ly/2NDhxRp>.