La misurazione dell'uso delle risorse elettroniche tra crisi economica e comportamenti degli utenti nel contesto 'Big Deal': un contributo italiano al Congresso IFLA 2010
L'ambiente digitale ha reso possibile un salto di qualità nella misurazione dell'uso delle risorse bibliografiche grazie alla disponibilità di grandi quantità di dati statistici e gestionali: dati statistici d'uso provenienti da diverse fonti (proxy server, link resolver, portali di accesso alle risorse, editori), dati economici riguardanti il costo e le tipologie dei contratti, dati sulla valutazione qualitativa da parte degli utenti (questionari, sondaggi, poll) e dati demografici sugli utenti provenienti dalle anagrafiche.
Come possono essere combinati tra loro questi dati per costruire un set di strumenti utili nelle fasi decisionali dello sviluppo delle collezioni digitali? Il problema è all'ordine del giorno in tempi di forte crisi economica, anzi è forse il problema principale che si pone chi deve rispondere dei bilanci e della gestione di biblioteche digitali, soprattutto se di grosse dimensioni.
Chi scrive ha presentato alla conferenza "Measuring usage and understanding users! E-resources statistics and what they teach us", organizzata dall'IFLA come evento satellite del LXXVI Congresso mondiale [1], un case study avente come oggetto la Biblioteca Digitale dell'Università degli Studi di Milano, che costituisce un esempio significativo nel suo genere, essendo dotata di una collezione di circa 9.000 riviste elettroniche, centinaia di banche dati e altre risorse e di un bacino di utenza dell'ordine di 70.000 unità.
Nel 2009, per iniziativa del Sistema Bibliotecario di Ateneo, si è costituito un gruppo di lavoro formato da tecnici e bibliotecari, finalizzato all'analisi del contratto per l'accesso online alle riviste Wiley-Blackwell, prossimo alla scadenza. La domanda se sia possibile trovare correlazioni significative tra i dati menzionati all'inizio è stata uno dei principali stimoli di riflessione del gruppo, che si è posto l'obiettivo di creare un metodo di valutazione applicabile ai pacchetti di riviste elettroniche acquistati con modello Big Deal. Questi pacchetti rappresentano una componente molto significativa della Biblioteca Digitale sia in termini di costi, che assorbono una porzione sempre maggiore del bilancio, sia in termini di contenuti, visto che i quattro contratti di questo tipo sottoscritti dall'Ateneo, da soli, riguardano la maggior parte delle riviste accessibili dalla Biblioteca Digitale.
L'idea di partenza era di "smontare" il complesso meccanismo rappresentato dal modello commerciale del Big Deal, isolarne le componenti, quantificarle e analizzare le relazioni fra di esse, per identificare i punti di forza e di debolezza del contratto specifico. L'analisi della collezione Wiley-Blackwell, inoltre, sarebbe stata l'occasione per testare un set sperimentale di test statistici per la valutazione dei pacchetti che fosse sufficientemente stabile e leggero da poter essere usato per una misurazione costante della collezione digitale, del suo interesse da parte degli utenti, dell'ottimizzazione degli investimenti.
I dati su cui si è deciso di condurre l'analisi sono le statistiche d'uso COUNTER (JR1) fornite dall'editore [2] per il 2008 [3], integrate nel sistema informativo locale con dati economici (prezzi di listino, termini contrattuali) e informazioni di carattere bibliografico (titoli con ISSN, IF e indicizzati con DDC), e i dati demografici relativi agli utenti estratti dalle anagrafiche dell'Ateneo. Mancavano però completamente informazioni qualitative relative all'interesse dell'utenza rispetto alle riviste Wiley-Blackwell messe a disposizione dalla Biblioteca Digitale. Si è deciso così di avviare un sondaggio tramite il quale acquisire titolo per titolo quale fosse il livello di interesse degli utenti.
Una volta terminata la raccolta dei dati, l'analisi è stata condotta seguendo tre filoni: analisi della collezione, analisi delle statistiche d'uso - soprattutto per individuare zone critiche e "aree" di utilizzo che potessero essere interpretate tramite comportamenti degli utenti - e stesura di liste di titoli in ordine di priorità, unendo sia dati oggettivi d'uso che dati qualitativi di interesse.
Per poter analizzare le distribuzioni disciplinari degli utenti, è stata chiesta alla Divisione del Personale un'estrazione dati dall'anagrafica di Ateneo relativa al personale docente e ricercatore diviso per aree MIUR di afferenza.
Per quanto riguarda la collezione Wiley, quasi tutti i dati di interesse erano già disponibili perché archiviati nel sistema informativo della Divisione Biblioteche; si è trattato quindi di estrarli e organizzarli in una matrice che correlasse per ogni rivista titolo, ISSN, numero di download nel 2008, prezzo 2009 [4], IF (quando presente) e macroarea disciplinare (umanistica e sociale, scientifica, biomedica). Alla stessa matrice sono stati in seguito aggiunti i dati provenienti dal sondaggio presso gli utenti.
Il sondaggio è stato realizzato utilizzando una piattaforma già presente in ateneo e utilizzata dal CTU [5] nell'ambito di progetti di e-learning, che presentava due importanti caratteristiche: permettere la creazione di questionari di grandi dimensioni e consentire il collegamento fra il modulo di autenticazione e l'anagrafica di Ateneo, in modo da poter agevolmente limitare l'accesso alle sole categorie di utenti che si intendevano consultare.
L'indagine, rivolta a tutti i docenti e i ricercatori (circa 2.500 persone), grazie anche al coinvolgimento delle biblioteche e ad una comunicazione capillare e il più possibile incisiva (utilizzando la posta elettronica di Ateneo, è stato inviato a tutti un messaggio con soggetto: "Di quali riviste non puoi fare a meno?"), ha avuto un riscontro superiore alle aspettative, ottenendo il 25% di rispondenti. Il successo è tanto più significativo se si considera l'impegno richiesto per la compilazione: gli intervistati dovevano selezionare dalla lista completa dei titoli Wiley (1188 titoli, suddivisi in 3 elenchi disciplinari, resi disponibili online sotto forma di questionari web) le riviste considerate importanti, specificando per ogni titolo selezionato se era giudicato essenziale o semplicemente utile, mentre le riviste non selezionate erano automaticamente considerate non importanti.
L'iniziativa è stata intrapresa con la consapevolezza sia della qualità soggettiva della valutazione, peraltro caratteristica di un'indagine di tipo qualitativo, sia dell'intrinseca ambiguità del giudizio raccolto, in quanto nel questionario non era specificato se l'importanza di cui si chiedeva conto fosse da riferire all'effettiva attività accademica dell'utente oppure, astrattamente, alla rilevanza per il settore disciplinare dell'utente. Tuttavia il generico valore percepito intercettato con l'indagine è stato considerato un apprezzabile punto di partenza da utilizzare insieme ai dati sull'uso come misura dell'utilità, lasciando ad iniziative future la valutazione dell'impatto dei contenuti digitali. D'altra parte, il successo dell'iniziativa ha chiarito quanto fosse importante per gli utenti poter esprimere il proprio giudizio in merito allo sviluppo della collezione digitale.
In primo luogo, si è cercato di evidenziare gli aspetti descrittivi più rilevanti del pacchetto Wiley-Blackwell.
Nella Full Collection 2009 è prevalente la presenza di titoli di area biomedica, seguita a poca distanza dall'area umanistica, a cui si aggiunge una componente minore ma comunque rilevante di riviste di ambito scientifico (Figura 1).
Figura 1. Distribuzione disciplinare dei titoli presenti nella Full Collection 2009 di Wiley
Per quanto riguarda i prezzi dei titoli, ripartendoli in 4 classi si osserva che la maggior parte delle riviste si colloca in una fascia di prezzo medio-bassa (Figura 2).
Figura 2. Distribuzione dei prezzi dei titoli nella Full Collection 2009 di Wiley
A fini di benchmarking, sono stati poi calcolati i principali indicatori di performance degli e-journals: numero totale di download (intesi come successful full-text article request) per il pacchetto; numero di download per utente, costo per download e costo per utente globali e per area disciplinare dell'utenza.
Il punto focale del lavoro è rappresentato dall'analisi della distribuzione dell'uso e della distribuzione del valore percepito, ovvero dei voti ottenuti da ciascun titolo nell'ambito del sondaggio.
Ripartendo la distribuzione dell'uso in classi di centinaia (Figura 3), innanzitutto si osserva che la maggioranza dei titoli (850 circa su 1188, ovvero più del 70%) si colloca sotto la soglia dei 100 download all'anno [6].
Figura 3. Distribuzione dei titoli in classi di numero di download
In altre parole, meno del 30% della collezione è soggetta ad uso intenso e la corrispondente quantità di download rappresenta l'85% dei download totali del pacchetto. Oltre a notare che questo rapporto richiama la cosiddetta "regola 80-20" [7], è interessante aggiungere che le riviste più usate hanno prezzi medio-bassi e che si suddividono equamente fra titoli sottoscritti e non sottoscritti dall'Ateneo (con riferimento alle sottoscrizioni di abbonamenti cartacei "storici").
La distribuzione dell'uso assume un andamento a coda lunga (la long tail è rappresentata dalla classe 0-100 nel grafico in Figura 3) nella quale i download sono dispersi su un grande numero di titoli, la maggior parte dei quali non sottoscritti. Si noti che, a differenza della Long tail di Anderson [8], il numero totale di download relativo alle riviste a basso uso, sebbene significativo in termini assoluti, è ben lontano dal raggiungere il numero di download totalizzato dalle riviste ad alto uso.
La distribuzione del valore percepito assume caratteristiche simili all'uso (Figura 4), globalmente con soltanto il 35% dei titoli selezionati da più di 10 utenti.
Figura 4. Distribuzione dei titoli in classi di numero di selezioni
L'analisi è poi proseguita cercando il grado di correlazione tra le due variabili, uso e gradimento. Disegnare ciascun valore su un grafico scatter plot ha permesso di evidenziare l'addensamento dei punti (ciascuno dei quali rappresenta una coppia di valori: numero di download e numero di selezioni ottenute) vicino all'origine del grafico, che corrisponde alla regione dei bassi utilizzi uniti a basso gradimento (Figura 5).
Figura 5. Scatter-plot selezioni vs download
Un tale andamento suggerisce che vi sia correlazione tra le due variabili, e questa ipotesi trova conferma con il calcolo dell'indice di Pearson [9], che dà risultato maggiore (quindi correlazione maggiore) per i titoli con download elevati. Ciò permette di dividere la collezione in due parti, la prima, corrispondente a titoli ad uso intensivo (numero download > 100), in cui uso e valore percepito sono abbastanza ben correlati tra loro (R = 0,55), mentre l'altra, per i titoli a basso uso (numero download < 100), in cui le due grandezze sono molto poco correlate (R = 0,35).
Mettendo in rapporto download e voti, si è cercato di approntare una sorta di indicatore delle anomalie, cioè un sistema pratico per individuare i titoli che rappresentano zone critiche di utilizzo della collezione. Si tratta delle riviste per le quali il rapporto uso/valore percepito risulta nullo (riviste valutate utili o persino essenziali da almeno un utente ma mai usate) oppure infinito (presenza di download senza voti di gradimento). Tale indice è "cieco", cioè rileva l'anomalia ma non dà indicazioni sulle cause, che devono essere indagate con altri strumenti. Contando quanti valori anomali sono presenti in un determinato pacchetto e rapportandoli al numero totale dei titoli, si può costruire un "indice di anomalia" della collezione, da utilizzare nel confronto fra prodotti analoghi.
Un ulteriore strumento di valutazione è rappresentato dalle liste di titoli in ordine prioritario, dove la priorità è data da un peso che, prendendo in considerazione sia il valore percepito sia l'uso [10], rappresenti una misura indiretta di utilità. Aggiungendo i prezzi di listino, è possibile calcolare agevolmente il risparmio in relazione ad eventuali cancellazioni. La misurazione con questa tecnica ha confermato quanto ampiamente documentato in letteratura: partendo dal contesto Big Deal un risparmio effettivo è ottenibile solo rinunciando a una parte considerevole dei contenuti.
Una riflessione particolare è stata dedicata all'uso del contenuto cosiddetto nonhit, cioè delle riviste a basso uso. L'indebolimento della correlazione fra uso e valore percepito in questa area è un fenomeno di non facile interpretazione. Potrebbe essere letto, in termini di comportamenti dell'utenza, come minore consapevolezza nell'uso della risorsa, e tale componente si andrebbe ad affiancare all'uso più propriamente di nicchia, in cui l'utilità percepita corrisponde all'utilità effettiva del contenuto, come per i titoli ad alto uso.
In altre parole l'uso del nonhit content potrebbe comprendere due fenomeni diversi: da una parte un uso che corrisponde a bisogni informativi specifici, cioè quello delle riviste di nicchia in cui i bisogni informativi sono atomizzati; dall'altra parte un uso indotto dalla disponibilità stessa del contenuto digitale e che corrisponderebbe a bisogni informativi elastici [11]. Questo secondo tipo di uso potrebbe riflettere comportamenti specifici degli utenti nell'ambiente digitale e in particolare nel contesto Big Deal.
In un'ottica di ottimizzazione delle risorse, si è cercato di ipotizzare risposte specifiche ad ognuno di questi bisogni. Per l'uso di nicchia i contenuti non possono che essere acquisiti (in contratto Big Deal o attraverso altri metodi: sottoscrizione singola, pay-per-view, document delivery ecc.); nel caso dell'uso indotto dalla disponibilità delle collezioni digitali full text, le biblioteche, per assicurarsi un miglior rapporto costi/benefici, potrebbero proporre soluzioni alternative all'acquisto. Tuttavia questa articolazione rimane al momento del tutto teorica in quanto, con i dati attualmente disponibili, non è stato possibile separare i due fenomeni e compilare le corrispondenti liste di titoli.
In conclusione si ritiene che quanto fatto fino ad ora abbia fornito soltanto le prime basi per la creazione di un metodo di valutazione dei contratti Big Deal e di monitoraggio della biblioteca digitale.
In prospettiva, oltre agli spunti di approfondimento sul versante user studies offerti dalle riflessioni svolte sui comportamenti d'uso, diverse ed importanti questioni metodologiche rimangono da affrontare per migliorare e completare il lavoro svolto: l'individuazione di una modalità più diretta di rilevazione dell'utilità delle risorse; l'utilizzo di metodi efficienti per l'indagine qualitativa; la ricerca di strumenti statistici adeguati all'analisi congiunta di variabili qualitative e quantitative; l'utilizzo dell'IF nell'analisi.
Le relazioni presentate al meeting di Stoccolma saranno pubblicate a testo completo sul sito dell'IFLA (<http://www.ifla.org/>) e sul sito della conferenza (<http://www.sub.su.se/iflastatistics/start.htm>).
Tiziana Morocutti e Federica Zanardini - Università degli Studi di Milano, e-mail: tiziana.morocutti@unimi.it, federica.zanardini@unimi.it
[1] La conferenza ha avuto luogo a Stoccolma l'8 Agosto 2010.
[2] Non sono stati presi in considerazione i dati relativi agli accessi su mirror CILEA perché relativi a un sottoinsieme della collezione.
[3] I dati sull'uso nel 2009 erano ancora incompleti alla data di inizio lavori, pertanto si è deciso di utilizzare le statistiche 2008 apportando alcune correzioni in fase di validazione dei dati, ad esempio eliminando i titoli trasferiti o cessati.
[4] I prezzi utilizzati sono quelli delle versioni print & online del listino editoriale.
[5] Centro di servizio per le tecnologie e la didattica universitaria multimediale e a distanza dell'Università degli Studi di Milano.
[6] Si presuppone che l'abbonamento a una rivista di prezzo medio-basso sia economicamente conveniente rispetto ad altri metodi di acquisizione se si verificano più di 100 richieste di articoli full text all'anno. Il valore soglia "100" è anche presente nella letteratura professionale, ad esempio utilizzato da Jill Taylor-Roe (Usage statistics in an academic library: Some practical applications, 2007, <http://www.oxfordjournals.org/china/news/jilltaylor_usage_statistics.ppt>) che, trattando di indicatori di performance degli e-journal, introduce la seguente metrica: Low use (0-10 hits), Medium use (11-99 hits) and High use (>100 hits).
[7] La regola empirica di Trueswell, mutuata dal principio di Pareto, prevede che nelle collezioni cartacee il primo 20% dei documenti più richiesti generi l'80% di tutte le transazioni di circolazione.
[8] Chris Anderson, The Long Tail, "Wired Magazine", 12 (2004), 10, http://www.wired.com/wired/archive/12.10/tail.html.
[9] L'indice di correlazione di Pearson (R) è un numero adimensionale compreso tra 0 e 1 che rappresenta il grado di correlazione lineare tra due variabili: 0 corrisponde ad assenza totale di correlazione lineare, mentre 1 significa che vi è correlazione lineare perfetta.
[10] Introducendo una correzione in caso di presenza della versione cartacea.
[11] Sul concetto di "elasticità" dei bisogni informativi in ambito digitale cfr. Rickey D. Best, Is the "Big Deal" Dead?, "The Serials Librarian", 57 (2009), 4, p. 355.