La breve nota che segue ha come origine il mio intervento come coordinatore alla tavola rotonda Cataloghi, OPAC e utenti: interazioni nel mondo del Web [<http://biblioteca.fondazionesancarlo.it/fsc/Viewer?cmd=attivitadettaglio&id=2846>], e le considerazioni qui sviluppate tengono anche conto del contributo dei relatori.
Un paio di anni fa un dibattito in rete sul tema della funzionalità degli OPAC, partito su canali tradizionali (la lista NGC4Lib [<http://dewey.library.nd.edu/mailing-lists/ngc4lib/>]), è arrivato anche su You Tube con il video
Il mio interesse in questo momento va verso la prima ipotesi. La seconda posizione potrebbe naturalmente trovarmi d'accordo, anche se a volte mi sfuggono i contorni di quello che si ritiene "cosa seria". Ad esempio mettersi a discutere sull'uso delle parentesi quadre all'interno del record bibliografico, forse non ha poi priorità così alte per le effettive funzionalità di ricerca.
Ovviamente il ridicolo del rossetto sulle labbra del maiale deve essere tenuto sempre presente, ma questo non ci deve impedire di prendere decisioni per migliorare oggi i nostri OPAC. Anzi, le riflessioni sul futuro del record bibliografico potrebbero trarre vantaggio dalla sperimentazione di nuove funzionalità di ricerca.
Tra tutte le novità che oggi gli OPAC offrono, le tre che seguono meritano qualche riflessione:
1) il raggruppamento dinamico dei risultati;
2) i suggerimenti in merito ai termini digitati per la ricerca (es. "Forse cercavi:");
3) l'ordinamento dei risultati basato sulla "rilevanza".
Raggruppamenti dinamici
Con la prima funzionalità il risultato di una ricerca (ad esempio una ricerca per parola chiave con molti risultati) viene presentato sia come lista breve, sia raggruppato a partire dagli elementi (campi) che compongono il record bibliografico: ogni campo - o combinazione di campi - diventa così un punto di vista dal quale eventualmente partire per sfruttare meglio e progressivamente i risultati di una ricerca.
Si parla in questo caso anche di faceted browsing [<http://roytennant.com/column/?fetch=data/17.xml>], dove il punto di vista è anche un aspetto o facet, ma è evidente che non si sta parlando di un'applicazione della faceted classification di Ranganathan. In qualche OPAC il punto di vista è chiamato anche (più prosaicamente) filtro. Gli informatici parlano di dynamic taxonomy oltre che di faceted search [<http://www.di.unito.it/~sacco/papers/sacco-sigir2006.pdf>]. Si potrebbe così parlare di raggruppamento dinamico dei risultati, dove la parola raggruppamento fa riferimento al collocating objective del catalogo [E. Svenonius, The intellectual foundation of information organisation, Cambridge, MIT Press, 2000, p. 16].
Questa funzionalità può essere usata sia da chi non ha ancora definito i contorni dell'insieme di risorse che sta cercando, sia da chi vuol farsi un'idea delle possibilità del catalogo: i raggruppamenti dinamici che vengono prospettati possono aiutare meglio a precisare (a filtrare) una ricerca.
Il più famoso esempio è l'OPAC delle biblioteche della North Carolina State University (NCSU) [<http://www.lib.ncsu.edu/catalog/>], dove viene accettata anche una ricerca senza parametri che ha come risultato tutti i record del catalogo raggruppati secondo una molteplicità di punti di vista.
L'altro esempio che va ricordato per la ragguardevole estensione della sua copertura è Worldcat [<http://www.worldcat.org/>] che - come l'OPAC NCSU - presenta i raggruppamenti dinamici in una colonna di sinistra intitolata "Refine your search:".
I raggruppamenti dinamici sono oggi resi possibili dai nuovi motori di ricerca. NCSU usa la tecnologia proprietaria Endeca, ma sono già disponibili motori open source. Il più noto è Solr basato su Lucene [<http://lucene.apache.org/solr/>], usato ad esempio nelle pagine online di annunci economici di La repubblica [<http://annunci.repubblica.it/>] e in qualche OPAC sperimentale [<http://research.library.villanova.edu/>]. Ovviamente i raggruppamenti non fanno miracoli e non cambiano né la qualità (o la quantità) dei campi presenti nel record bibliografico, né il suo modello concettuale. Tuttavia l'utente web, che - secondo statistiche fornite da Google - nel 98% dei casi non fa uso della ricerca avanzata, potrebbe essere aiutato in un percorso di scoperta del funzionamento del catalogo (ad esempio scoperta di canali specifici) proprio grazie alla offerta di raggruppamenti dinamici.
Suggerimenti
Il "Forse cercavi:" di Google è una funzionalità alla quale siamo ormai abituati. E' indubbiamente più raro vederla in un OPAC. Ancora una volta è d'obbligo citare l'OPAC NCSU (si può provare una ricerca per "Hilman" per ottenere la risposta "Also searched for: hillman"), ma recentemente la stessa funzionalità si può trovare anche nell'OPAC delll'Università Cattolica [<http://millennium.unicatt.it/>] dove, a fronte di una ricerca per "hilman", si ottiene anche il suggerimento "Forse cercavi: Hillman".
Naturalmente l'OPAC suggerisce, l'utente decide e il suggerimento non deve essere invadente (e soprattutto non deve modificare la ricerca senza informare l'utente). Come nel campo del controllo ortografico automatico offerto da molti programmi di scrittura, può naturalmente capitare che i suggerimenti a volte non siano appropriati, ma nessuno mette per questo in discussione la funzionalità nel suo complesso [è molto famosa l'esilarante Ode al correttore ortografico: <http://www.geocities.com/tthor.geo/spellchecker.html>].
La funzionalità del suggerimento nello stile del "Forse cercavi:" potrebbe essere applicata anche nel contesto di una ricerca per argomento per presentare all'utente le relazioni tra termini pertinenti al contesto della ricerca e basate su un vocabolario controllato. E' quanto suggerivo nella giornata di presentazione del Nuovo Soggettario [<http://eprints.rclis.org/archive/00010854/>], ma non mi risulta vi siano oggi applicazioni convincenti in questo campo. L'alternativa a questa funzionalità è rendere consultabile come strumento a se stante il vocabolario controllato in uso, ma è altamente improbabile che questa opportunità venga sfruttata dalla maggioranza degli utenti.
Ordinamento per rilevanza
Incomincia a farsi strada anche negli OPAC l'ordinamento per dei risultati basato sulla "rilevanza". Si tratta della modalità di presentazione dei risultati (il "relevance ranking") tipica della ricerca web che viene adattata al contesto della ricerca bibliografica. Senza entrare nella complessa letteratura sull'argomento a partire dal famoso articolo dei fondatori di Google [The anatomy of a large-scale hypertextual web search engine, <http://infolab.stanford.edu/~backrub/google.html>], nel quale l'algoritmo viene chiamato "Page Rank", si può dire in generale che la presentazione dei risultati per "rilevanza" in un OPAC ha il significato di ordinare i record a seconda del punteggio che lo stesso record ottiene sulla base del "peso" o "rilevanza" che la stringa di ricerca ha al suo interno.
Lo scenario è sempre quello, oggi molto comune, di una ricerca per parola chiave con molti risultati. Non vi sono implementazioni standardizzate per stabilire il "peso" di un record in relazione a una determinata ricerca. Si può tuttavia qui ricordare senza entrare in tecnicismi alcuni criteri generalmente usati (anche in combinazione):
- il criterio del dove la stringa di ricerca viene trovata (ad esempio viene stabilita una gerarchia di campi, in cui si attribuisce al record che ospita la stringa il punteggio più alto se la stringa viene trovata nel titolo proprio e il punteggio più basso se la stessa stringa di ricerca è presente nelle note);
- il criterio del come la stringa di ricerca viene trovata (ad esempio il punteggio attribuito al record varia se la stringa di ricerca viene trovata tutta come "frase" in un campo o se le parti che compongono la stringa di ricerca si trovano su campi separati dello stesso record);
- il rapporto tra le parole della stringa e loro frequenza in tutto il catalogo: ai record contenenti parole meno frequenti viene assegnato un punteggio più elevato;
- criteri di importanza "oggettiva" del record (ad esempio in un catalogo collettivo un record potrebbe avere un punteggio in proporzione al numero delle biblioteche che possiedono la risorsa descritta).
Anche in questo caso l'offerta di un OPAC dovrebbe essere "trasparente": i criteri usati per stabilire la rilevanza di un record dovrebbero essere disponibili nelle pagine di aiuto. Molto chiara è ad esempio la presentazione dell'algoritmo di rilevanza dell'OPAC delle biblioteche dell'Università Cattolica [<http://millennium.unicatt.it/screens/help_index_ita.html>], mentre la presentazione offerta dall'OPAC sperimentale australiano [<http://ll01.nla.gov.au/>] è anche ricca di dettagli tecnici [<http://ll01.nla.gov.au/docs/LuceneRRNotes.html>]. In ogni caso è sempre opportuno offrire all'utente anche la possibilità di ordinare i risultati con presentazioni più tradizionali (ad esempio per autore, per titolo, per data decrescente, etc.).
Non ci sono conclusioni a questa nota se non l'invito a continuare la discussione e a sperimentare. Un tentativo in questa direzione si può vedere anche nell'OPAC della Biblioteca Nazionale Centrale di Firenze [<http://opac.bncf.firenze.sbn.it/opac>].
Per chi vuole approfondire l'argomento (e contribuire), questo wiki [<http://futurelib.pbwiki.com/Examples>] curato da Karen Coyle offre una interessante lista di OPAC con nuove funzionalità sotto il paragrafo Examples of Possible Next Generation Catalogs.
Giovanni Bergamin, Associazione Italiana Biblioteche - Gruppo Biblioteche Digitali, e-mail: giovanni.bergamin@bncf.firenze.sbn.it
* Questo articolo riprende il testo della relazione tenuta in occasione del Seminario " Il catalogo oggi: le norme catalografiche fra consolidamento e fluidità", Modena, 13 dicembre 2007.