«Bibliotime», anno X, numero 3 (novembre 2007)

Precedente Home Successiva



Giulia Visintin

Liste semantiche: un saggio d'indagine sulle liste di soggetti nei cataloghi *



Un aspetto dei cataloghi che non è stati preso in considerazione nei primi rilevamenti della ricerca Opac semantici [1] è l'ordinamento delle liste per mezzo delle quali si presentano le stringhe di soggetto [2]. Con questo saggio d'indagine si vuole iniziare a colmare quella lacuna, prendendo in esame l'ordine di elencazione delle stringhe di soggetto nei cataloghi che hanno ottenuto un "indice di semanticità" [3] uguale o maggiore di 30.

Campione

L'indagine di Opac semantici svolta fra 2003 e 2004 ha misurato 153 cataloghi. Ad essi si sono aggiunti nel 2006, in un supplemento d'indagine [4], 9 cataloghi di biblioteche nazionali. Su questo insieme di 162 opac la possibilità di scorrere le liste dei soggetti era stata rilevata in 124 casi (115 + 9), pari al 76,54 %.

Il campione studiato in questa ricerca comprende i cataloghi con indice di semanticità (S) maggiore o uguale a 30. Nel campione complessivo di Opac semantici si tratta di una condizione vera per 79 cataloghi (cioè il 48,76 % dei 162 totali). 11 di questi 79 cataloghi si sono rivelati tuttavia inutilizzabili ai fini dell'attuale ricerca, perché non più reperibili o non più in uso, o fusi con altri cataloghi, o sprovvisti della facoltà di scorrimento delle liste di soggetti [5].

Il campione effettivamente esaminato consiste dunque di 68 cataloghi, pari al 56,6 % del campione totale di 162 opac visto in Opac semantici (e al 54,83 % dei 124 cataloghi che offrono la possibilità di scorrimento delle liste di soggetti). La seguente tabella ne mostra la distribuzione per indice S:

54,70 *
51,80 *
46,40 *
45,30 * *
44,40 * *
44,20 *
43,90 *
43,60 *
42,50 *
42,20 * *
41,70 *
41,50 *
41,10 *
40,80 *
40,30 * *
40,00 *
39,40 * * *
39,20 * *
38,50 *
38,30 * * *
38,10 *
37,80 *
37,50 * * * * *
37,20 *
36,90 *
35,80 * *
35,60 *
35,30 *
35,00 *
34,70 * * *
34,30 *
34,20 *
33,90 *
33,60 *
33,20 *
32,80 * *
32,60 *
32,50 *
31,90 *
31,30 *
31,10 * * * * * *
30,80 *
30,60 *
30,30 *
30,00 * *.

I cataloghi sono stati consultati durante il mese di agosto 2007.

Liste

Una lista ordinata in maniera coerente assicura innanzi tutto che una ricerca vi si possa svolgere seguendo percorsi prevedibili. Prevedibili, s'intende, dal punto di vista della successione dei passi da compiere nell'uso della lista, non delle decisioni più strettamente pertinenti i risultati ottenuti, decisioni che possono appunto mutare nel corso della ricerca proprio in base alle tappe intermedie.

Una lista può dirsi ordinata in maniera efficace, inoltre, se nel servirsene non lasci spazio a dubbi sulla completezza dei risultati ottenuti. In altre parole: se non rimane un margine di incertezza, il timore di aver tralasciato o non visto qualche dato rilevante, se cioè la consultazione della lista è affidabile. Affidabile anche quando il risultato di una ricerca fosse (come è ben possibile): "in questa lista non c'è alcunché di corrispondente a quello che si sta cercando".

Liste nei cataloghi in linea

Parlando di opac, va ovviamente tenuta presente la componente informatica dei cataloghi: nel caso specifico, sarebbe assurdo attendersi che i cataloghi non sfruttassero le risorse dell'ordinamento automatico di liste voluminose.

In effetti gli elenchi prodotti grazie ai meccanismi di ordinamento automatico [6], che stabiliscono che cosa debba "venire prima" di che cosa, fra lettere dell'alfabeto, cifre, segni di punteggiatura e altri simboli, spazio bianco compreso, rappresentano lo strato più basso, quello fondamentale, delle liste offerte dai cataloghi. A questo strato è però possibile aggiungere criteri specifici per determinate categorie di punti d'accesso, che tengano conto degli elementi che le costituiscono e del significato di essi.

Un aspetto particolare delle liste, così come si trovano comunemente nei cataloghi in linea, è inoltre che esse sono visibili per piccole porzioni per volta. Anche se i dispositivi di scorrimento permettono di percorrere la lista, in avanti e all'indietro, con una certa facilità, è tuttavia meno agevole - e perlomeno più laborioso - dare una scorsa rapida a porzioni più ampie, come si può fare in uno schedario o anche meglio in un indice a stampa.

Liste di soggetti

Cenni all'ordinamento delle stringhe si possono trovare, pur se non frequentissimi, nella manualistica dedicata alla catalogazione per soggetto. Lo stesso Soggettario di Firenze presenta due sintetiche pagine di chiarimento dei criteri seguiti nell'Ordinamento delle voci a soggetto e delle suddivisioni [7]. I criteri relativi, in particolare, a quelle che allora erano chiamate suddivisioni possono ben applicarsi alle stringhe costruite sulla base del Soggettario. Alla sua "falsariga" fa esplicito riferimento anche il manuale di Revelli, con una pratica, esauriente sintesi:

Si segue l'ordinamento parola per parola all'interno della voce, tenendo conto dei gruppi di ordinamento. […] si considera la voce […], prima da sola, poi seguita da suddivisioni, poi con specificazioni tra parentesi (che indicano una nuova voce); segue una voce composta che inizia con la parola [uguale alla voce precedente]. All'interno delle singole voci l'ordinamento delle suddivisioni è alfabetico; alle voci prive di suddivisioni seguono immediatamente le qualificazioni cronologiche e poi quelle geografiche [8].

A proposito di quest'ultimo criterio, vale la pena di menzionare anche il classico manuale di Foskett. Nel suo paragrafo dedicato al Principio di inversione [9] si può trovare la più limpida spiegazione delle ragioni che consigliano di far precedere i termini dalle specificazioni cronologiche e da quelle geografiche.

Nella letteratura più recente, ad una marcata attenzione alla sintassi delle stringhe da un lato e al controllo dei termini dall'altro, non ha corrisposto altrettanta cura delle questioni relative all'ordinamento. Non fanno cenno alcuno alle questioni di ordinamento né la Guida del GRIS [10] né il recente Nuovo Soggettario [11].

Liste ordinate di soggetti

Le pur scarne prescrizioni dei manuali non sono sottoposte qui a giudizio. Ciò che si prefigge questo saggio d'indagine è semplicemente registrare le scelte compiute (o, talvolta, semplicemente non compiute) nell'organizzare stringhe e liste di soggetti.

In questa indagine sono state prese in esame alcune situazioni prodotte dall'ordinamento delle stringhe di soggetto e ne è stata registrata la presenza o l'assenza nelle liste offerte dai 68 cataloghi censiti. I casi analizzati sono:

a) l'ordinamento tiene conto - oppure no - della separazione fra un elemento e l'altro all'interno di ciascuna stringa, ovvero: sono mantenuti distinti, ed elencati separatamente, termini o nomi propri diversi con una parte iniziale in comune (per esempio un termine semplice ed uno composto che inizi con la stessa parola del primo), per esempio:

a.a)

Biblioteche - Arredamento
Biblioteche - Sicurezza
Biblioteche pubbliche
Biblioteche pubbliche - Servizi alle persone anziane

a.b)

Biblioteche - Arredamento
Biblioteche pubbliche
Biblioteche pubbliche - Servizi alle persone anziane
Biblioteche - Sicurezza

b) i nomi propri sono ordinati - oppure no - tenendo conto delle loro caratteristiche specifiche [12]; in particolare: i titoli che iniziano con un articolo sono ordinati a partire dalla prima parola seguente, per esempio:

b.a)

Levi, Lucia
Levi, Primo
Levi, Roberto
Levi Montalcini, Paola
Levi Montalcini, Rita

b.b)

Levi, Lucia
Levi Montalcini, Paola
Levi Montalcini, Rita
Levi, Primo
Levi, Roberto

c) i nomi propri geografici sono ordinati - oppure no - prima dei termini che occupano la medesima posizione in un'altra stringa, per esempio:

c.a)

Biblioteche - Albania
Biblioteche - Asia
Biblioteche - Varese
Biblioteche - Arredamento
Biblioteche - Sicurezza

c.b)

Biblioteche - Albania
Biblioteche - Arredamento
Biblioteche - Asia
Biblioteche - Sicurezza
Biblioteche - Varese

d) le specificazioni cronologiche, in qualunque forma espresse [13], sono ordinate - oppure no - prima dei termini che occupano la medesima posizione in un'altra stringa, per esempio:

d.a)

Biblioteche - Antichità
Biblioteche - Sec. XII-XV
Biblioteche - 1420-1560
Biblioteche - Albania
Biblioteche - Sicurezza

d.b)

Biblioteche - 1420-1560
Biblioteche - Albania
Biblioteche - Antichità
Biblioteche - Sec. XII-XV
Biblioteche - Sicurezza [14].

Si è cercato inoltre di rilevare tutte queste situazioni anche per termini o nomi propri in posizioni diverse dalle prime due nella stringa.

I risultati

campione di 68 cataloghi

trattamento
specifico
(a)

nessun
trattamento
specifico (b)

dato
non rilevabile

a) termini semplici e termini composti

53

15

0

b) ordinamento dei nomi propri

1

63

4

b.1) esclusione dell'articolo iniziale

8

59

1

c) nomi geografici prima dei termini

0

68

0

d) specificazioni cronologiche prima dei termini

0

68

0

 

Si possono aggiungere alcune osservazioni. La distinzione fra termini semplici e termini composti, presente in 53 cataloghi (il 77,9 % del campione) è un dato confortante, sì. Ma non corrisponde necessariamente ad una scelta consapevole e coerente. Il rilevamento eseguito sulle stringhe così come si presentano alla consultazione, infatti, non basta ad affermare che sia un criterio espressamente applicato, e non piuttosto il mero effetto dell'ordinamento meccanico eseguito dall'elaboratore. Per esempio: un diffusissimo separatore fra termini nelle stringhe di soggetto è il trattino che, in effetti, nella tabella ASCII citata precede sia le cifre sia le lettere dell'alfabeto.

Considerazione analoga va fatta per i cataloghi nei quali alcune specificazioni cronologiche (ma non tutte) precedono i termini. A "venire prima" sono infatti le date in millesimi - 1915-1918 ovvero 1961 - mentre quelle in lettere risultano ordinate insieme ai termini, come nel precedente esempio d.b. In questo caso è ancora più fondato il dubbio che non sia stato applicato nessun criterio, oltre all'ordinamento automatico: nella tabella ASCII, di nuovo, le cifre precedono le lettere dell'alfabeto.

I quindici cataloghi che non distinguono i termini composti da quelli semplici si distribuiscono peraltro al centro - non troppo in basso ma nemmeno molto in alto - nella graduatoria per S dell'intero campione.

Una sovrapposizione dei dati raccolti con l'indice S relativo ai cataloghi del campione, anzi, non dà modo di riconoscere correlazioni evidenti fra le scelte di ordinamento e il maggiore o minore indice di semanticità conseguito nella precedente indagine.

S

 

 

un catalogo

 

 

 

54,70

a.a

 

 

 

 

 

51,80

a.a

 

 

 

 

 

46,40

a.a

 

 

 

 

 

45,30

a.a

a.a

 

 

 

 

44,40

a.a

a.a

 

 

 

 

44,20

a.a

 

 

 

 

 

43,90

a.a

 

 

 

 

 

43,60

a.a

 

 

 

 

 

42,50

a.a

 

 

 

 

 

42,20

a.a

a.a

 

 

 

 

41,70

a.a

 

 

 

 

 

41,50

a.a

 

 

 

 

 

41,10

 

 

 

 

 

 

40,80

a.a

 

 

 

 

 

40,30

 

 

 

 

 

 

40,00

a.a / b.1.a

 

 

 

 

 

39,40

a.a

a.a

a.a

 

 

 

39,20

a.a

a.a

 

 

 

 

38,50

a.a

 

 

 

 

 

38,30

a.a

b.1.a

 

 

 

 

38,10

a.a

 

 

 

 

 

37,80

a.a

 

 

 

 

 

37,50

a.a / b.1.a

a.a / b.1.a

a.a

a.a

 

 

37,20

 

 

 

 

 

 

36,90

 

 

 

 

 

 

35,80

a.a

a.a

 

 

 

 

35,60

a.a

 

 

 

 

 

35,30

a.a

 

 

 

 

 

35,00

 

 

 

 

 

 

34,70

a.a

a.a

 

 

 

 

34,30

a.a

 

 

 

 

 

34,20

a.a

 

 

 

 

 

33,90

 

 

 

 

 

 

33,60

a.a

 

 

 

 

 

33,20

a.a

 

 

 

 

 

32,80

a.a

 

 

 

 

 

32,60

a.a

 

 

 

 

 

32,50

 

 

 

 

 

 

31,90

a.a

 

 

 

 

 

31,30

 

 

 

 

 

 

31,10

a.a / b.1.a

a.a / b.1.a

a.a

a.a

a.a

 

30,80

a.a / b.a / b.1.a

 

 

 

 

 

30,60

a.a

 

 

 

 

 

30,30

a.a

 

 

 

 

 

30,00

a.a

a.a / b.1.a

 

 

 

 

 

Per non concludere, nemmeno questa volta

Da questo saggio d'indagine (che, è bene ripeterlo, non intende sottolineare scelte giuste o sbagliate in fatto di ordinamento), dalla misurazione delle scelte effettivamente compiute in un campione di cataloghi italiani si spera possa venire una base concreta per una discussione - che difficilmente può dirsi prematura - delle questioni di ordinamento delle stringhe per soggetto.

Una discussione che permetta di definire criteri condivisibili - "concetti e metodi chiari, idonei ad essere insegnati e appresi" [15] - in modo da non vanificare, ed anzi sfruttare efficacemente, la significatività delle stringhe di soggetto. Stringhe prese non solo nella struttura sintattica individuale, ma considerandole - come è proprio di ogni catalogo - in relazione a quelle disposte prima e dopo di esse nella elencazione per liste.

Giulia Visintin, Firenze, e-mail: g.visintin@iol.it


Bibliografia

Note

* Ringrazio Emanuela Casson, Massimo Fedi, Claudio Gnoli, Riccardo Ridi per lo scambio di opinioni e i consigli ricevuti durante questa ricerca.

[1] OPAC semantici: indagine sugli accessi semantici nei cataloghi in rete italiani, ottobre 2003, ultimo aggiornamento 31 ott. 2007, <http://www-dimat.unipv.it/biblio/sem/>.

[2] Una ulteriore estensione della ricerca potrebbe riferirsi all'ordinamento degli equivalenti verbali dei simboli di classe, che però sono rarissimi quando non assenti nei cataloghi.

[3] L'indice di semanticità è un punteggio definito nella ricerca Opac semantici e attribuito sulla base delle caratteristiche dei cataloghi, per misurarne l'utilità nella ricerca per soggetto e per classe. Per gli elementi che concorrono a formare l'indice S, vedi <http://www-dimat.unipv.it/biblio/sem/s.txt>.

[4] Supplemento curato da Emanuela Casson: Nazionali, <http://www-dimat.unipv.it/biblio/sem/nazionali.htm>.

[5] L'elenco di nomi e indirizzi dei 79 opac esaminati è a <http://www-dimat.unipv.it/biblio/sem/liste.htm>.

[6] Componente essenziale di tali ordinamenti meccanici è il riferimento ad una tabella di precedenza fra i caratteri. Un esempio ne è la diffusissima tabella ASCII <http://www.neurophys.wisc.edu/www/comp/docs/ascii.html>.

[7] Soggettario per i cataloghi delle biblioteche italiane, a cura della Biblioteca nazionale centrale di Firenze, Firenze, Centro nazionale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, 1956, p. XXVI-XXVIII.

[8] Carlo Revelli, Il catalogo, Milano, Editrice Bibliografica, 1996, p. 332-333.

[9] Anthony C. Foskett, Il soggetto, Milano, Editrice Bibliografica, 2001, p. 197-200.

[10] Associazione italiana biblioteche. Gruppo di ricerca sull'indicizzazione per soggetto, Guida all'indicizzazione per soggetto, Roma, Associazione Italiana Biblioteche, 1996.

[11] Biblioteca nazionale centrale di Firenze, Nuovo Soggettario. Guida al sistema italiano di indicizzazione per soggetto, prototipo del Thesaurus, Milano, Editrice Bibliografica, 2006.

[12] Il riferimento principale è al concetto di gruppi di ordinamento, come presentato nell'Appendice II: Norme per l'ordinamento nel catalogo per autori, delle Regole italiane di catalogazione per autori, Roma, Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, 1979, p. 180-221. La punteggiatura prescritta per le intestazioni per autore nel Servizio Bibliotecario Nazionale ne rappresenta un'applicazione che tenga conto dell'impiego di un elaboratore (Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, Guida alla catalogazione in SBN. Pubblicazioni monografiche, pubblicazioni in serie, 2. ed., Roma, ICCU, 1995, p. 185-208).

[13] Le forme più comuni con le quali si segnalano delimitazioni cronologiche di un soggetto (o di un concetto al suo interno) sono, in cifre: 1492, 1798-1815; in lettere: Antichità, Medioevo, Rinascimento; in espressioni miste: Sec. XII, Sec. XVIII-XIX (anche nel futile calco dello stile tedesco: Sec. 12., Sec. 18.-19., i cui vantaggi per l'ordinamento devono ancora essere dimostrati), Antichità-Sec. VIII, Origini-1300.

[14] Tutti questi esempi hanno il solo scopo di chiarire i casi analizzati nell'indagine. Consultando ciascun catalogo si sono cercati i punti della lista nei quali queste situazioni potessero verificarsi. In pochi casi alcune situazioni sono risultate impossibili da trovare ed esaminare, per l'assenza di nomi propri rispondenti alle condizioni cercate.

[15] Alberto Petrucciani, Introduzione, In Associazione italiana biblioteche. Gruppo di ricerca sull'indicizzazione per soggetto, Guida all'indicizzazione per soggetto, Roma, Associazione Italiana Biblioteche, 1996, p. IX-XVI (la citazione è da p. IX).




«Bibliotime», anno X, numero 3 (novembre 2007)

Precedente Home Successiva


URL: http://static.aib.it/aib/sezioni/emr/bibtime/num-x-3/visintin.htm