[AIB-WEB] Associazione italiana biblioteche. 51. Congresso
AIB-WEB | 51. Congresso AIB | Bibliocom 2004 | Principi di catalogazione internazionali

51. Congresso nazionale AIB

AIB2004

Giovedì 28 ottobre 2004
ore 9,00-13,30
Roma EUR, Palazzo dei congressi
Sala Esquilino


Principi di catalogazione internazionali: una piattaforma europea?
Considerazioni sull'IME ICC di Francoforte e Buenos Aires


Alberto Cheti
Il punto di vista del GRIS sulla "relazione di soggetto" in FRBR

Premessa

Questo contributo tocca, schematicamente, senza l'approfondimento che meriterebbero, tre aspetti della catalogazione semantica, analizzati in FRBR secondo il modello entità-relazioni:

  1. la "relazione di soggetto";
  2. la nozione di "concetto" e la categorizzazione delle entità coinvolte nella relazione di soggetto;
  3. il ruolo e l'importanza che attributi e relazioni svolgono in riferimento alle esigenze dell'utenze.
Tuttavia, il punto centrale, come indicato dal titolo, è costituito dalla "relazione di soggetto". La sua definizione, infatti, rappresenta uno snodo, che si collega da una parte con le necessità dell'utente, dall'altro con l'organizzazione concettuale del catalogo, ossia con la strutturazione dei dati relativi al soggetto dei documenti (entità, attributi e relazioni), permettendo di verificare se questa organizzazione sia effettivamente utile all'utente.
Queste riflessioni e osservazioni hanno preso avvio, in particolare, da alcune domande specifiche scaturite dalla lettura di FRBR. A quale titolo, ossia in virtù di quale connessione logica, un concetto, oggetto, evento, luogo può costituire il soggetto di un'opera? Le cosiddette "entità del gruppo 3", oltre a quelle del primo e secondo gruppo, con i loro attributi, sono adeguate ad identificare un soggetto? E' corretta la definizione di concetto come "nozione astratta", distinta da quelle di oggetto, evento, luogo? Quali attributi e relazioni sono essenziali per garantire un efficace ed efficiente accesso per soggetto?
Nel titolo di questo intervento si fa riferimento al "punto di vista" del GRIS, ossia, in primo luogo, alla prospettiva che muove dal linguaggio elaborato nella Guida all'indicizzazione per soggetto 1 e applicato recentemente al progetto del nuovo Soggettario italiano 2; in secondo luogo, al contributo dato dal GRIS all'approfondimento della nozione di "soggetto", delle condizioni di pertinenza di un documento ad un soggetto e dei processi logici che sottostanno all'operazione di analisi concettuale dei documenti.
Questo intervento, che fa seguito a quello tenuto da Raffaella Gaddoni e Federica Paradisi nella scorsa edizione di Bibliocom 3, testimonia anche l'impegno del GRIS per lo sviluppo di FRBR relativamente ai "soggetti". Va detto, inoltre, che le proposte avanzate qui sono molto vicine a quelle già formulate da Pino Buizza e Mauro Guerrini in precedenti occasioni, a partire dal loro contributo al Seminario internazionale sul rinnovamento del Soggettario tenutosi a Firenze nell'aprile 2001 4.

La relazione di soggetto

La norma ISO 5963 definisce così il soggetto: "ogni concetto o combinazione di concetti che rappresentino un tema all'interno di un documento". A partire da questa definizione, nella sua semplicità, è possibile chiarire la relazione di soggetto, ossia la connessione logica tra l'entità semantica (un concetto o un insieme di concetti legati tra loro) identificata dall'indicizzatore seguendo le procedure di analisi del documento e il contenuto concettuale del documento stesso. Un concetto (o, nella formulazione di FRBR, un concetto, oggetto, evento, luogo ecc.), da solo o in combinazione con altri concetti, può costituire il soggetto del documento in quanto ne rappresenta un tema, ossia in quanto è individuato come un elemento necessario per la descrizione del tema.
In effetti, la selezione dei concetti, in ISO 5963, è guidata da un criterio principale: il giudizio sulla potenzialità e sul ruolo di un concetto nell'espressione del soggetto del documento, quindi di un tema in esso trattato. Quali temi e, dunque, quali concetti? Lo Standard non pone limitazioni, se non le "presunte necessità degli utenti". Tuttavia, - recita la norma - se fosse necessario limitare il numero dei termini da assegnare al documento, il criterio suddetto dovrebbe applicarsi al "soggetto complessivo" del documento, ossia al suo tema di base, facendo cadere la scelta prioritariamente su quei concetti che hanno una potenzialità e un ruolo nell'espressione del tema di base del documento. Dunque, non un "limite arbitrario", ma una selezione che tenga conto dell'"insieme delle informazioni contenute nel documento", della sua organizzazione tematica che è, come si dirà più avanti, un'organizzazione gerarchica.
La nozione di tema dovrebbe così articolarsi in due nozioni: quella di tema di base 5 e quella di tema particolare, quest'ultimo riconducibile al primo nell'ambito di quelle relazioni logiche (come scopo, strumento, conseguenza, parte, specie ecc.) e retoriche (come premessa, sviluppo e conclusione), che caratterizzano i discorsi 6. Possiamo parafrasare la definizione di soggetto data sopra in questi termini: il soggetto è costituito da ogni concetto o combinazione di concetti impiegati per esprimere il tema di base del documento o un suo tema particolare considerato potenzialmente utile per l'utente.
In che senso la nozione di tema chiarisce la relazione di soggetto? Si possono indicare almeno quattro aspetti:

  1. tema come topic: è ciò intorno a cui qualcosa è detto (ciò di cui si parla), in contrapposizione al "rema" (comment), ossia a ciò che si dice riguardo al tema;
  2. tema come dato: è ciò che si presuppone sia conosciuto (informazione nota), in contrapposizione al nuovo (informazione nuova), ossia a ciò che si presuppone non sia conosciuto;
  3. tema come macrostruttura: è un livello più globale di descrizione semantica, esprimendo il significato complessivo di un testo o di una parte di esso (il livello più alto è rappresentato dal tema di base);
  4. tema come criterio logico: alla nozione di tema sono sottesi due criteri, quello dell'implicazione (un tema generale è implicato nell'insieme dei temi particolari da cui è ricavato) e quello della coerenza (ciascun tema particolare deve essere coerente rispetto al tema generale al quale è riconducibile).
I primi due aspetti definiscono il soggetto nel contesto dei processi di comunicazione: il soggetto è ciò di cui tratta un documento (topic), che rappresenta per l'utente un'informazione nota (dato), a partire dalla quale egli cerca nuove informazioni (nuovo), che il documento può fornirgli mediante lo sviluppo del tema (comment). Dunque, quando assimiliamo la nozione di soggetto a quella di tema intendiamo dire, prima di tutto, che il soggetto appartiene a ciò che è noto all'utente, ossia alle conoscenze da lui possedute e, al tempo stesso, che il soggetto esprime il suo bisogno conoscitivo e, dunque, la chiave di accesso idonea per il recupero dei documenti. La selezione dei concetti da parte dell'indicizzatore, che non tenga conto di questa dinamica comunicativa, rischia di compromettere l'incontro tra lettori e documenti o, come si dice in gergo, il grado ottimale di richiamo e precisione nel recupero.
I secondi due aspetti definiscono il soggetto nel contesto dell'organizzazione concettuale del documento, rappresentabile come una struttura semantica composta di livelli connessi gerarchicamente: ad ogni livello corrisponde un tema che ne esprime il significato globale (macrostruttura), fino al livello più alto, identificato con il tema di base. Il tema di base comprende, sussume i temi particolari da cui è ricavato, è implicato nel loro insieme (implicazione); al tempo stesso, ogni tema particolare deve "soddisfare", direttamente o indirettamente, il tema di base, essere coerente rispetto ad esso (coerenza). Dunque, quando assimiliamo la nozione di soggetto a quella di tema intendiamo dire anche che il soggetto ha una connessione con il contenuto concettuale del documento in quanto ne esprime il significato globale; al tempo stesso che tale significato è ottenuto mediante un processo di sommarizzazione o di riduzione dell'informazione (dai temi particolari al tema generale), cui corrisponderà nella mente dell'utente il processo opposto, di espansione dell'informazione (dal tema generale ai temi particolari).
Queste argomentazioni in favore della nozione di tema mirano unicamente a sostenerne la candidatura come entità che sta, legittimamente e in posizione paritetica, nella relazione di soggetto con l'opera: esso è, infatti, l'oggetto primario di interesse nella ricerca per soggetto dei documenti, esprimendo da un lato il bisogno conoscitivo dell'utente, dall'altro il potenziale informativo del documento. Opera e tema, del resto, si richiamano vicendevolmente: un'opera ha uno o più temi di cui tratta, un tema è tale in quanto trattato in una o più opere. Il concetto, invece, si rapporta al tema come elemento componente.
Dunque, le "entità del terzo gruppo" in FRBR dovrebbero comprendere un'entità primaria (tema), legata all'opera dalla relazione "è il soggetto di", e entità secondarie (concetto, oggetto, evento, luogo), legate al tema dalla relazione "è costituente di".
La relazione di soggetto mostrata nella Fig. 1 potrebbe essere riformulata secondo lo schema indicato nella Fig. 2.

[Figura 1]

[Figura 2]

La relazione di soggetto tra l'opera e il tema nella Fig. 2 dovrebbe essere letta in questi termini: un'opera ha come soggetto un tema, che può essere identificato come il suo tema di base (il tema complessivo o centrale) o come un suo tema particolare; il tema è costituito da una o più entità che servono a descriverlo (concetto, oggetto, evento, luogo, opera, espressione ecc.); ciascuna delle suddette entità è un costituente (componente) del tema. Dunque, il tema e la relazione di soggetto potrebbero essere definiti in questi termini:

  1. tema: argomento o oggetto di studio trattato in un'opera, costituito da un concetto o da una combinazione di concetti, che ne esprime complessivamente (tema di base) o parzialmente (tema particolare) il contenuto (il significato);
  2. relazione di soggetto: relazione tra l'opera e il suo tema di base o un suo tema particolare potenzialmente utile per l'utente, selezionato dall'indicizzatore e rappresentato nel catalogo nelle forme proprie del linguaggio di indicizzazione.
Si tratta di definizioni così ampie da valere per tutte le forme di indicizzazione (precoordinata o postcoordinata) e per qualsiasi politica di indicizzazione (sommaria o esaustiva); al tempo stesso, sufficientemente precise da potervi ricondurre concettualmente ciascuna forma o politica di indicizzazione. In altre parole, la nozione di tema è, per così dire, "neutra" rispetto ai diversi modelli di sommarizzazione e di rappresentazione del contenuto adottati dalle biblioteche. Qualsiasi concetto selezionato, da solo o in combinazione con altri concetti, è sempre espressione di un tema, sia esso il tema di base o altro tema avente una specifica funzione testuale, come premessa, problema, soluzione ecc. Né questa condizione può essere modificata dalla decisione di assegnare al documento il termine che identifica il concetto come chiave di ricerca indipendente o come componente di una stringa precoordinata.
C'è un'altra argomentazione. Se non facessimo intervenire la nozione di tema, avremmo nel catalogo un attributo, la stringa di soggetto, di cui non sapremmo dire a quale entità si riferisca. Infatti, la stringa di soggetto, costituita da un termine o da una sequenza ordinata di termini, è la rappresentazione di un soggetto, ossia l'elemento che ha la funzione di descriverlo con precisione (in modo specifico e coesteso). Da essa si distingue il termine di indicizzazione, che è la rappresentazione di un concetto. Termini e stringhe danno luogo ad una duplice organizzazione dei dati semantici nel catalogo, basata sulla distinzione e sulla complementarità tra relazioni semantiche e relazioni sintattiche. Sul piano logico, potremmo argomentare questa distinzione tra stringhe di soggetto e termini di indicizzazione con una duplice affermazione: non tutti i soggetti sono (rappresentati da) un (solo) termine; non tutti i termini sono (rappresentativi di) un soggetto. Con la prima affermazione ci si riferisce ai soggetti composti da più di un concetto, espressi da una sequenza ordinata di termini; con la seconda, a quei termini presenti nel vocabolario che non sono impiegati nella descrizione dei soggetti, ma che hanno solo una funzione strutturale.
In conclusione, sono presenti nei cataloghi due elementi distinti (termini e stringhe), che fanno riferimento ad altrettante entità (concetti e temi), con funzioni diverse nella rappresentazione e nella ricerca dei soggetti.

Il "concetto" e le entità del gruppo 3

La nozione di concetto è normalmente associata ad altre nozioni quali significato, definizione, classe di oggetti, insieme di attributi o caratteristiche definienti ecc. Inoltre, i concetti possono riferirsi a oggetti concreti (p.e., tavolo), astrazioni (p.e., amore) o entità complesse costituite da oggetti concreti e astrazioni (p.e., scuola). Dunque, appare limitativa la definizione di concetto presente in FRBR: "una nozione astratta o un'idea", distinta da "una cosa materiale". L'astrazione è sì una caratteristica essenziale del concetto, ma non dei suoi referenti.
Nel linguaggio tecnico dell'indicizzazione, poi, i concetti individuano le unità di base del linguaggio, la cui combinazione sul piano sintattico dà luogo alla formulazione dei soggetti. "Nell'ambito degli studi sull'indicizzazione è però ormai invalsa un'accezione più tecnica del vocabolo, intendendosi propriamente per "concetto" un'unità di pensiero che sia esprimibile con un unico termine. Ne consegue che il soggetto di un documento coincide con un concetto solo quando un singolo termine risulti atto a circoscrivere esattamente l'area concettuale e di conoscenza individuata dal soggetto, corrispondendo il soggetto in tutti gli altri casi ad un insieme di concetti" 7.
Nella norma ISO 2788 si avverte che "termine" e "concetto" sono utilizzati spesso in modo intercambiabile. I concetti, inoltre, sono riconducibili a "categorie generali" o "tipi concettuali", quali entità concrete (oggetti e materiali), entità astratte (azioni, proprietà, discipline, unità di misura) e entità individuali.
Anche nella "Guida GRIS" la nozione di concetto ha un'applicabilità generale ed è collegata al principio della definizione tipica, in base al quale "l'appartenenza categoriale di un concetto è determinata in base alle caratteristiche o attributi essenziali presenti nella sua definizione, che hanno la funzione di riferire il concetto ad una categoria indipendente dal contesto, valida cioè in ciascuno dei differenti ambiti nei quali il concetto può comparire" 8. Inoltre, vi è proposto un elenco esemplificativo di categorie generali, quali agenti (organismi, persone e gruppi, organizzazioni), attività (azioni, avvenimenti, processi, discipline), strumenti (oggetti e attrezzature, strutture, forme, credenze e sistemi ideologici), proprietà, materiali, spazio, tempo.
Queste categorizzazioni mostrano, da un lato, che i tipi concettuali, ai fini dell'indicizzazione, sono molto più articolati di quelli indicati da FRBR, dall'altro, che la nozione di concetto ha un uso generale, non limitato ad alcune particolari categorie. Le categorie, infatti, rappresentano uno strumento di analisi dei concetti, utile per il controllo della morfologia dei termini e per la loro strutturazione nel vocabolario.
In Principles underlying subject heading languages si individua nel vocabolario controllato "of terms representing concepts and named entities" una delle componenti del linguaggio di indicizzazione 9.
In conclusione, la nozione di concetto è associata nei linguaggi di indicizzazione a due aspetti essenziali:

  1. i concetti sono gli elementi componenti di un soggetto e i termini che li rappresentano sono le unità di base del linguaggio di indicizzazione;
  2. tra i concetti esiste una molteplicità di relazioni, riconducibili a due tipi essenziali: le relazioni sintattiche e le relazioni semantiche, che corrispondono ai due piani del linguaggio di indicizzazione.
Si propone, dunque, di considerare, all'interno del modello FRBR, il concetto come un componente del soggetto (oltre alle entità che identificano una creazione intellettuale e i loro autori), esemplificando i tipi concettuali ai quali i concetti sono riconducibili e rinviando per la loro formalizzazione ai linguaggi di indicizzazione, come rappresentato nella Fig. 3.

[Figura 3]

In alternativa, si potrebbe adottare un approccio dualistico alle unità di base del linguaggio di indicizzazione, distinguendole in concetti/termini e entità individuali/nomi propri, sulla base della diversa funzione svolta dal nome proprio, rispetto ai termini che rappresentano concetti, che è quella di indicare con una designazione chiara un'entità individuale, senza necessariamente dover specificare alcuna caratteristica dell'entità denominata. A questa ipotesi, sulla quale si discute da tempo nel GRIS, si oppone la considerazione che anche il nome proprio è un'espressione dotata di significato, capace cioè di supportare tutti i sensi dell'entità individuale denominata, oltre a riferirsi direttamente ad essa, e soprattutto la constatazione che, nell'ambito della catalogazione semantica, il nome proprio entra nella formulazione delle stringhe di soggetto e può essere sottoposto a processi di categorizzazione, come qualsiasi altro nome.
Osserva Patrick Le Boeuf a proposito dei rapporti tra FRBR e ISBD: "In realtà, FRBR ha una portata più ampia e raggiunge un livello più alto di astrazione analitica delle ISBD; per questo riterrei che la terminologia FRBR non dovrebbe essere semplicemente incorporata tale e quale alle ISBD e alle regole di catalogazione, bensì che le ISBD e le regole di catalogazione dovrebbero mantenere la loro propria terminologia e dare delle definizioni esatte che mostrino come ciascun termine di questa loro terminologia possa essere ricondotto concettualmente alla terminologia FRBR. Nella misura in cui ciascuna terminologia avesse necessariamente un'estensione più limitata rispetto a quella di FRBR, ciascun termine potrebbe essere considerato come una sottoclasse di una data classe del modello FRBR ..." 10.
Se estendiamo questa osservazione ai linguaggi di indicizzazione, appare evidente e indispensabile ridefinire le entità semantiche alla luce di una nozione di concetto più coerente con la loro struttura e più appropriata al livello di astrazione di FRBR.

Gli elementi del catalogo: attributi, relazioni e loro funzioni

Alle due entità, i concetti e i temi, corrispondono nel catalogo due elementi (attributi), i termini e le stringhe, che servono a identificarle. Una relazione primaria, la relazione di soggetto, lega l'opera al tema. Si possono individuare, poi, altri due tipi di relazioni di fondamentale importanza: la relazione unità/parte, che lega i concetti al tema di cui sono i costituenti, e le relazioni semantiche che legano i concetti tra loro. Un'altra relazione stabilita nei cataloghi è quella tra un concetto e l'opera in cui è trattato significativamente.
Quali funzioni svolgono questi attributi e relazioni? In che misura concorrono alla ricerca, all'identificazione e alla selezione delle entità che rappresentano gli oggetti di interesse dell'utente?
La Fig. 5 mostra la correlazione di ciascun attributo e relazione alle funzioni utente che essi soddisfano ed è preceduta dalla definizioni delle principali funzioni utente nella ricerca per soggetto (Fig. 4).

[Figura 4]

Si noti che le funzioni identificare e selezionare hanno come oggetto il soggetto e non l'opera, poiché gli elementi descrittivi del soggetto dovrebbero essere esaminati dall'utente prima che i documenti siano recuperati, in modo che egli possa verificare se e quali temi descritti nel catalogo corrispondano alle sue esigenze.

[Figura 5]

[Figura 5 continuazione]

Si noti che le due relazioni, quella tra un concetto e il tema di cui fa parte e quella tra il tema e l'opera di cui è il soggetto, configurano la ricerca, nei sistemi precoordinati, essenzialmente come una "ricerca a due stadi", nella quale dai termini si accede alle stringhe, che fanno da "ponte", da "filtro" tra i singoli concetti e il contenuto concettuale dei documenti, di cui le stringhe sono espressione. Inoltre, poiché il legame tra concetto e tema permette di trovare tutti i soggetti che hanno in comune un determinato concetto, l'utente è messo in condizioni di selezionare, in un insieme di soggetti, quello più appropriato alle sue necessità.


Note

1 GRIS - Gruppo di ricerca sull'indicizzazione per soggetto, Guida all'indicizzazione per soggetto. Roma, Associazione italiana biblioteche, 1996 (rist. con correzioni 2001).
2 Il progetto è stato promosso dalla Biblioteca nazionale centrale di Firenze. I risultati dello studio sono stati pubblicati in Per un nuovo Soggettario. Studio di fattibilità sul rinnovamento del Soggettario per i cataloghi delle biblioteche italiane, commissionato dalla BNCF alla Ifnet Firenze, realizzato dal Gruppo di progetto per il rinnovamento del Soggettario. Milano, Editrice Bibliografica, 2002.
3 R. Gaddoni, F. Paradisi, GRIS e modello FRBR, relazione tenuta al convegno su "L'indicizzazione per soggetto nell'epoca del rifacimento del Soggettario", 50° Congresso nazionale AIB, 30 ottobre 2003 (dattiloscritto).
4 P. Buizza, M. Guerrini, Un modello concettuale per il nuovo Soggettario: l'indicizzazione per soggetto alla luce di FRBR. "Bollettino AIB", vol. 41, n. 3 (2001), p. 327-336; P. Buizza, Indicizzazione per soggetto e FRBR. "Bibliotime" vol. 6, n. 1 (2003), http://www.spbo.unibo.it/bibliotime/num-vi-1.
5 Questa nozione, adottata nella "Guida GRIS", è illustrata da S. Tartaglia, Per una definizione di "soggetto", in Il linguaggio della biblioteca. Scritti in onore di Diego Maltese, a cura di Mauro Guerrini. Milano, Editrice Bibliografica, 1996, p. 856-867.
6 La nozione di tema particolare è riferita alla struttura interna del testo di un documento: è il tema di una sua parte, connesso con il tema di base all'interno dell'organizzazione tematica del testo. Ma è anche riferita a particolari necessità degli utenti o a particolari usi del documento. In altre parole, la rilevanza di un tema particolare, ai fini dell'indicizzazione, non dipende necessariamente da criteri intratestuali, ossia dalla sua importanza nello sviluppo del tema complessivo, ma può dipendere anche da criteri extratestuali, ossia dalla sua importanza nel contesto di determinati scopi informativi. Per esempio, una parte di un testo può non essere significativa rispetto al suo tema centrale, poiché non ne rappresenta né una premessa né una conclusione, né fornisce argomenti neppure marginalmente collegati al tema centrale; tuttavia può essere significativa nel contesto di altre opere dell'autore o delle conoscenze su un determinato soggetto (B. Frohomann, Rules of indexing: a critique of mentalism in information retrieval theory. "The Journal of Documentation", 46 (1990), n. 2). O, per dirla con Fairthorne, "le parti di un documento non sempre riguardano ciò di cui tratta l'intero documento" (R.A. Fairthorne, Content analysis, specification, and control. "Annual Review of Information Science and Technology", 4 (1969), p. 79). Sembra, dunque, che la nozione di tema, nella sua articolazione in tema di base/tema particolare, possa soddisfare, in termini generali e neutrali, quella duplice valenza della nozione di soggetto che caratterizza molte delle sue definizioni. Da una parte, il soggetto è definito in relazione alle proprietà del documento, dall'altra alle esigenze dell'utente, come mostrano, per esempio, le seguenti coppie di concetti, ciascuna delle quali dà conto di questo duplice significato: extensional aboutness/intensional aboutness (R.A. Fairthorne), aboutness/meaning (C. Beghtol), presupposed knowledge/summary (W.J. Hutchins), content-oriented/user oriented (need oriented) indexing (B. Hiørland).
7 S. Tartaglia, Per una definizione di "soggetto", cit., p. 864.
8 GRIS - Gruppo di ricerca sull'indicizzazione per soggetto, Guida all'indicizzazione per soggetto, cit., p. 62-63.
9 Principles underlying subject heading languages. (SHLs), edit by Maria Inês Lopes and Julianne Beall. München, Saur, 1999.
10 P. Le Boeuf, FRBR: un p'tit coin d'paradigme... Pubblicato su Worldwide Web a http://www.de/news/pdf/papers_leboeuf_f.pdf, p. 5.


Copyright AIB 2005-02, ultimo aggiornamento 2005-03-02 a cura di Gabriele Mazzitelli
URL: http://www.aib.it/aib/congr/c51/chetint.htm

AIB-WEB | 51. Congresso AIB | Bibliocom 2004 | Principi di catalogazione internazionali