AIB. Sezione Campania. Seminari
AIB-WEB | Sezioni Regionali | Campania
FACCIA A FACCIA CON L'ESPERTO
UNIMARC, un formato "universale"? / Rosa Maiello
Scopo dell'incontro
- Chiarire le caratteristiche, la funzione e le applicazioni di UNIMARC come formato standard per record catalografici
- Individuare le relazioni sussistenti tra l'evoluzione di UNIMARC e
- lo sviluppo delle tecnologie dell'informazione
- la diffusione di nuove tipologie di metadati per le ER
- la catalogazione secondo FRBR
Sommario
Struttura di UNIMARC
- formati digitali, metadati e formati strutturati
- i record bibliografici - ISO 2709 e le implementazioni MARC
- UNIMARC - analisi per blocchi funzionali
- applicazioni di UNIMARC
Storia di UNIMARC
- da molti a UNIMARC per lo scambio internazionale
- UNIMARC dallo scambio alla gestione locale
- UNIMARC dalla descrizione bibliografica alla descrizione documentale
- UNIMARC per i record di authority e di classificazione
Prospettive di UNIMARC
- UNIMARC come formato interno e come formato di esportazione
- UNIMARC e i nuovi metadati per le ER
- UNIMARC e la catalogazione secondo FRBR
- UNIMARC e il futuro dei cataloghi
Definizione
UNIMARC è un formato macchina standardizzato per lo scambio di record bibliografici
Formati macchina e metadati strutturali
- Gli oggetti digitali, come gli oggetti fisici, hanno una struttura (inizio, fine, dimensioni, forma...)
- La struttura di un documento digitale, che è incorporeo, è una struttura non fisica ma logica
- Perché un sw possa riconoscere e gestire un oggetto digitale, deve identificarne la struttura come corrispondente a una categoria astratta di strutture, o formati, ad esso noti
- Metadati: dati su altri dati, informazioni su altre informazioni
- Metadati strutturali: informazioni (al sw) sul formato di un documento
- Per uno stesso documento digitale, o record, possono coesistere più formati: quello di archiviazione, utilizzato dal software locale per gestire i dati; quello/i di presentazione, utilizzato/i dal sw per la visualizzazione del documento; quello/i di esportazione
- In regime di cooperazione, almeno il formato di esportazione deve corrispondere a uno standard condiviso e sufficientemente semplice da convertire in un formato interno
Metadati strutturali e formati strutturati
- I metadati strutturali sono coessenziali al documento
- indicano come i dati sono strutturati, disinteressandosi del contenuto
- diversamente, i metadati descrittivi specificano cosa contiene un documento, che genere di dati, e possono essere anche esterni al documento descritto
- inoltre, i metadati amministrativi, inclusi o esterni al documento, informano sulla sua origine, sul suo stato e sulle condizioni di accessibilità (chi, dove, quando...)
- se diverse tipologie di metadati, nella forma di etichette, ossia designatori di contenuto, sono integrati e compenetrati con i dati in uno stesso documento, allora si ha un formato strutturato, ossia complesso
- vi sono differenti livelli di analiticità nei formati strutturati
- Quanto più analitico è un formato strutturato, tanto maggiori saranno gli indici che se ne potranno ricavare e tanto maggiore la precisione delle risposte che otterremo in sede di ricerca e recupero
Oggetti digitali a formato molto strutturato:
I record bibliografici
- I formati usati per documenti come i record bibliografici, finalizzati dall'origine alla costituzione di banche dati, sono tra i più analitici esistenti
- La tendenza finora è stata ad accrescere l'analiticità dei formati bibliografici,
- sia mediante una forte segmentazione (in "campi" e "sottocampi") dell'informazione registrata
- sia introducendo nuovi designatori di contenuto (nuovi campi e sottocampi) per disambiguare i dati e per fornire informazioni ulteriori
- sia infine arrivando a scomporre l'informazione in più record distinti, ciascuno finalizzato a descrivere una determinata "entità"
I record bibliografici dall'ISBD al MARC
- L'ISBD, la sua articolazione in aree ordinate, la sua sintassi fondata su una certa punteggiatura era nato non solo come sistema di regole, ma soprattutto come possibile formato macchina di scambio
- Questa seconda funzione dell'ISBD è stata ampiamente assorbita e superata dal MARC, e in particolare dall'UNIMARC, per la sua maggiore analiticità
la "matrice" del MARC: ISO 2709
- ISO 2709 è la norma dettata dall'International Organization for Standardization per la standardizzazione del formato di scambio su nastro magnetico dei record bibliografici (19731, 19812, 19963)
- è uno standard-matrice, poiché imposta unicamente la struttura astratta del formato e lascia alle agenzie bibliografiche il compito di "completarlo", definendo specifici metadati descrittivi, conformi ai codici catalografici
Cosa prescrive ISO 2709
Un record è ISO 2709 se consiste di:
- Un'etichetta del record (leader) di 24 caratteri che riporti informazioni essenziali sul record
- Una directory, ossia, un indice che riporti: i tag dei campi di dati, tag che devono essere a 3 cifre; la lunghezza di ogni campo espressa in 4 cifre; la posizione di partenza di ogni campo espressa in 5 cifre
- I campi di dati, ovvero gli indicatori (2 car.), gli identificatori di sottocampo (1 car.), i codici di sottocampo (1 car.) e i dati veri e propri (max 9999 car. per campo e 99999 car. per rec), separati l'uno dall'altro da un codice di separazione
- Un field terminator, codice di 1 car., che indica la fine del record
ISO 2709, complesso e lineare
Per quanto appaia (e sia) complesso, un record ISO 2709 è comunque un file lineare di testo, ciò che ne favorisce (o ne dovrebbe favorire) esportazione e scambio tra basi di dati gestite con sw diversi.
A condizione, ovviamente, che il sw di destinazione ri-conosca il "linguaggio" ISO 2709 e la particolare implementazione MARC utilizzata.
Layout di un record ISO 2709 (nell'implementazione UNIMARC)
00515nam0 2200193 450
00100110000000500170001102000160002810000410004410100080008510200070009310500180010020000
5700118210004200175215002200217610001200239676001400251700003300265801002300298-
SBL0134014-19950410173226.9- aITb63-9231- a19950410d1963 |||||ita|01 ba-| aita- aIT- a|||| |||||-1 aMetodo Chestecorso completo di mnemotecnica pratica-fJacques Abeel aRomacIstituto psicologico modernod1963.- a5 v.cill.d21 cm-0 aMemoria- a154.1-v16- 1aAbeel,bJacques3SBLV080556- 0aITbBNCFc19950410-
Layout dello stesso record in formato RICA/ISBD
Abeel, Jacques
Metodo Chest : corso completo di mnemotecnica pratica. - Roma : Istituto psicologico moderno, 1963. - 5 v. : ill. ; 21 cm. - (Memoria)
154.1
L'implementazione UNIMARC
UNIMARC è
- Conforme a ISO 2709
- Conforme alle ISBD
- Flessibile rispetto a livelli di analiticità differenziati
- Ridondante (sono previsti campi e modalità diversi per una stessa tipologia di informazione)
- Ospitale rispetto a diverse tradizioni descrittive
- Enumerativo (non estensibile oltre il livello dei sottocampi)
- Gerarchico (campi e sotto-campi)
UNIMARC, analisi del formato
Il Leader
- Il Leader, "Etichetta del record", è una stringa di 24 caratteri contenenti informazioni generali sul record espresse in codice
- Ogni informazione occupa una posizione fissa all'interno della stringa
- Il fatto di essere fornita in codice e di occupare sempre una determinata posizione, rende o dovrebbe rendere l'informazione più facilmente individuabile dai sw
- Alcune informazioni sono richieste da ISO 2709, altre dall'implementazione UNIMARC
UNIMARC, analisi del formato
Metadati Strutturali, Descrittivi e Amministrativi nel Leader
pos. 0-4: Lunghezza del record (max. 99.999 car.) | S |
pos. 5: Stato del record | A |
pos. 6: Tipo di documento descritto (descr. gen. materiale) | D |
pos. 7: Livello bibliografico | D |
pos. 8: Livello gerarchico (rispetto ad altro record) | SD |
pos. 9: non definita | |
pos. 10: Lunghezza degli indicatori | S |
pos. 11: Lunghezza degli identificatori di sottocampo | S |
pos. 12-16: Posizione del carattere iniziale del primo campo | S |
pos. 17: Livello di codifica (conformità a UNIMARC) | S |
pos. 18: Tipo di catalogazione (conformità a ISBD) | D |
pos. 20-22: Struttura della directory | S |
pos. 23: non definita | |
UNIMARC, analisi del formato
I campi di dati
- I campi di dati riportano i dati, ossia l'informazione bibliografica
- All'interno di un campo, i dati sono generalmente articolati ulteriormente in sottocampi e possono essere introdotti da due indicatori, se definiti, che ne specificano il contenuto o il trattamento
- Per ISO 2709, un campo di dati dev'essere contrassegnato da un'etichetta (tag) a 3 cifre e può contenere max 9.999 caratteri, inclusi indicatori e identificatori di sottocampo
UNIMARC, analisi del formato
Tipologie di campi
In UNIMARC sono definiti campi
- di dati codificati e di dati descrittivi
Sono sempre dati testuali, ma i primi sono in codice, i secondi in linguaggio naturale
- a lunghezza fissa e a lunghezza variabile
Quelli a lunghezza fissa sono sempre di dati codificati, ma non è vero il contrario
- obbligatori, raccomandati e facoltativi
A conferma della flessibilità del formato, obbligatori sono solo i campi 001, 100, 101*, 200, 801, 120*, 123*, 206*
* (in presenza del dato)
- ripetibili e non ripetibili
ma attenzione a non confondere la ripetibilità dei campi con la ripetibilità dei sottocampi: la casistica è varia
UNIMARC, analisi del formato
I blocchi funzionali
I tag dei campi definiti in UNIMARC sono articolati funzionalmente in dieci blocchi, corrispondenti ad altrettante tipologie di dati:
- 0xx Blocco dell'identificazione
- 1xx Blocco delle informazioni codificate
- 2xx Blocco delle informazioni descrittive
- 3xx Blocco delle note
- 4xx Blocco dei legami
- 5xx Blocco dei titoli in relazione
- 6xx Blocco dell'analisi semantica
- 7xx Blocco della responsabilità intellettuale
- 8xx Blocco per l'uso internazionale
- 9xx, x9x, xx9 Blocco per l'uso locale
UNIMARC, analisi del formato
I campi "0xx"
I campi contrassegnati da un tag che comincia per "0" contengono numeri o stringhe alfanumeriche che identificano univocamente:
- il record. Esempi:
- 001 numero di sistema del record nel proprio archivio (obbligatorio);
- 005 data e ora dell'ultima modifica
- 035, numero di sistema dell'archivio da cui il record è stato importato
- Il documento catalogato. Esempi:
- 010 ISBN
- 011 ISSN
- 014 numero SICI o bibliod
- 020 numero di bibliografia nazionale
UNIMARC, analisi del formato
I campi "1xx"
I campi contrassegnati da un tag che comincia per "1" contengono sequenze di informazioni espresse in linguaggio codificato, utile a disambiguare l'informazione e a facilitare operazioni di filtering su archivi estesi
Ogni elemento della sequenza è identificabile ed enucleabile dalla sua posizione, che è predefinita
Esempi:
- 100
- $a pos. 8-16 data/e della pubblicazione
- $a pos. 17-19 target della pubblicazione
- $a pos. 20 pubblicazione governativa
- 101 $a-$j lingua/e del documento e dell'opera di riferimento
- 102 $a nazione di pubblicazione
- 105
- $a pos. 4-7 tipo di contenuto (catalogo, enciclopedia, tesi..)
- $a pos. 8 convegni;
- $a pos. 9 Festschriften
- $a pos. 11 genere letterario
UNIMARC, analisi del formato
I campi "2xx"
- I campi il cui tag comincia per "2" contengono le informazioni prescritte dall'ISBD, espresse- come in ISBD- in termini tratti dal linguaggio naturale
- La differenza sta solo nella punteggiatura, che in UNIMARC si omette ed è sostituita dal sistema dei campi e sottocampi (eccetto il segno "=" per i titoli paralleli, che permane)
Esempio:
200 1 |
$aTitolo proprio
$bIndicazione generica del materiale
$cTitolo proprio di altro autore
$d=Titolo parallelo
$ecomplemento del titolo
$fPrima formulazione di responsabilità
$gSeconda formulazione di responsabilità
|
UNIMARC, analisi del formato
I campi "3xx"
- I campi il cui tag comincia per "3" contengono le informazioni che in un record ISBD sono fornite in nota
- Per diverse tipologie di nota esiste un apposito campo 3xx
Esempi:
- 300 note generali
- 303 note generali sulla descrizione
- 304 note sul titolo e la responsabilità
- 305 note sull'edizione
- ...
- 327 note di contenuto
Interessante è la possibilità di registrare un
UNIMARC, analisi del formato
I campi "4xx"
I campi il cui tag comincia per "4" contengono informazioni su altri record collegati a quello in esame
Sono previste due tecniche:
- Quella dell'incapsulamento, fondata appunto sull'incapsulamento nel campo 4xx $1 di interi campi dell'altro record, inclusi i tag, gli indicatori e gli identificatori di sottocampo
Esempio: 410 1$1001005678
- Quella per sottocampi standard, fondata sulla citazione in appositi sottocampi del campo 4xx delle informazioni presenti nell'altro record
Esempio: 410 1$tTitolo della serie$0numero di sistema del record collegato
UNIMARC, analisi del formato
I campi "4xx". Tipologie di legami
Tra i documenti esistono talvolta relazioni di appartenenza, gerarchia, derivazione, o affinità che è bene segnalare nei rispettivi record bibliografici.
Esempi:
- Appartenenza di una monografia a una serie
- Gerarchia tra un singolo articolo e la pubblicazione collettiva in cui è contenuto
- Derivazione di un periodico dalla fusione di due testate preesistenti
- Affinità tra edizioni diverse di una stessa opera
UNIMARC, analisi del formato
I campi "4xx" e i link tra record
Se nello stesso catalogo esistono record relativi a documenti variamente imparentati, è bene non soltanto segnalare, p. es., in nota la parentela, ma fornire strumenti per poter rintracciare agevolmente i record in questione
A tale ultimo scopo sono stati concepiti i campi di legame, e in particolare la tecnica dell'incapsulamento, in verità non sempre con buoni esiti (i sw spesso ricorrono a soluzioni proprietarie o comunque alternative per attivare i link)
UNIMARC, analisi del formato
I campi "5xx"
I campi il cui tag comincia per "5" contengono titoli associati alla pubblicazione catalogata
Esempi:
- 500 Titolo uniforme
- 512 Titolo di copertina
- 520 Titolo precedente (seriali)
- 530 Titolo-chiave (seriali)
- ...
UNIMARC, analisi del formato
I campi "6xx"
I campi il cui tag comincia per "6" contengono le formulazioni di soggetto, secondo sistemi che utilizzano termini del linguaggio naturale o codici alfanumerici
La notizia non buona è che per usare molti di questi campi si
raccomanda di riportare in appositi sottocampi il codice del sistema di
notazione usato, codice che deve essere tratto dall'elenco in appendice G del Manuale
UNIMARC (dove, p.es., il Soggettario di Firenze non è citato)
UNIMARC, analisi del formato
campi "6XX" e UNIMARC for Classifications
Nel 2000 è stato presentato un formato identico all'UNIMARC bibliografico per struttura, ma specifico per l'archiviazione di numeri di classificazione riconosciuti, con relativi dettagli circa il sistema, l'edizione e la versione usata, nonché stringhe di testo esplicative del significato
Dall'archivio bibliografico sarebbe in questo modo sufficiente creare un collegamento col record di classificazione e i campi "6xx" per classificazioni nel formato bibliografico divengono ridondanti
UNIMARC, analisi del formato
I campi "7xx"
- I campi il cui tag comincia per "7" contengono le intestazioni per autori ed enti, ossia i nomi di persone o enti cui è associata una responsabilità intellettuale rispetto alla pubblicazione catalogata
- Sono previsti campi per vari livelli di responsabilità (700, 710 principale; 701, 711, alternativa; 702, 712 secondaria; 730, livello non specificato), e sottocampi ("$4") in cui specificare in codice il tipo di relazione del soggetto con l'opera
- se l'intestazione è tratta da un authority file, si raccomanda di citare il corrispondente record di authority (nel sottocampo "$3")
- non essendo standardizzate le forme delle intestazioni, vanno specificati l'ordine di citazione delle parti del nome (mediante indicatori appositi) e la punteggiatura (che va apposta dal catalogatore)
UNIMARC, analisi del formato
Accessi per nome e UNIMARC/Authorities
- Dal '91 è stato elaborato un formato UNIMARC per record di autorità sulla base di un'idea di catalogazione per obiettivi distinti:
- da un lato le descrizioni bibliografiche delle pubblicazioni
- dall'altro la registrazione delle forme preferite, alternative e non preferite dei nomi (autori, titoli, luoghi, concetti) associati alle opere e/o alle loro espressioni allo scopo di normalizzare le intestazioni e creare una rete di rinvii di guida per l'utente
- la funzione è diversa, ma la struttura del formato è uguale a quella del formato bibliografico (LDR, directory, campi di dati articolati in blocchi funzionali, dati)
- di nuovo qui notiamo la parziale (sopravvenuta) ridondanza di UNIMARC formato bibliografico, poiché esso ha definiti al proprio interno campi (es. il 500 e il 501) con la stessa funzione di altri campi del formato Authorities (230, 235, 240, 245)
UNIMARC, analisi del formato
I campi "8xx"
I campi il cui tag comincia per "8" contengono informazioni di genere vario:
- sul record
- esempi:
" 801 fonte della registrazione (i.e.: chi l'ha prodotta)
" 886 dati non convertiti dal formato fonte
- o sulla pubblicazione
- esempio:
" 856 localizzazione e accesso elettronici (i.e.: dove si trova)
UNIMARC, analisi del formato
I campi "9xx", "x9x", "xx9"
- I campi con un "9" nel tag contengono dati di tipo non previsto dal formato UNIMARC ma appartenenti a convenzioni descrittive nazionali
- Tali dati, a meno di accordi espressi, non vengono esportati
- In assenza di un formato UNIMARC per dati gestionali sulle copie fisiche, spesso un campo "9xx" viene utilizzato per registrare tali dati
- si ricorre al "9" nel tag anche per registrare soggetti o classificazioni tratti da sistemi non riconosciuti ufficialmente sul piano internazionale
- la BNI utilizza i campi 900 e 910 per registrare forme non preferite di nomi di persone o di enti
Tipi di documenti catalogabili in UNIMARC
UNIMARC è sviluppato sulla base delle ISBD, quindi prevede campi e codici specifici per record catalografici relativi a:
monografie, periodici, parti componenti, libri antichi, partiture musicali, documenti cartografici, immagini, registrazioni audio e video, materiali museali, risorse elettroniche
Un formato universale?
In realtà,
- Quali tipologie di documenti trovano in UNIMARC una descrizione effettiva?
- Come e quanto è applicato e applicabile UNIMARC, come formato interno o di scambio?
- Quali sono gli aspetti critici della questione?
Origini di UNIMARC
- Negli anni '60 la LC sviluppa il primo formato MARC, da cui nel '73 deriverà la prima edizione di ISO 2709
- Dagli anni Settanta nei vari Paesi si sviluppano e diffondono MARC nazionali fondati su ISO 2709
- Soprattutto LC e BL cominciano a manifestare interesse a un formato internazionale di esportazione che minimizzi i problemi dell'importazione di record da formati diversi provenienti da agenzie bibliografiche di altre nazioni
- A partire dal '77 appaiono a cura dell'IFLA le prime edizioni di UNIMARC per lo scambio internazionale
Da formato di scambio a formato di gestione
- Negli anni '90 l'IFLA, nell'ambito dell'UBCIM programme, costituisce il Permanent Unimarc Committee per la manutenzione e lo sviluppo del formato
- cominciano a moltiplicarsi progetti europei per la conversione in UNIMARC da MARC nazionali
- l'incrementata accessibilità di Internet da parte di un pubblico vasto pone al centro dell'attenzione le esigenze dell'utente remoto, di avere accesso rapido e integrato all'informazione registrata
- dallo scambio si passa alla gestione condivisa dei dati all'interno di reti sempre più estese di biblioteche e la standardizzazione diviene una necessità assoluta
- in diversi Paesi (Francia, Portogallo,Italia, Russia...) UNIMARC comincia ad affermarsi come formato non solo di scambio, ma anche interno
Dalla descrizione bibliografica alla descrizione documentale
- L'evoluzione di UNIMARC è collegata a quella delle ISBD
- L'edizione '77 prevedeva essenzialmente il trattamento di monografie e periodici
- l'edizione dell'80 prevedeva campi anche per materiali cartografici e NBM (audio, video, grafica, ...)
- l'edizione dell'87 includeva campi provvisori per computer files
- l'attuale edizione (1994) del Manuale e i successivi update 1996, '97 e 2000 coprono i libri antichi, i materiali museali, l'adeguamento all'ISBD (ER) e rivedono la tecnica dei legami
UNIMARC in quattro formati
- Oltre all'UNIMARC Bibliographic format
- dal '91 è apparso UNIMARC Authority format, poi riveduto e ampliato nel '96
- al 2000 risale la presentazione di UNIMARC Classification format
- è programmato infine lo sviluppo di un UNIMARC Holdings format
Un formato universale?
Quali sono i limiti, strutturali o descrittivi, che l'applicazione del formato ha evidenziato?
Quali sono gli sviluppi prevedibili?
Ai tempi della nascita del MARC...
- i db erano gerarchici, non relazionali
- le interfacce erano a caratteri, non grafiche
- lo scambio avveniva su nastro off-line tra poche agenzie nazionali, che conoscevano a monte le rispettive applicazioni, non online tra una moltitudine di biblioteche
- le reti telematiche erano poco usate dalle biblioteche e non esisteva il web
- gli utenti erano pochi, localizzati e identificati
- le collezioni da catalogare erano prevalentemente su supporto analogico, non digitale
UNIMARC oggi
L'implementazione UNIMARC e i suoi sviluppi successivi sono stati funzionali a:
- sfruttare le potenzialità della nuova logica relazionale dei db (navigazione tra record: campi 4xx, sottocampi $3 di legame ad altri archivi- auth., class.- del sistema)
- sfruttare il collegamento in rete per favorire l'accesso a ER esterne (campo 856)
- permettere lo scambio e la condivisione di dati catalografici relativi a diverse tipologie di materiali, incluse ER
- favorire la conversione di dati codificati in DC (campo 730)
Lo scenario
Information is the core business!
Utenti e organizzazioni oggi chiedono accesso disintermediato, integrato e rapido a fonti d'informazione eterogenee, secondarie (opac locale, opac remoti, repertori bibliografici, TOCs, metaindici e metamotori di ricerca, ...), e primarie (ipertesti, biblioteche digitali, e-journals, portali semantici, dati amministrativi, statistiche, diagrammi di flusso, ...)
Chiedono servizi online: servizi tradizionali (prestito, ILL, DD, SDI, Print-on-Demand, bollettini, acquisti a distanza, ...) e nuovi (didattica a distanza, comunicazioni ed e-publishing...)
Se non lo trovo in linea, non esiste
Spesso presumono che l'informazione recuperata sia tutta l'informazione disponibile
Gli attori
Chi produce informazione secondaria (metadati e apparati di reference)?
Non solo
- Bibliotecari
- Archivisti
- Documentalisti
Ma anche
- Ricercatori
- Autori
- Editori
- Aggregatori
- (tecnologi dei) Motori di ricerca
Tecnologia e nuovi bisogni
Tecnologia | Nuovi bisogni |
db relazionali --> | mappe topiche (FRBR) |
Internet e il web- Aumento dei formati digitali --> | accesso, integrazione e interoperabilità facilità d'uso ma anche... ... Selezione e Qualità! |
Fortuna di UNIMARC - come formato interno (1)
- UNIMARC è un formato enumerativo e gerarchico, che non permette livelli ulteriori di indirizzamento oltre quello di sottocampo
- un sw è compatibile con UNIMARC per la gestione interna solo se è in grado di ricalcolare la nuova posizione e lunghezza dei campi quando siano stati modificati manualmente i dati
- i sw a implementazione UNIMARC devono ricavare dalla directory i tag dei campi e la posizione iniziale di ciascuno per puntare agli indicatori, nonché ai sottocampi e ai dati in esso contenuti
- per estrarre i dati codificati, devono inoltre calcolare la posizione esatta dei codici corrispondenti ai dati all'interno del rispettivo campo
- l'innovazione fornita con la tecnica relazionale dell'incapsulamento dei campi nel blocco 4xx non ha finora trovato piena applicazione nei sw per biblioteche
- in generale, diverse funzionalità immaginate dagli sviluppatori del formato sono tutt'oggi non
valorizzate dagli sviluppatori di sw
Fortuna di UNIMARC - come formato interno (2)
I vantaggi di UNIMARC come formato interno sono:
- facilitazione nell'importazione di record da altri archivi
- facilitazione nella migrazione da un sw a un altro
- facilitazione nella creazione di cataloghi collettivi, reali o virtuali
- migliori prestazioni in sede di ricerca e recupero per la molteplicità di indici e di filtri che si possono creare
Lo svantaggio sta nel dover registrare informazioni ulteriori, semmai ridondanti (es. la data della pubblicazione nei campi 100 pos. 9-16 e nel 210 $d), in caso di catalogazione di prima mano
Fortuna di UNIMARC - come formato di visualizzazione nei web OPAC
- Per la visualizzazione in opac web è necessaria una transcodifica dei caratteri di controllo ISO 2709 (designatori di sottocampo, separatori di campo e terminatori record) e in generale dei caratteri speciali presenti nel record (ovvero, tutti quelli non compresi nel set Latino base ISO 646), perché per essi l'HTML prevede una codifica diversa
- Sicché, negli Opac web, il formato di visualizzazione non è UNIMARC, ma una sua traduzione
Fortuna di UNIMARC - come formato di esportazione e scambio (1)
- UNIMARC --> UNIMARC
La ridondanza finalizzata all'ospitalità per tradizioni catalografiche diverse implica pure la possibilità che informazioni dello stesso tipo siano trattate diversamente in diversi archivi (es.: uso francese del 200 $h e $i). Nessuna parte del formato è esplicativa delle convenzioni d'uso
- UNIMARC --> Altri MARC
Nessuna parte del formato, in particolare nel LDR, prevede un codice identificativo del formato: bisogna ricavarlo dalla visualizzazione del record o dalla documentazione allegata per riconoscere un record UNIMARC e la sua particolare applicazione
Fortuna di UNIMARC - come formato di esportazione e scambio (2)
- UNIMARC --> Altri metadati per ER
La transcodifica è complessa, occorrono tabelle ad hoc
il problema è nel contrasto strutturale del modello ISO 2709, pensato per db gerarchici, con le sintassi derivate da SGML, che non prevedono né una directory, né livelli di indirizzamento, ma una Document Type Definition, e poi tag di marcatura associati ai campi, facilmente identificabili da un motore di ricerca (un esempio è l'HTML)
non a caso, le comunità di sviluppatori e utenti di metadati che partecipano a progetti cooperativi per l'interoperabilità hanno individuato in XML, una sintassi astratta ed estensibile derivante da SGML, lo standard "cornice" entro cui- tramite una specifica DTD- far rientrare i metadati descrittivi dei rispettivi sistemi
Ostacoli all'universalità di UNIMARC
- MARC21 vs. UNIMARC
- MARC21 è adottato da grandi network di biblioteche del mondo anglosassone
- MARC21 è fondato sulle AACR2 a copertura più ampia
- DC vs. MARC per le ER
- DC è molto meno analitico, adatto all'"autocatalogazione" e a risorse poco stabili
- XML vs. ISO 2709
- XML è la sintassi adottata dal RDF per l'interoperabilità
- ISAD/EAD e altri standard catalografici per immagini, oggetti museali, etc., vs. ISBD/MARC
- per materiali archivistici e NBM sono diffusi e spesso preferiti standard specialistici
UNIMARC e FRBR
- FRBR è un modello di analisi documentale orientato a evidenziare l'occorrenza e le relazioni reciproche tra entità (prodotti, responsabili, soggetti) implicate nel documento
- UNIMARC può divenire compatibile con tale modello se supererà la struttura gerarchica e direzionale di ISO 2709, nonché- sul piano descrittivo- se supererà la ridondanza di informazioni nello stesso record e svilupperà formati funzionali a diversi obiettivi della catalogazione
Funzioni della catalogazione secondo FRBR
- Amministrativo-inventariale (localizzazione, trattamento e condizioni di accessibilità)
- Descrittiva (del prodotto- opera, espressione, manifestazione, o esemplare-; dei responsabili- persone o enti-; dei soggetti- concetti, oggetti, eventi, o luoghi)
- Relazionale di primo livello (tra documenti)
- Relazionale di secondo livello (tra entità)
Il futuro dei cataloghi
- Pluralità di artefici e cooperazione a diversi livelli
- Sviluppo di una koinè tra formati di metadati
- record differenziati per entità
- mappe topiche per l'evidenziazione delle relazioni tra entità e tra documenti
- identificatori univoci (DOI, URN, URI...) per garantire l'efficacia dei puntamenti e l'economicità dell'apparato relazionale distribuito evitando di duplicare informazioni
- superamento dell'opposizione "data-base vs. ipertesti", ovvero:
- i record bibliografici, puntando ad altri record, avranno sempre più valenza ipertestuale
- non più i dati (es. testo libero), ma i metadati presenti negli ipertesti saranno indicizzati nei data-base di motori di ricerca sempre più sofisticati
- ai link statici, predefiniti nel record, si sostituirà la tecnologia dei i link dinamici, cioè prodotti all'atto della query
Il futuro di UNIMARC
- UNIMARC non è un formato universale, ma il suo futuro è assicurato non soltanto per la catalogazione di risorse su supporto analogico
- con opportuni adeguamenti l'analiticità descrittiva del formato finirà per prevalere sulla facilità garantita dall'uso di altri metadati (DC), almeno per le risorse più stabili e qualitativamente selezionate
- è possibile che, da modalità di transcodifica attualmente praticate dall'uno all'altro formato, la tendenza alla standardizzazione determini un'integrazione-fusione di molti dei formati fin qui elaborati, e la differenza si abbia alla fine solo negli obiettivi e nei livelli descrittivi
Copyright AIB 2002-11-18, ultimo aggiornamento 2002-11-18
a cura di Maria Grazia Ronca
URL: http://www.aib.it/aib/sezioni/cam/maiel-tx.htm
AIB-WEB |
Ricerca in AIB-WEB |
Altre Sezioni |
Home Page Campania |
la Sezione |
Vivi la Regione