AIB. Sezione Campania. Seminari
AIB-WEB | Sezioni Regionali | Campania
Faccia a faccia con l'esperto
I meta dati e la gestione dell'informazione
/ Nicola Benvenuti*
Argomenti della discussione
- La necessità di meta dati
- Cosa sono i meta dati
- Una classificazione degli schemi di meta dati
- Problemi di interoperabilità
La ricerca automatica
- Alto richiamo e bassa precisione
- Difficoltà a indicizzare l'informazione non testuale
- Assenza di criteri di qualità
I limiti di html
- Html permette di definire la presentazione editoriale di un documento: quale carattere, quale grandezza e formato (normale, corsivo, grassetto) utilizzare per titoli, paragrafi, citazioni; come formattare tavole; come indicare link; quando richiamare programmi o script per eventi interattivi o multimediali, etc. Html però non dice nulla sul contenuto informativo del documento.
- a partire da html4 sono stati introdotti dei "meta tag" - <title>, <keyword>, <author> ... da collocare nell'intestazione <head> del documento html per facilitare la ricerca dei documenti.
La necessità di meta dati
Il World Wide Web è stato costruito per essere usato dall'uomo e, sebbene ogni cosa in esso sia leggibile dalle macchine, questi dati tuttavia non sono comprensibili da queste ultime ... la soluzione proposta è quella di usare i meta dati per descrivere i dati contenuti sul web.
Dall'introduzione a : Resource Description Framework (RDF). Modello e sintassi in
<http://www.xml.it:23456/RDF/REC-rdf-syntax-19990222-it.html>
Cosa sono i meta dati
- I meta dati sono informazioni sulle risorse web.
- Il loro scopo è fornire una raffigurazione sintetica di un oggetto digitale come parte di un sistema informativo (raffigurazione sintetica e normalizzata di un mondo di oggetti, volto allo scambio di conoscenze)
- Nel web i meta dati devono essere "comprensibili" dalle macchine
- Cioè devono essere manipolabili dalle macchine secondo istruzioni programmate.
Cosa sono i meta dati
- Da un lato definire i meta dati significa affrontare un problema filosofico di definizione delle caratteristiche e peculiarità degli oggetti digitali per poterli adeguatamente rappresentare
- Dall'altro significa definire modalità e linguaggi per far sì che le macchine possano "comprendere" i dati
Le funzioni dei meta dati
- Funzione di rendere efficace il recupero dell'informazione
- ricorso a criteri e metodi sviluppati in ambito biblioteconomico per costruire surrogati degli oggetti digitali
- uso di "sistemi di organizzazione della conoscenza" (knowledge organisations) consolidati
- Ricerca cross domain
- Funzione di permettere la gestione dei documenti
- gestione dei diritti di accesso
- formati elettronici
- certificazione di autenticità
- Funzione strutturale, cioè di ricostruire le relazioni dell'oggetto con gli oggetti digitali esterni
Gli schemi di meta dati
Gli schemi di meta dati si differenziano per corrispondere
- alle proprietà e caratteristiche degli oggetti informativi
- alle finalità delle comunità che li promuovono
- ed ad altri criteri tra cui la complessità del formato
Tipi di schemi
- Semplici
- sono quelli costruiti in modo automatico dai robot dei motori di ricerca e si limitano in genere ad una intestazione e ad una sommarizzazione del contenuto della pagina web: sono in genere formati "proprietari"
- Strutturati
- Possono essere di formato generico, come il DC (dublin core) o come IAFA (Internet Anonymous FTP Archive) o specializzati per una tipologia di materiale, ad es. MARC o GILS (Government Information Locator Service).
- Ricchi (rich formats)
- CIMI (Consortium for the Computer Interchange of Musem Information) il TEI (Text Encoding Initiative) o EAD (Encoded Archivial Description)
Classificazione degli schemi di meta dati
|
Primo tipo |
Secondo tipo |
Terzo tipo |
Ambiente d'uso |
Servizi di ricerca globale su intenet;
Servizi di indicizzazione del web |
Servizi di ricerca selettivi di Internet e liste di siti |
Descrizione di collezioni accademiche e di altri importanti archivi di testi |
Funzione |
Identificazione di un documento |
Identificazione e selezione |
Identificazione, selezione, valutazione, analisi, documentazione |
Creazione |
Generati da robot |
Robot ed elaborazione manuale |
Richiede un'alta qualificazione intellettuale spesso da parte di personale appositamente addestrato |
Struttura |
Non strutturato |
Coppia valore attributo |
Qualificatori di sottocampo;
Marcatura strutturata |
I 15 elementi del dublin core
Titolo* |
Creatore |
Data* |
Soggetto* |
Autore di contributo subordinato |
Tipologia |
Descrizione* |
Editore |
Formato* |
Fonte |
Gestione dei diritti |
Identificatore |
Lingua |
|
|
Relazione* |
|
|
Copertura* |
|
|
Qualified Dublin Core
- Per circoscrivere il contenuto semantico degli elementi sono stati specificati dei qualificatori (opzionali) degli elementi del DC
- La codifica dei qualificatori si esprime secondo il modello: <meta name="prefisso(.)nome dell'elemento(.)nome del sub elemento...">. P. e.:
<meta name="DC.Title.Alternative"
content="valore">
<meta name="DC.Subject.DDC"
content="720.92">
<meta name="DC.Relation.Is part of"
content="http://"...".
Sintassi del DC in html
I tag dei vari elementi sono introdotti dal tag <link> di html che permette di indicare il modello di metadati cui l'elemento di riferisce:es.:
<link rel="schema.DC" |
nome dell'elemento |
href="http://purl.org/DC/"> |
valore |
meta name=DC.Creator |
nome dell'elemento |
content="Da Costa, José" |
valore |
Funzione del DC come "gergo comune"
- il set di elementi del Dublin Core realizza uno scambio tra ricchezza della rappresentazione ed estesa visibilità
- Schemi più ricchi possono però essere mappati sul Dublin Core per essere esportati o per una ricerca tra sistemi (cross-system searching)
- Viceversa, record in Dublin Core semplice possono essere usati come punto di partenza per la creazione di descrizioni più complesse
Interoperabilità dei meta dati
- Registri di meta dati
- Warwick framework
- Pics
- RDS
Warwick framework
delinea una architettura
- modulare, per permettere la convivenza dei diversi package o schemi;
- estensibile per garantire la creazione e l'interoperabilità di nuovi schemi di meta dati;
- distribuita perché diversi sono le comunità che elaborano i meta dati
- "recursive" (indica che gli oggetti meta dati possono essere a loro volta trattati come oggetti informativi ed avere oggetti meta dati associati ad essi)
Plattform for Internet Content selection - PICS
- Nata per bloccare l'accesso di minori a siti web osceni o violenti, indica un modo per associare ad una risorsa web delle etichette usate dai browser per filtrare le pagine che l'utente incontra durante la navigazione in rete.
- Tali etichette collegano al servizio di valutazione vero e proprio - costruito da apposite agenzie e mantenuto su server distribuiti nella rete - dove è espresso il significato leggibile sia dagli umani che dalla macchina, delle etichette stesse.
- Le etichette associate possono anche richiamare più sistemi di classificazione di diverse agenzie in quanto tale richiamo è costituito da una semplice URL al file della classificazione di ciascuna agenzia.
- PICS è quindi sia modulare, sia distribuito in rete.
Resource description framework - RDF
RDF fornisce una metodologia univoca per esprimere in modo coerente i meta dati in modo che siano comprensibili dalle macchine
Per il computer la semplice frase:
Luigi Bianchi è autore del documento 1
È diversa da:
l'autore del documento 1 è Luigi Bianchi
Conclusioni
- Stato di sviluppo effettivo dei metadati
- Centralità della funzione di ricerca
- Ruolo di MARC21
* versione testuale delle slide di presentazione utilizzate durante l'incontro tenutosi a Napoli il 22 gennaio 2002
Copyright AIB 2002-01-25, ultimo aggiornamento 2002-01-25
a cura di Maria Grazia Ronca
URL: http://www.aib.it/aib/sezioni/cam/benv-sl.htm
AIB-WEB |
Ricerca in AIB-WEB |
Altre Sezioni |
Home Page Campania |
la Sezione |
Vivi la Regione