Il Progetto VOA3R: la costruzione del sociale e semantico per la ricerca e la valutazione dei contenuti nei Repository Open Access
An ambitious 3-year European research project 'The Virtual Open Access Agriculture & Aquaculture Repository' (VOA3R) launched in 2010 within the Seventh Framework ICT Program of the European Union aims at connecting different intelligences into a single Open Access Repository space. These intelligences are expressed through shared research materials and virtual open communications between peers (researchers, students and practitioners) from 17 organizations of different European countries. The VOA3R has deployed an advanced community- focused integrated Portal for enriching, searching, and sharing contextual information around deposited open digital contents, whose representation is based on the explicit CERIF model oriented on scholarly methods, procedures and practical tasks of applied research. The dissemination and reuse of contents is being enhanced with tools offered by Social (2.0) and Semantic (3.0) Web. The article aims at reviewing the project activities concerning the development of functionalities enhancing the search and evaluating processes of the research content.
Gaston Bachelard [1]
Il VOA3R (Virtual Open Access Agriculture & Aquaculture Repository: Sharing Scientific and Scholarly Research related to Agriculture, Food, and Environment) [2] è un progetto di ricerca Europeo finanziato dal Settimo Programma quadro dell'Unione Europea (ICT Policy Support Programme - Theme 4 – Open Access to Scientific information), il cui obiettivo primario è quello di creare un Portale che offra un unico punto d'accesso per la consultazione e la diffusione dei materiali di ricerca (tra cui, attualmente, 500.000 sono ad accesso aperto) che provengono da una rete federata di 14 Repository Open Access.
In quanto all'infrastruttura del Portale VOA3R, essa poggia su una rete globale di dominio pubblico denominata AGRIS (International System for Agricultural Science and Technology) nella quale, allo stato attuale, sono presenti più di 4 milioni record bibliografici (record di metadati) relativi a contenuti di ricerca prodotti nel campo scientifico e tecnologico dell'agricoltura.
Lo scopo del VOA3R è quello di estendere le funzionalità della rete AGRIS per mezzo di componenti aggiuntivi, tra cui i nuovi servizi di ricerca e i nuovi modelli sociali [3] di comunicazione attiva in rete. In quanto a questi ultimi, basati sui meccanismi del Social networking (Web 2.0), attraverso il Portale VOA3R è possibile gestire diverse comunicazioni virtuali attive (attraverso il microblogging, social bookmarking) tra i gruppi di utenti registrati, formati da accademici, ricercatori, studenti, e professionisti del campo, offrendo anche la possibilità di commentare e valutare i contenuti di ricerca attraverso le annotazioni, revisioni, e le funzionalità di rating e like per ogni item (incluso il materiale audio-visivo) depositato.
Ogni utente registrato può creare entro il Repository VOA3R il suo profilo personale in cui, a parte le funzionalità appena descritte, vi sono anche dei moduli attraverso i quali è possibile dichiarare il proprio coinvolgimento in progetti, attività di ricerca istituzionali e reti sociali virtuali creati entro la Community VOA3R.
Nel frattempo, tutti gli utenti del VOA3R sono diventati i contributori attivi al "dialogo tra pari" nella rete professionale virtuale AIMS (Agricultural Information Management Standards) [5]. Una simile creazione di canali comunicativi entro un unico spazio rappresenta di certo il valore aggiunto per il potenziamento della diffusione dei contenuti del Repository VOA3R il quale, tra l'altro, viene integrato nella cornice a supporto delle informazioni sulle attività promotori del movimento Open Access (Figura 1).
Figura 1. VOA3R: partner, contenuti, servizi e modelli sociali a supporto della diffusione dei contenuti di ricerca
Già nel suo stadio attuale di sviluppo (in modalità beta-version) il Portale VOA3R può rientrare sicuramente tra le Best Practices per la creazione delle funzionalità avanzate in Open Access Repositories, in quanto non solo è implementato secondo l'approccio standardizzato di Current Research Information Systems CRIS [6] (basandosi sul modello concettuale CERIF 1.3), ma anche mette in sinergia diversi contenuti e funzionalità dell'infrastruttura di ricerca attraverso i meccanismi del Web 2.0.
Inoltre, la diffusione dei contenuti di ricerca del Repository non si basa su un solo ancoraggio al livello dell'interoperabilità sintattica tramite l'Open Archive Initiative Protocol for Metadata harvesting (OAI-PMH), bensì viene anche intercorrelata per via dell'interoperabilità semantica, sfruttando le potenzialità offerte dall`ontologia basata su più di 40.000 concetti presentati in 22 lingue del Thesaurus AGROVOC, dall'EuroCris ontology server, nonché dalle tecnologie Linked Data (Web 3.0) [7] (Figura 2).
Figura 2. L'infrastruttura tecnologica del VOA3R in vista del potenziamento dei canali comunicativi dei contenuti
L'infrastruttura tecnologica del VOA3R potenziata dalle funzionalità avanzate del social e semantic web rinvigorisce nel modo significativo l'approccio sociale aperto verso la diffusione dei contenuti di ricerca Open Access in rete.
Il Repository VOA3R offre una potente infrastruttura per la ricerca e navigazione dei contenuti aggregati da diversi repository partecipanti, in quanto usa un approccio terminologico integrato che permette di indicizzare/taggare tutte le entità depositate attraverso la terminologia standard offerta dal sistema di organizzazione della conoscenza Thesaurus AGROVOC. Le voci controllate (voci d'autorità) di quest`ultimo sono strutturate per descrivere non solo le diverse categorie di contenuti scientifici, ma anche i nomi di persone e istituzioni. Di recente l´AGROVOC è stato pubblicato in modalità Linked Data [9] con l'impiego dei formalismi di Simple Knowledge Organization System (SKOS), ed è reso pubblico nella Linked Open Data Cloud [10]:
Oltre le opzioni standard offerti nel VOA3R per la navigazione dei contenuti, attraverso i link a supporto delle categorie "Data provider", "Lingua", "Collezione", "Autore", il repository offre le funzionalità di ricerca avanzate come "Tag Cloud" (ricerca dei contenuti in base alle parole chiavi di maggiore occorrenza, controllate attraverso il Thesaurus AGROVOC), "Drag and Drop" (ricerca in base alle parole chiavi applicati ai domini concettuali taggati dall`AGROVOC), "Timeline views", "Map views" (Figura 3).
Figura 3. Funzionalità di ricerca e navigazione dei contenuti nel Repository VOA3R
La terminologia del Thesaurus AGROVOC è stata impiegata nel repository sia allo scopo di diversificare e espandere le funzionalità di navigazione dei contenuti attraverso l'approccio "berrypicking" [12], con il successivo filtro dei contenuti impostato per le aree spazio-temporali, che per poter esprimere meglio le intenzioni di ricerca dell'utente attraverso l'approccio di micro-blogging che offre la possibilità di attivare le comunicazioni virtuali intorno a diversi domini concettuali di ricerca appoggiate sulle aree semantiche formalizzate dal medesimo Thesaurus.
Tale approccio consistente del VOA3R per l'organizzazione e la ricerca dei contenuti, incluso il potenziamento di rappresentazione di questi ultimi offerto dal Linked Open Data (LOD) [13], può essere considerato come un'estensione di qualità delle distribuzioni Open Archive Initiative che è possibile adottare in qualsiasi altra piattaforma di Archivi Aperti.
Per poter arricchire ulteriormente le funzionalità del repository a supporto della qualificazione dei contenuti di ricerca ospitati, a novembre 2012 entro il progetto VOA3R è stato lanciato l'esperimento "Controlled Experiment for Reviewing Lifecycle Services" [14], per cui è stato creato un apposito Blog (Figura 4).
Figura 4. L'esperimento VOA3R "Controlled Experiment for Reviewing Lifecycle Services"
L'obiettivo dell'esperimento è quello di coinvolgere tutte le parti interessate nel contribuire allo sviluppo del processo alternativo di revisione dei contenuti di ricerca in rete. A tal scopo nel blog dell'esperimento sono state caricate le versioni full-text di paper proposti al quinto Workshop Internazionale "Metadata and Semantics for Agriculture, Food and Environment" (MTSR 2012) [15], i quali possono essere consultati, revisionati e commentati nello spazio apposito "Leave a comment". Al processo della revisione di ogni articolo presentato nel blog possono unirsi diversi utenti registrati, e tale approccio farà parte delle funzionalità del VOA3R al fine di complementare "the traditional, anonymous peer review process which results are not made available openly" [16].
Basandosi su diversi studi creati intorno alle definizioni per la valutazione di qualità di valori di metadati, fornite attraverso la mappatura dei modelli di Bruse&Hilman e Stvilia et al. [17] (Figura 5), i cui criteri sono validi anche per l`analisi della qualità dei servizi di contenuti di ricerca, entro il progetto VOA3R è stato lanciato l`esperimento sull'analisi della qualità dei metadati aggregati da diversi repository cooperanti.
Figura 5. Mappatura tra i modelli di valutazione della qualità dei contenuti di metadati
di Bruse&Hilman e Stvilia et al. [18]
La mappatura dei due modelli appena fornita avviene in base a sette criteri: completezza (granularità e precisione), accuratezza, conformità alle aspettative di utenza, consistenza logica, accessibilità, ciclo di vita, provenienza, ma ogni comunità (ogni repository) può sviluppare i propri criteri e metriche per la valutazione di metadati.
Tale compito è ancora più importante per i repository aggregatori virtuali di contenuti, che raccolgono i metadati dalle infrastrutture Open Archives attraverso il protocollo OAI-PMH riportando la granularità dei valori di metadati a livello di base di 15 elementi Dublin Core non qualificati. Dalla completezza e dall´uniformità dei valori di metadati raccolti dai vari repository dipende la qualità dei servizi di ricerca creati sopra il livello di raggruppamento dei contenuti, i profili di rappresentazione di cui potrebbero distinguersi significativamente dalla loro creazione originale.
Riguardo l'importanza di conformità di ogni repository alle specifiche Linee Guida [19] e standard condivisi, è chiaro che tale adeguatezza contribuisce alla uniformità e alla qualità dei metadati di medesimi repository. Al contrario, "abandoning quality control altogether is problematic, because low-quality metadata compromise the effectiveness of services that repositories provide to their users" [20], ciò è ancora più evidente nei servizi di ricerca federati in cui "aggregating metadata from various resources raises practical problems such as incompatibility of different metadata application profiles (AP) or metadata quality" [21]. Quindi è ovvio che
L'approccio formulato appena riportato rappresenta gli strumenti dell'esperimento VOA3R relativo all'indagine sulla completezza dei valori di metadati aggregati nel repository VOA3R attraverso una specifica metrica [23]. Un altro esperimento per la qualificazione dei valori di metadati del medesimo repository è dedicato alla realizzazione di metadati di qualità attraverso la produzione delle mappature consistenti tra gli schemi di metadati diversi come "Dublin Core (DC), Metadata Object Description Schema (MODS), Virtual Open Access Agriculture and Aquaculture Repository Metadata Application Profile (VOA3R AP)" [24], in combinazione con le strutture concettuali del Thesauro AGROVOC, al fine di rassicurare un`effettiva descrizione, la disponibilità e lo scambio automatico tra i metadati di diversi repository cooperanti con VOA3R. Ovviamente,
Gli esperimenti appena descritti insieme con altri studi promotori dei principi e metodi a supporto del materiale di ricerca in rete, lanciati nel corso del progetto VOA3R [26], possono essere ovviamente adottati, personalizzati ed arricchiti da altre comunità di utenti, con lo scopo comune di contribuire ad una serie di Best Practices [27] a sostegno della qualità di Repository Open Access.
Questo contributo fornisce una veloce presentazione delle funzionalità avanzate sviluppate entro il Progetto VOA3R. A tal fine è stata fornita una panoramica degli strumenti utilizzati nella creazione del Repository Open Access VOA3R per completare la granularità dell'uso del materiale di ricerca attraverso diverse funzionalità di navigazione e di valutazione per mezzo dell'approccio consistente, formulato mediante l'unione dei meccanismi del Social e Semantic Web e di metriche valutative di metadati incorporati nel repository per contribuire col valore aggiunto alla diffusione strutturata e partecipativa del materiale di ricerca in rete.
Iryna Solodovnik, Scuola Dottorale Internazionale degli Studi Umanistici (SDISU) - Università della Calabria, e-mail: iryna.solodovnik@gmail.com
[1] Gaston Bachelard (1884-1962) è un illustre epistemologo e autore di numerose riflessioni legate alla conoscenza e alla ricerca.
[2] <http://voa3r.eu/>
[3] D. Le Hénaff - M.-A. Sicilia - L. Gavrilut, Open repositories as social networks: the case of VOA3R 2012, in Open Repositories International Conference 2012 (Edinburgh, U.K.), <https://www.conftool.net/or2012/index.php?page=browseSessions&form_session=16&print=yes>.
[4] Christian M. Stracke - Diane Le Hénaff - Miguel-Angel Sicilia, Community-based research, knowledge sharing and publication facilitated by VOA3R, in European Magazine FOCUS EUROPE, 2012, p. 17, <http://www.c.enter-network.eu/fileadmin/CENTER_UP/Focus_Europe_IV_October_2012.pdf>.
[5] <http://aims.fao.org/>.
[6] K. Jeffery A. Asserson, Institutional Repositories and Current Research Information Systems, "New Review of Information Networking", 14 (2), 2008, p. 71-83, <http://www.tandfonline.com/doi/abs/10.1080/13614570903359357>.
[7] Global Interoperability and Linked Data in Libraries, Special issue (the papers delivered at the Seminar Global Interoperability and Linked Data in Libraries, held on 18th and 19th June, 2012 at the University of Florence), "JLIS.it", vol 4., (2013), 1. Table of Contents: <http://leo.cilea.it/index.php/jlis/issue/view/536>; T. Backer, Linking your resources to the Data Web, "Webinar. Linked Open Data @ AIMS, 4th December 2012", <http://aims.fao.org/linked-open-data-webinars-at-aims/tom-baker>; M. Guerrini T. Possemato, Linked data: un nuovo alfabeto del web semantico, in "Biblioteche oggi", 30 (2012), 3, p. 10, <http://www.bibliotecheoggi.it/content/201200300701.pdf>.
[8] Christian M. Stracke - Diane Le Hénaff - Miguel-Angel Sicilia, cit.; Antonella De Robbio, Forme e gradi di apertura dei dati. I nuovi alfabeti dell'Open Biblio tra scienza e società, "Biblioteche oggi", 30 (2012), 6, p. 16-17, <http://www.bibliotecheoggi.it/content/201200601101.pdf>.
[9] Antonella De Robbio - Silvia Giacomazzi, Dati aperti con LODe, "Bibliotime", 2011, Anno X, n. 2, <http://eprints.rclis.org/16440/>.
[10] Linked Open Data Cloud è un assieme di cataloghi di dataset pubblicati sul web come Linked Data, che contengono collegamenti di dati ad altri insiemi di dati collegati, <http://datahub.io/group/lodcloud>.
[11] C. Caracciolo - A. Stellato - A Morshed - G. Johannsen - S. Rajbahndari - Y. Jaques - Y. Keizer, The AGROVOC Linked Dataset, in Semantic Web Interoperability, Usability, Applicability (an IOS Press Journal), 05/18/2012, <http://www.semantic-web-journal.net/content/agrovoc-linked-dataset>.
[12] "In 1989 Bates introduced berrypicking as a powerful metaphor highlighting that searching is not a linear process but is more accurately described as an activity that is distributed in time and space. From an information seeking perspective there are interesting similarities between berrypicking and real world wayfinding", Christopher P. Lueg - Nicola Bidwell, Berrypicking in the Real World: A Wayfinding Perspective on Information Behavior Research, Proceedings of the American Society for Information Science and Technology, Volume 42, Issue 1, 2005, p. 1, <http://onlinelibrary.wiley.com/doi/10.1002/meet.14504201241/full>.
[13] Linked Open Data-enabled Bibliographical Data (LODE-BD) Recommendations 2.0, 2012, <http://aims.fao.org/community/blogs/lode-bd-recommendations-20-available-aims-now>.
[14] <http://voa3rexperiment12.wordpress.com/>.
[15] <http://eco.logismi.co/events/mtsr2012/>.
[16] P. imek, D. Le Hénaff, M.-A Sicilia, Use of shared central virtual open access agriculture and aquaculture repository, in Open Repositories 2012, cit.
[17] Introduction to Metadata. Second Edition, in Murtha Baca (ed.), The Getty Research Institute, 2008, <http://nsdl.niscair.res.in/bitstream/123456789/954/1/introduction+to+>; B. Stvilia L. Gasser - M. Twidale, A framework for information quality assessment. In Journal of the American Society for Information Science and Technology 58 (12), 1720 -1733 (2007), <http://mailer.fsu.edu/~bstvilia/papers/stvilia_IQFramework_p.pdf>.
[18] S. L. Shreeves, E. M. Knutson, B. Stvilia, C. L. Palmer, M. B. Twidale, T. W. Cole, Is "quality" metadata "shareable" metadata? The implications of local metadata practices for federated collections, in H. A. Thompson (ed.), Currents And Convergence: Navigating the Rivers of Change. Proceedings of the Twelfth National Conference of the Association of College and Research Libraries ALA, Minneapolis, USA, 2005, p. 223-237, <http://mailer.fsu.edu/~bstvilia/papers/ACRL.pdf>.
[19] OpenAIRE Guidelines 2.0, 2012, <http://www.openaire.eu/en/component/content/article/427-openaire-releases-version-20-of-the-openaire-guidelines>; Linee guida per la creazione e la gestione di metadati nei Repository Istituzionali, CRUI, 2012, <http://www.crui.it/HomePage.aspx?ref=2066>.
[20] Xavier Ochoa - Erik Duval, Automatic evaluation of metadata quality in Digital Repositories, in International Journal on Digital Libraries, vol. 10, issue 2-3 , 2009, Springer, p. 67, <http://link.springer.com/article/10.1007%2Fs00799-009-0054-4?LI=true#>.
[21] P. imek - J. Vaněk V. Očenáek - M. Stočes, T. Vogeltanzová, Using Metadata Description for Agriculture and Aquaculture Papers in Agris on-line Papers in Economics and Informatics, volume IV, number 4, 2012, p. 80, <http://online.agris.cz/files/2012/agris_on-line_2012_4_simek_vanek_ocenasek_stoces_vogeltanzova.pdf>.
[22] Marc Goovaerts - Dirk Leinders, Metadata quality evaluation of a repository based on a sample technique, MTSR 2012, 6th Metadata and Semantics Research Conference (Cádiz, Spain), p. 2., <https://uhdspace.uhasselt.be/dspace/handle/1942/14457>.
[23] Ibid.
[24] P. imek - J. Vaněk V. Očenáek - M. Stočes, T. Vogeltanzová, cit., p. 79.
[25] Marc Goovaerts - Dirk Leinders, cit., p. 8.
[26] N. Diamantopoulos - C. Sgouropoulou - K. Kastrantas K - N. Manouselis, Developing a Metadata Application Profile for Sharing Agricultural Scientific and Scholarly Re-search Resources. In Metadata and Semantic Research. Communications in Computer and Information Science, 2011, p. 453-466, <http://voa3r.confolio.org/scam/5/resource/15>; The AGRIS Application Profile for the International Information System on Agricultural Sciences and Technology, Guidelines on Best Practices for Information Object Description, <http://www.fao.org/docrep/008/ae909e/ae909e00.htm>. Altra documentazione tecnica sugli sviluppi del Progetto può essere consultata nell´apposito spazio del Portale VOA3R "Outcomes"/"Deliverables" <http://www.voa3r.eu/outcomes/deliverables>.
[27] A parte di vari Standard e Linee Guida esistenti a supporto dello sviluppo delle funzionalità avanzate di Repository Open Access, vi sono anche diverse comunità promotori dei criteri del successo per i Repository dei contenuti di ricerca. Cfr. il servizio Ranking of Web Repositories, Decalogue of good practices in institutional web positioning, <http://repositories.webometrics.info/en/Best_Practices>; Criteria for successful Repositories, in petermr's blog, A Scientist and the Web, August 19th, 2011, <http://blogs.ch.cam.ac.uk/pmr/2011/08/19/criteria-for-successful-repositories/>.