«Bibliotime», anno XVIII, numero 2 (luglio 2015)

Precedente Home Successiva



Giovanna Aracri e Maria Teresa Guaglianone

Terminologia e organizzazione della conoscenza nel settore delle Costruzioni



Abstract

The need to exchange information and to communicate by using a common language within the Construction industry derives from various factors, such as: the relevance that the sector has for the economy of the country, despite the period of financial crisis; the heterogeneous presence of operators and of terminology used; the continuous technological and legislative evolution. A lexicon of reference for the entire chain offers advantages in facilitating communication, through the reduction of misunderstanding and miscommunication. Considering this premise, the lexicon realized by the Construction Technologies Institute of the National Research Council (Italy) within the project INNOVance, aims to be the reference language for the exchange of information at different levels within the building construction sector. Moreover, since it is not a 'flat' lexicon, it is also proposed as a tool for organizing knowledge. In fact, the lexicon INNOVance is a specialized and structured lexicon, i.e. a set of terms, used consensually and conventionally by those working in the field, which is structured thanks to semantic relations that identify the conceptual framework. The lexicon INNOVance is not conceived as the only way of communication, but rather it seeks to steer towards a more coherent use of language, without losing the communicative richness of terminology commonly used in the sector.

1. Introduzione

I sistemi di organizzazione della conoscenza (Knowledge Organization Systems - KOS) sono strumenti estremamente efficaci nella rappresentazione e gestione delle informazioni in contesti digitali [1]. L'insieme di questi strumenti (risorse terminologiche, sistemi di classificazione, thesauri, reti semantiche, ontologie, ecc.) è utilizzato per sistematizzare ed esplicitare la concettualizzazione di un dominio e supportare l'organizzazione, la gestione e il recupero delle relative informazioni, con effetti positivi sull'interoperabilità semantica.

L'assenza e/o l'inadeguatezza di strumenti di gestione delle informazioni, soprattutto in alcuni domini specialistici – quale il settore delle costruzioni, ambito applicativo oggetto di interesse – può causare incomprensioni e/o perdita di informazione. L'attenzione verso il dominio delle costruzioni è dovuta ad una serie di fattori quali: la rilevanza che esso assume nell'economia del Paese; l'evoluzione tecnologica e normativa che lo interessa; l'eterogeneità degli operatori coinvolti nel processo edilizio e della terminologia adottata.

Per agevolare gli scambi comunicativi ed indirizzare gli operatori della filiera delle costruzioni verso un uso più coerente della terminologia, è stato realizzato il lessico INNOVance, risultato di dell'attività di ricerca condotta dall'Istituto per le Tecnologie della Costruzione del Consiglio Nazionale delle Ricerche (ITC-CNR), nell'ambito dell'omonimo progetto [2], il cui obiettivo generale ha riguardato la messa a punto di una banca dati in cui raccogliere, organizzare e codificare i soggetti, gli oggetti e le azioni che intervengono nella filiera edilizia, al fine di ottimizzare la qualità degli scambi comunicativi a diversi livelli [3].

2. Il lessico INNOVance

Il lessico INNOVance raccoglie la terminologia di settore inerente ai prodotti da costruzione e propone, allo stesso tempo, una rappresentazione della conoscenza di domino, messa in evidenza dall'organizzazione dei termini in una rete di relazioni semantiche. La sua natura fa sì che esso possa essere definito specialistico e strutturato:

Il lessico INNOVance, basandosi sui principi e sui criteri specificati nella norma UNI 11337:2009 Edilizia e opere di ingegneria civile - Criteri di codificazione di opere e prodotti da costruzione, attività e risorse - Identificazione, descrizione e interoperabilità, ha lo scopo di indirizzare gli operatori del settore verso un uso più coerente del linguaggio senza perdere la ricchezza comunicativa propria della terminologia d'uso comune. Più precisamente, il lessico ospita e sistematizza la terminologia concernente i prodotti da costruzione recanti la Marcatura CE [4] e attestati nel corpus documentale di riferimento, realizzato per supportare l'estrazione dei termini e le successive attività di analisi e sistematizzazione.

2.1 Metodologia di costruzione del lessico

Il corpus realizzato si compone di un insieme omogeneo di documenti autorevoli di riferimento per il settore ed è basato, quindi, su un linguaggio di tipo settoriale (special purpose corpus) [5]. La collezione documentale è essenzialmente composta da norme tecniche armonizzate, norme tecniche di prodotto, legislazione europea e nazionale, documenti tecnici e manuali redatti dalle Associazioni di Categoria.

Tra le fonti scelte è stata stabilita una gerarchia, fondamentale per determinare il grado di preferenza di un termine. Al vertice della suddetta gerarchia si trovano le norme armonizzate, a seguire la legislazione di riferimento e le norme tecniche di prodotto e, infine, i documenti tecnici.

Per quanto riguarda la natura fisica dei documenti, il corpus è composto da documenti non strutturati che si presentano in formato .pdf protetto, trattandosi di norme sottoposte a copyright, o in formato cartaceo, formati quindi che non permettono di condurre sui testi analisi di tipo automatico. Ragion per cui si è deciso di procedere manualmente sia per l'analisi dei contenuti sia per l'estrazione dei termini che identificano i prodotti da costruzione. In particolare, sono state oggetto di analisi le sezioni dedicate alla terminologia, le eventuali classificazioni e i riferimenti espliciti ad una qualsiasi forma di sistematizzazione dei concetti.

Per l'identificazione dei termini da estrarre si è fatto ricorso, innanzitutto, ad eventuali classificazioni dei prodotti da costruzione presenti nelle norme armonizzate e nei documenti legislativi.

Facendo riferimento alla già citata gerarchia stabilita tra i documenti di riferimento, sono stati immediatamente considerati come preferiti i termini presenti nelle norme armonizzate, i quali costituiscono la base del lessico specialistico.

La fase successiva, ha previsto la sistematizzazione sotto forma di lista strutturata delle informazioni raccolte, al fine di rappresentare ed organizzare la conoscenza del dominio e renderla contemporaneamente accessibile e riutilizzabile.

Il lessico risulta strutturato in base alle tre categorie di relazioni semantiche fra i termini tipicamente impiegate per la realizzazione dei thesauri [6]:

La relazione di equivalenza fra termini prevede di assegnare ad un termine uno o più Sinonimi, inclusi acronimi e varianti morfologiche, ed ha essenzialmente lo scopo di consentire l'accesso al lessico e all'informazione attraverso una terminologia più ricca. Grazie alla relazione di equivalenza, sebbene, siano stati privilegiati come sinonimi i termini rintracciati all'interno delle norme armonizzate, è stato possibile tenere traccia anche dei termini riscontrati nell'uso comune o in altre tipologie di documenti. Così facendo, gli utenti hanno la possibilità di accedere all'informazione di interesse in maniera semplice, pur venendo orientati verso l'uso corretto e condiviso dei termini.

La relazione di tipo gerarchico, espressa dall'organizzazione dei termini in Iperonimi e Iponimi, non fa altro che restituire una rappresentazione dei termini in sovraordinati e sottordinati semantici. I termini così collegati, permettono all'utente di navigare nella struttura arborescente proposta e personalizzare la ricerca, scegliendone il grado di specificità in base alle proprie esigenze.

La relazione associativa, del tipo "vedi anche" è utilizzata, invece, per collegare termini sulla base del significato e del contesto d'uso.

Come accennato in precedenza, la strutturazione secondo le relazioni thesaurali tipiche, fa sì che il lessico si presenti in un formato leggibile e flessibile, prestandosi a diverse possibilità di sviluppo, ad esempio all'eventuale conversione in un thesaurus. La metodologia impiegata per la definizione delle relazioni semantiche e il significato che le relative etichette veicolano sono, infatti, conformi ai principi dettati dalla ISO 25964-1:2011 Information and documentation – Thesauri and interoperabiliy with other vocabularies - Part1: Thesauri for information retrieval.

Sulla base di queste considerazioni, sono state costruite delle schede terminologiche: esiste una scheda per ciascun termine, la quale può essere collegata ad altre schede tramite rinvii che danno evidenza delle relazioni semantiche fra i termini.

La scheda terminologica contiene ulteriori informazioni rilevanti riguardanti un dato termine, tra cui:

Per un'esemplificazione della struttura relazionale dei termini fornita dalla scheda terminologica, si riporta di seguito il caso del termine Finestra con l'indicazione dei rispettivi iperonimi, iponimi e termini correlati.

Figura 1 – Esempio di scheda terminologica del lessico INNOVance.

 

La predisposizione di una scheda terminologica così concepita consente di tenere traccia del contesto all'interno del quale un dato termine si colloca, favorendo la disambiguazione grazie all'organizzazione concettuale data dalle relazioni semantiche.

Il lessico è disponibile online ed è interamente consultabile all'indirizzo <www.innovance.it/lessico>.

3. Conclusioni e prospettive

In conclusione, la funzione primaria del lessico INNOVance è quella di orientare gli operatori del settore verso un uso più coerente e condiviso dei termini utilizzati per denominare i prodotti senza, senza perdere la varietà che caratterizza il linguaggio d'uso comune nel settore. L'intento è, infatti, di far coesistere i due aspetti di normalizzazione del linguaggio e di conservazione della ricchezza comunicativa.

Il lessico INNOVance è una risorsa terminologica in divenire, l'intenzione è di continuare nella sua implementazione arricchendo e aggiornando i termini e la struttura, così da ampliare le finalità e gli ambiti di utilizzo, al di là degli specifici scopi del progetto. In particolare, si intende potenziare la componente multilingue del lessico, adeguarlo agli standard del web semantico e allinearlo ad altre risorse terminologiche di ambito generale e di dominio.

Giovanna Aracri, ITC-CNR, e-mail: aracri@itc.cnr.it
Maria Teresa Guaglianone, ITC-CNR, e-mail: guaglianone@itc.cnr.it


Note

[1] Lei Zeng M., Knowledge Organization Systems (KOS), "Knowledge Organization", 35 (2008), 2/3, p. 160.

[2] Progetto INNOVance <http://www.innovance.it>.

[3] Alberto Pavan - Fulvio Re Cecconi - Sebastiano Maltese - Elisabetta Oliveri - Giovanna Aracri - Maria Teresa Guaglianone, La scheda prodotti interattiva di INNOVance, "Costruire in Laterizio", 155 (2013), p. 60-63.

[4] Unione Europea, Prodotti da costruzione - Regolamento CPR 305/2011, 2011.

[5] Di Tengku Sepora Tengku Mahadi - Helia Vaezian - Mahmoud Akbari, Corpora in Translation: A Practical Guide, Bern, Peter Lang, 2010.

[6] Vanda Broughton, Costruire thesauri, Milano, Editrice Bibliografica, 2008.




«Bibliotime», anno XVIII, numero 2 (luglio 2015)

Precedente Home Successiva


URL: http://static.aib.it/aib/sezioni/emr/bibtime/num-xviii-2/aracri.htm