3.1 Introduzione

In un linguaggio di indicizzazione che usa gli elementi del linguaggio naturale per rappresentare i concetti, il controllo del vocabolario o controllo terminologico consiste di due funzioni fondamentali: l'una riguarda il controllo della forma dei termini (morfologia); l'altra la strutturazione del vocabolario, vale a dire l'organizzazione semantica o classificatoria, ottenuta mediante l'indicazione delle relazioni a priori tra i termini.

La prima funzione tende ad assicurare l'omogeneità del linguaggio dal punto di vista formale, facendo sì che la forma dei termini dipenda da criteri certi e stabili. Le tre aree più importanti di applicazione dei principi morfologici sono quelle del numero (uso del singolare e del plurale), dei termini composti (termini da mantenere nella forma composta o da scomporre), dell'omografia (modalità per disambiguare termini cui sono associati nel linguaggio naturale più significati). Nel presente documento viene affrontata anche la problematica relativa ai nomi propri, per la loro rilevanza nei cataloghi per soggetti.

La seconda funzione tende ad integrare un sistema ad accesso casuale, come è appunto un sistema ordinato alfabeticamente, con una struttura classificatoria, che raggruppi i termini in base all'appartenenza di classe dei concetti che essi rappresentano. Questo scopo viene raggiunto di norma attivando una rete, di cui ogni termine è un nodo, che evidenzi tutte le relazioni a priori (gerarchiche, associative, di equivalenza), cosicché sia possibile, a partire da qualsiasi punto della rete stessa, visualizzare le relazioni di un termine con i termini ad esso sovraordinati, subordinati o associati e, per ciascuno di questi, le relazioni con altri termini, e così via.

Non è compito di queste raccomandazioni descrivere le tecniche di costruzione, le forme di presentazione e i metodi di gestione del vocabolario. Il controllo della forma dei termini e l'indicazione delle loro relazioni a priori sono trattate qui come funzioni complementari alla descrizione del soggetto del documento. Esiste, infatti, un'interazione tra la parte sintattica e quella semantica del linguaggio di indicizzazione. Per esempio, le scelte riguardanti la scomposizione dei termini composti influiscono in modo determinante sulle dimensioni e la complessità del vocabolario; così come un vocabolario controllato e strutturato consente di eliminare dalla stringa di soggetto incongruenze e ridondanze e di adottare una politica di indicizzazione specifica.

Le presenti raccomandazioni si ispirano in gran parte ai principi e ai criteri dello standard internazionale corrente ISO 2788-1986 (vedi 0.2). Si tratta, infatti, di principi e criteri espliciti, rigorosi e di validità generale. Inoltre, del thesaurus viene adottata qui la struttura a tre relazioni, che permette un controllo efficace delle relazioni semantiche. In effetti, il thesaurus rappresenta lo strumento di controllo terminologico ritenuto più idoneo in un contesto tecnologicamente avanzato. Tuttavia, l'applicazione dei criteri contenuti in queste raccomandazioni non implica la scelta di un tipo particolare di vocabolario.

Tali criteri, come è illustrato nel paragrafo successivo, fanno riferimento al modello dell'analisi categoriale o analisi a faccette. La scelta di questo metodo si basa sulle seguenti considerazioni:

a)  è generalmente riconosciuto come il metodo più idoneo a garantire la coerenza nell'analisi e nel controllo del vocabolario;
b)  è un metodo affine e complementare a quello impiegato nell'analisi delle relazioni sintattiche;
c)  favorisce l'omogeneità tra vocabolari diversi, in quanto detta criteri rigorosi e stabili.

[g3] -- [g31] -- [g32]


© AIB - EG, 1997-06 (rev. 1997-10-17). Versione sperimentale WWW corrispondente a Guida all'indicizzazione per soggetto / GRIS. - Roma : AIB, 1996 // P. 59-60

[Indice GRIS]