3.2 Analisi categoriale

Nella parte dedicata alla costruzione delle stringhe di soggetto sono stati illustrati criteri e metodi di analisi e di espressione delle relazioni sintattiche, ossia dei legami tra i concetti presenti in un soggetto. Il controllo delle relazioni sintattiche costituisce una delle due dimensioni o componenti del linguaggio di indicizzazione. L'altra, distinta e complementare, è costituita dal controllo delle relazioni semantiche, ossia dei legami tra i concetti presenti nel soggetto di un documento ed altri concetti ad essi collegati sulla base del significato.

La distinzione tra i due tipi di relazioni può essere illustrata con il seguente diagramma:

[970620.EG Diagramma, in preparazione]

Le relazioni sintattiche sono dette a posteriori e dipendenti dai documenti, poiché esistono in quanto enunciate esplicitamente in un documento, e vengono stabilite di volta in volta sulla base del ruolo che ciascun concetto svolge all'interno del soggetto. Per esempio, nell'enunciato di soggetto «Formazione professionale degli infermieri in Toscana» i concetti «formazione professionale», «infermieri», «Toscana» non sono correlati se non come componenti del soggetto di un documento.

Le relazioni semantiche sono dette a priori e indipendenti dai documenti, poiché esistono a prescindere dalle relazioni presenti nel soggetto del documento, e vengono stabilite una volta per tutte tra ciascun concetto del soggetto ed altri concetti presenti implicitamente, in quanto facenti parte di strutture comuni di riferimento [5]. Per esempio, un concetto come «operatori sanitari» non è necessario alla formulazione dell'enunciato di soggetto «Formazione professionale degli infermieri in Toscana» (e, per questo, è escluso dalla stringa); è, tuttavia, implicito nella definizione di «infermieri» e può servire per la ricerca di documenti rilevanti su quel soggetto.

Entrambi i tipi di relazioni poggiano sulle categorie e sull'analisi categoriale. È indispensabile, tuttavia, precisare le peculiarità del concetto di categoria nel contesto del controllo terminologico.

Sul piano sintattico, i termini categoria e analisi categoriale si riferiscono alla funzione logica che un concetto svolge nella stringa, ossia al suo ruolo grammaticale in rapporto agli altri concetti del soggetto. Si tratta, dunque, di una funzione definita dalle relazioni che si stabiliscono all'interno di un insieme particolare di fenomeni studiato in un documento, tanto che in soggetti diversi lo stesso concetto può svolgere funzioni diverse (p.e., di oggetto, agente, elemento dipendente ecc.). L'intercambiabilità dei ruoli non è, comunque, assoluta: normalmente, un termine che rappresenta un'entità non potrà svolgere la funzione di azione, che è invece associata a termini denotanti attività. È quest'ultima caratteristica che avvicina in qualche modo la categoria sintattica a quella semantica: c'è un residuo di significato, un minimo comun denominatore, che sottende entrambi i tipi di categorie e le fa appartenere a categorie generali mutualmente esclusive, riconducibili alla distinzione fondamentale tra entità e attività.

L'analisi categoriale applicata al controllo terminologico, ha una funzione diversa dall'analisi sintattica: le categorie fondamentali non definiscono il ruolo di un termine nella stringa, bensì il suo contenuto semantico, indicandone la classe generale di appartenenza. L'analisi consiste nel formulare un giudizio di appartenenza categoriale, con il quale un concetto, sulla base dell'idea generale che esprime, è riferito ad una categoria fondamentale (un oggetto, un materiale, un'attività, una proprietà ecc.).

Le categorie fondamentali individuano e danno un nome alle macrostrutture semantiche di un vocabolario, identificano cioè i principi generali che servono a definirne la struttura; costituiscono, insomma, le classi generali del vocabolario.

Oltre a questa funzione essenziale di strutturazione del vocabolario, le categorie servono a guidare l'analisi in alcune procedure di controllo terminologico, come quelle riguardanti la scelta tra la forma singolare e plurale di un termine (vedi 3.3.1) oppure l'ammissibilità di una relazione gerarchica (vedi 3.4.4).

Ai fini dell'identificazione dei ruoli, sono state individuate le categorie fondamentali delle entità e delle attività; per le operazioni di controllo del vocabolario, si propone questo elenco esemplificativo di categorie generali:

Agenti
  Organismi
  Persone, gruppi
  Organizzazioni
Attività
  Azioni
  Avvenimenti
  Processi
  Discipline
Strumenti
  Oggetti, attrezzature
  Strutture
  Forme
  Credenze e sistemi ideologici
Proprietà
Materiali
Spazio
Tempo

In 2.1.1 sono state illustrate alcune modalità di analisi dell'enunciato di soggetto, allo scopo di facilitare il riconoscimento delle funzioni logiche che vi svolgono i diversi concetti; analogamente, vengono suggeriti qui alcuni criteri generali di analisi categoriale applicata al controllo del vocabolario e, in particolare, i principi in base ai quali determinare l'appartenenza categoriale di un termine.

Pur trattandosi di categorie fondamentali, non si deve pensare ad esse come a nozioni immutabili. Si tratta piuttosto di strumenti analitici, la cui individuazione deve essere funzionale alla struttura disciplinare della letteratura da indicizzare, come pure ai bisogni degli utenti. Sulla base di questi criteri, l'appartenenza categoriale di un termine può variare a seconda del contesto.

Tuttavia, se la struttura della disciplina e i bisogni degli utenti sono criteri validi e di applicazione relativamente facile in un contesto specializzato, molto meno lo sono in un contesto generale, non limitato ad un particolare campo disciplinare. Dunque, ai principi propri della specializzazione, che pure vanno tenuti presenti, occorre aggiungere un criterio di applicabilità generale.

Questo criterio si può ricondurre al principio della definizione tipica: l'appartenenza categoriale di un concetto è determinata in base alle caratteristiche o attributi essenziali presenti nella sua definizione, che hanno la funzione di riferire il concetto ad una categoria indipendente dal contesto, valida cioè in ciascuno dei differenti ambiti nei quali il concetto può comparire. Si tratta, in altre parole, della definizione che esprime il suo significato di base. Dunque, come è possibile per qualunque termine individuare un significato principale o tipico, così è possibile determinarne un'appartenenza categoriale tipica.

Tale appartenenza categoriale è generalmente riconosciuta e condivisa e può essere stabilita facilmente mediante una corretta analisi della definizione del termine, facendo riferimento ad opere standard come dizionari o enciclopedie.

[5] Una struttura comune di riferimento è un insieme di concetti e relazioni generalmente riconosciuto e condiviso.

[g31] -- [g32] -- [g33]


© AIB - EG, 1997-06 (rev. 1997-10-17). Versione sperimentale WWW corrispondente a Guida all'indicizzazione per soggetto / GRIS. - Roma : AIB, 1996 // P. 60-63

[Indice GRIS]