Qu'est-ce que c'est un thesaurus ?

Un thésaurus, c'est un ensemble structuré de mots clés qui est utilisé dans un système de documentation pour rendre de manière univoque les notions contenues dans un document. Il s'agit donc d'un instrument qui sert à formaliser la terminologie utilisée par l'auteur d'un texte. Comme les auteurs des documents sont libres dans le choix des mots, leur langage n'est souvent pas univoque (utilisation de synonymes par exemple), si bien qu'en procédant à une recherche classique dans un texte, on n'obtient pas toujours le résultat escompté.

Le thésaurus est aussi un outil de recherche. Comme l'utilisateur a accès au vocabulaire de l'indexeur, les deux parties peuvent utiliser les mêmes termes pour désigner les mêmes concepts. Les potentialités d'un thésaurus apparaissent de manière encore plus évidente dans un environnement multilingue. L'indexation et la recherche peuvent se faire dans une autre langue grâce au lien que constitue le thésaurus multilingue.

En pratique, un thésaurus se compose de concepts structurés selon une série de catégories (domaine, micro-thésaurus, descripteur, non-descripteur) et de liens entre les concepts. Citons comme exemples de liens types : terme plus spécifique (NT : narrower term), terme plus général (BT : broader term), terme apparenté (RT : related term) et le lien entre un descripteur et ses synonymes ou non-descripteurs (UF : used for).

concurrentierecht
 MT concurrentie
 UF concurrentieregeling, concurrentievoorschriften
    NT1 controle op concentraties
    NT1 anti-dumpingwetgeving
       NT2 anti-dumingheffing
       NT2 anti-dumpingmaatregel
    NT1 anti-trustwetgeving
    NT1 anti-subsidieprocedure
    NT1 kartelvoorschriften
       NT2 toegestaan kartel
       NT2 aanmelding van kartel
       NT2 ontheffing van kartelvergunning
 RT handelsrecht
 RT vennootschapsrecht
 RT internationaal economisch recht
 RT gemeenschappelijke onderneming
 RT multinationale onderneming
droit de la concurrence
  MT concurrence
  UF réglementation de la concurrence
     NT1 contrôle des concentrations
     NT1 législation antidumping
        NT2 droits antidumping
        NT2 mesure antidumping
     NT1 législation antitrust
     NT1 procédure antisubvention
     NT1 réglementation des ententes
        NT2 autorisation d’entente
        NT2 déclaration d’entente
        NT2 exemption d’autorisation d’entente
  RT droit commercial
  RT droit des sociétés
  RT droit international économique
  RT entreprise commune
  RT entreprise multinationale

Le Sénat utilise également le thésaurus Eurovoc pour l'indexation de ses publications. Eurovoc est un thésaurus multilingue qui a été développé par les services du Parlement européen. Comme instrument d'indexation et de recherche, il présente certainement des lacunes mais comme il n'existe pas d'autre solution, le Sénat a opté pour ce système, comme d'autres assemblées. De par son origine européenne, l'édition standard d'Eurovoc ne contenait pas de mots clés spécifiquement belges comme Sabena, Maribel, Conseil supérieur de la Justice, etc. Pour pallier les lacunes, le Service de documentation du Sénat a étoffé l'édition standard en y ajoutant une série de termes usuels dans le contexte belge. Dans le navigateur Eurovoc, formulaire de recherche des registres, ces termes belges sont désignés par la lettre (B).