Contrôler la langue pour décrire les sujets traités au Parlement canadien : un défi politique et linguistique
Les mots ont leur importance – particulièrement dans un milieu bilingue truffé de susceptibilités politiques. La Bibliothèque du Parlement, en tant que ressource impartiale qui produit et collige de nombreux documents pour les parlementaires canadiens (et autres intervenants), maintient à l’interne un vocabulaire contrôlé pour faciliter la consultation. Dans cet article, l’auteur présente la Taxinomie des sujets de la Bibliothèque du Parlement et aborde deux défis liés à son développement : la neutralité de la langue et l’équivalence interlinguistique des concepts entre l’anglais et le français.
Alexandre Fortier
Introduction
La Bibliothèque du Parlement, par le biais de son Service d’information et de recherche parlementaires, fournit aux sénateurs et aux députés ainsi qu’aux comités et associations parlementaires des recherches et des analyses sur n’importe quel sujet lié aux politiques publiques. Bon an, mal an, des milliers1 de documents d’information sont ainsi produits par les analystes de la Bibliothèque et conservés dans un système de gestion des documents électroniques. La Bibliothèque est également dépositaire des documents parlementaires de la Chambre des communes et des discours des membres du cabinet2. Pour faciliter le repérage par sujet de cette masse documentaire et également pour optimiser la visibilité par les moteurs de recherche des documents qui, parmi ceux-ci, sont publiés en ligne, la Bibliothèque maintient à l’interne un vocabulaire contrôlé : la Taxinomie des sujets de la Bibliothèque du Parlement. Contrôler la langue, dans un environnement bilingue où les sensibilités politiques peuvent être exacerbées, se rélève être une tâche plus complexe qu’il peut paraître de prime abord. Cet article présente dans un premier temps la Taxinomie des sujets de la Bibliothèque du Parlement, puis discute de deux défis liés à son développement, soit la neutralité de la langue et l’équivalence interlinguistique des concepts entre l’anglais et le français.
Description de la taxinomie
Tout système d’information cherche à augmenter la précision (le nombre de documents pertinents repérés en fonction du nombre documents, pertinents ou non, retournés par le système) et le rappel (le nombre de documents pertinents repérés en fonction du nombre de documents pertinents dans la collection). Or, deux phénomènes issus de la langue naturelle, la synonymie et la polysémie nuisent à la précision et au rappel. La synonymie, d’abord, où un même concept est représenté par différents mots ou expressions (par exemple, les expressions « téléphone cellulaire », « téléphone mobile » et « téléphone portable » représentent le même concept), affecte le rappel : un usager doit penser à tous les synonymes possibles pour s’assurer de retrouver tous les documents sur ce concept. Par opposition, la polysémie, où un même mot représente différents concepts (par exemple, le « droit » est à la fois « l’ensemble des règles juridiques en vigueur dans une société » et « la permission de faire quelque chose en vertu de règles reconnues dans une collectivité »), affecte la précision : sans contrôle de la langue, un usager risque de devoir filtrer un grand nombre de résultats contenant des concepts qui ne l’intéressent pas, mais qui sont représentés par de mêmes mots3.
Les vocabulaires contrôlés ont pour but, d’une part, de contrôler la synonymie en s’assurant que, dans un système d’information donné, un concept n’est représenté que par une seule étiquette (un mot ou une expression). Les synonymes deviennent des clefs d’accès aux étiquettes retenues. D’autre part, les vocabulaires contrôlés éliminent la polysémie en s’assurant que chaque étiquette ne représente qu’un seul concept. La Taxinomie des sujets de la Bibliothèque du Parlement comporte 2492 concepts4 ayant chacun une étiquette en français et une en anglais répartis dans 15 catégories5 couvrant l’ensemble des sujets traités au Parlement, auxquels s’ajoutent des réseaux de synonymes et de quasi-synonymes (4827 en français et 4505 en anglais) qui permettent à l’utilisateur d’accéder aux concepts en utilisant ses propres mots. Une attention particulière est portée aux divers champs lexicaux afin d’offrir pour offrir le plus grand nombre de synonymes possibles. Certains concepts émergents comme « Véhicule zéro émission », pour lesquels plusieurs étiquettes existent, comportent jusqu’à 21 synonymes en français et 24 synonymes en anglais.
La Taxinomie de la Bibliothèque du Parlement organise en outre les concepts en structures hiérarchiques, définies de manière stricte par la norme ISO-25964-16, qui permettent à l’utilisateur d’atteindre le niveau de précision désiré dans la représentation d’un concept. Les descripteurs provenant de diverses hiérarchies sont également liés entre eux par des relations associatives qui permettent à l’usager de trouver des termes potentiellement utiles. Le réseau sémantique de la Taxinomie comporte respectivement 22 634 relations en français et 21 970 en anglais.
Neutralité de la langue
Les langues sont rarement neutres. Dans son ouvrage séminal, Hope Olson7 utilise l’expression « nommer l’information » (naming information) pour décrire l’assignation de termes d’indexation. « Nommer », dit-elle, car cela indique le pouvoir de contrôler la représentation des sujets dans les documents et, par le fait même, l’accès à ceux-ci. Par les étiquettes qu’ils utilisent pour représenter les concepts et les relations qu’ils établissent entre ceux-ci, les vocabulaires contrôlés (et les langages documentaires en général) proposent une représentation du monde. En ce sens, poursuit Olson, nommer l’information esignifie plus que la représenter, mais la construire. Les grands langages documentaires (entre autres les Vedettes-matière de la Bibliothèque du Congrès, la Classification de Library of Congress ou la Classification décimale de Dewey8) ont souvent été critiqués pour leur traitement des groupes qui ne correspondent pas aux standards de la classe dominante, que ce soit en raison de leur genre, de leur orientation sexuelle, de leurs origines ethnique ou culturelle, ou de leurs capacités physiques, entre autres. Par exemple, en donnant comme choix « female executive » (mais pas « male executive ») sous « executive » ou « male nurses » (mais pas « female nurses ») sous « nurses », la Bibliothèque du Congrès prend position — intentionnellement ou non — sur la place de l’homme ou de la femme dans la société.
L’étiquette donnée à un concept influe aussi sur la vision exprimée par le vocabulaire contrôlé. Par exemple, l’étiquette « Indiens d’Amérique » toujours présente dans le Répertoire de vedettes-matière de l’Université Laval9, plutôt qu’un terme plus contemporain comme « Peuples autochtones » témoigne d’une vision colonialiste — ici encore intentionnelle ou non — dans la représentation de ce concept. Parfois, en revanche, le choix d’une étiquette particulière dans un vocabulaire contrôlé est indéniablement délibéré. La retenue, forcée en 2016 par un groupe politique au Congrès des États-Unis, de « Illegal aliens » au lieu du terme plus neutre « Undocumented immigrants » désiré par la Bibliothèque du Congrès dans son vocabulaire contrôlé s’avère être un exemple contemporain patent10.
Dans un environnement comme le Parlement du Canada, les sensibilités politiques teintent également de nombreux débats et le choix des mots importe. Nadine Desrochers11, par exemple, soulève la difficulté de représenter des concepts politiquement chargés, comme pour l’expression du concept de « société distincte », dans les langages documentaires utilisés au Canada. L’impartialité étant l’une des trois valeurs cardinales de la Bibliothèque du Parlement, le choix des étiquettes retenues dans la Taxinomie doit refléter cette valeur. Par exemple, un sujet comme l’aide médicale à mourir, expression retenue pour la loi modifiant le Code criminel, qui a fait l’objet de six projets de loi dans les 41e et 42e législatures, peut également s’exprimer de plusieurs manières : aide au suicide, euthanasie, suicide assisté. Chacune de ces expressions, bien qu’elles soient relativement neutres, porte une certaine charge émotive selon que l’on se trouve d’un côté ou de l’autre du débat. L’analyse des débats à la Chambre des communes indique, par exemple, que les termes « euthanasie » et « suicide assisté », plus crus que l’expression euphémique retenue pour la loi, sont utilisés plus fréquemment par les opposants à ce changement au Code criminel12. Le degré de neutralité d’un mot ou d’une expression s’ancre en outre dans un contexte culturel et peut varier d’une langue à l’autre, l’équivalence interlinguistique parfaite étant loin d’être universelle.
Équivalence interlinguistique entre le français et l’anglais
Un vocabulaire contrôlé contient des concepts qui sont représentés par des termes liés les uns aux autres par une structure relationnelle. Dans un vocabulaire contrôlé monolingue, cette structure relationnelle est composée des relations d’équivalence intralinguistique, hiérarchiques et associatives. Ces trois types de relations servent à définir les concepts représentés. Un concept est défini à la fois par l’étiquette retenue pour le représenter et les synonymes qui lui sont attachés, par la hiérarchie dans lequel il s’inscrit qui lui transmet par transitivité les propriétés héritées des concepts aux niveaux supérieurs et, dans une moindre mesure, par les termes qui y sont liés dans par une relation associative.
Les langues sont l’expression d’univers conceptuels et relationnels complexes. Un concept n’existe pas nécessairement de manière identique d’une langue à l’autre. Dans un vocabulaire contrôlé multilingue, comme la Taxinomie des sujets de la Bibliothèque du Parlement, s’ajoute la relation d’équivalence interlinguistique. Les normes qui encadrent la création de vocabulaires contrôlés, comme ISO 25964-1:2011, décrivent d’ordinaire cinq degrés d’équivalence interlinguistique :
L’équivalence exacte : équivalence décrivant la même réalité (« travailleur étranger » et « foreign worker ») ;
L’équivalence inexacte : équivalence présentant le même concept, mais avec une différence dans le point de vue exprimé (par exemple, « assurance-chômage » et « employment insurance ») ;
L’équivalence partielle : équivalence liant deux concepts dont l’extension est différente (par exemple « accessibilité pour personnes handicapées » et « barrier-free access », le second étant un concept plus large que le premier) ;
L’équivalence de simple à multiple : équivalence mettant en relation un concept dans une langue A à plusieurs concepts dans une langue B (par exemple, « droit » avec « law » et « right » ou « law » avec « droit » et « loi ») ;
La non-équivalence : présence d’un concept d’une langue A qui n’existant pas dans une langue B (par exemple, « teenager » [jeune âgé de 13 à 19 ans] est propre à l’anglais).
Le défi, dans un vocabulaire contrôlé multilingue, repose d’abord sur le traitement adéquat des degrés trois à cinq de l’équivalence interlinguistique. La relation d’un concept avec d’autres concepts peut par ailleurs différer d’une langue et d’une culture à l’autre. Par exemple, certaines cultures peuvent traiter les animaux comme des « biens », alors que cette hiérarchie serait totalement incompréhensible dans une autre culture. Un vocabulaire contrôlé multilingue doit présenter une structure hiérarchique et associative commune aux communautés linguistiques à qui il sert. Le développement de la Taxinomie des sujets de la Bibliothèque du Parlement nécessite donc le souci qu’une langue ne prenne pas le dessus sur une autre. Pour éviter cet écueil, elle aspire à représenter adéquatement les concepts et les structures relationnelles qui les entourent de manière à ne pas créer des termes qui ne soient pas compris par les locuteurs d’une des langues et à ne pas forcer une langue à entrer dans une structure relationnelle qui ne serait pas reconnue par ses locuteurs. Pour y parvenir, la taxinomie est construite ou modifiée simultanément en français et en anglais. Les connaissances des analystes du Service d’information et de recherche parlementaires de la Bibliothèque sont également mises à profit et servent de caution dans le choix des termes et de leur intégration dans une structure hiérarchique.
Conclusion
Un vocabulaire contrôlé n’est pas un produit statique ; pour rester pertinent, il doit représenter l’évolution des connaissances tout autant que celle du lexique du ou des domaines qu’il couvre. Au Parlement du Canada, par exemple, la terminologie employée pour parler des peuples autochtones ou des identités de genre a évolué au fil du temps, et ces changements sont reflétés dans la Taxinomie des sujets de Bibliothèque du Parlement. La fréquence d’utilisation des termes par les indexeurs et les stratégies de recherche des chercheurs doivent également faire l’objet d’une évaluation périodique pour assurer que le vocabulaire demeure pertinent pour la communauté qu’il dessert. Certains de ces défis, qui sont communs à la création de tout vocabulaire contrôlé, revêtent une importance particulière dans le contexte de la Bibliothèque du Parlement, notamment dans l’utilisation d’un vocabulaire le moins partisan possible et d’une équivalence interlinguistique entre l’anglais et le français où aucune des deux langues — ni aucun des contextes culturels qui les sous-tendent — n’a préséance sur l’autre. L’exercice intellectuel nécessaire pour la création d’un tel vocabulaire ne doit cependant pas prendre le pas sur le but premier de l’outil : faciliter le repérage d’information. Il faut ainsi apprendre à tolérer certaines solutions imparfaites, mais utiles pour l’utilisateur.
Notes
1 Par exemple, en 2017-2018, la Bibliothèque a reçu 5659 demandes de recherche et d’analyse et produit 176 publications de recherche (Bibliothèque du Parlement, « Rapport annuel 2017-2018 », Ottawa, Bibliothèque du Parlement, 2018).
2 En 2017-2018, 1228 documents parlementaires et 970 discours ont été catalogués par la Bibliothèque.
3 Lancaster, F.W., « Indexing and abstracting in theory and practice », 3e éd., Champaign, Ill., University of Illinois, 2003, p. 252 à 258; Hudon, Michèle, « Analyse et représentation documentaires », Montréal, Presses de l’Université du Québec, 2013, p. 93 à 98.
4 L’ensemble des statistiques pour la Taxinomie est donné en date du 15 novembre 2019.
5 Affaires autochtones ; affaires internationales et défense ; affaires sociales et communautaires ; agriculture, environnement, pêches et ressources naturelles ; arts, culture et divertissement ; économie et finances ; éducation, langue et formation ; emploi et travail ; gouvernement, Parlement et politique ; industrie, entreprises et commerce ; information et communications ; lieux ; lois, justice et droits ; santé et sécurité ; science et technologie.
6 ISO 25964-1, « Information et documentation — Thésaurus et interopérabilité avec d’autres vocabulaires — Partie 1 : Thésaurus pour la recherche documentaire », Genève, Organisation internationale de normalisation, 2011.
7 Olson, Hope, « The power to name: locating the limits of subject representation in libraries », Dordrecht, Pays-Bas, Kluwer, 2002, p. 3 à 6.
8 Ces trois langages documentaires sont les standards les plus utilisés dans les bibliothèques nord-américaines.
9 Ce vocabulaire contrôlé est une adaptation en français et en contexte canadien des Vedettes-matière de Bibliothèque du Congrès.
10 American Library Association, « Resolution on replacing the Library of Congress Subject Heading “Illegal aliens” with “Undocumented immigrants” », 2006. Document consultable au http://www.ala.org/aboutala/sites/ala.org.aboutala/files/content/governance/council/council_documents/2016_mw_council_documents/cd_34_Resol_on_LC_Headings_11216_FINAL.pdf; Rahman, Rema et Warren Rojas, « Republicans want to bring back “Illegal Alien” », Roll Call, 20 avril 2016. Document consultable au http://www.rollcall.com/news/policy/dems-fume-illegal-alien-reinstatement-effort.
11 Desrochers, Nadine, « Équivalences énigmatiques : représentation du Québec en tant que société distincte dans les systèmes de vedettes-matière », Revue canadienne des sciences de l’information et de bibliothéconomie, vol. 37, no 1, 2013, p. 1 à 23.
12 Recherche dans le Hansard.