Recherche dans la collection fait peau neuve

Un nouveau moteur de recherche est en cours de préparation.

Les outils de recherche en ligne fonctionnent grâce à un moteur de recherche qui s’exécute à l’arrière-plan. Nous modifions actuellement celui de Recherche dans la collection pour atteindre plusieurs objectifs : éliminer certaines limites bien connues de la version actuelle, améliorer l’algorithme qui détermine les résultats, proposer de nouvelles fonctionnalités et offrir une interface plus conviviale. Voyez à quoi vous pouvez vous attendre pendant cette transition.

Sur cette page

À quoi s’attendre

Une nouvelle apparence

Nous profitons de l’arrivée du nouveau moteur de recherche pour améliorer l’aspect et la convivialité de Recherche dans la collection, en tenant compte de votre rétroaction :

  • champs personnalisables pour les recherches avancées par mots-clés
  • séparation du formulaire de recherche et des résultats pour que vous puissiez facilement modifier les critères de recherche ou en commencer une nouvelle
  • affichage amélioré des résultats, par exemple grâce à l’ajout des sections Hiérarchie et Instrument de recherche au haut de la page

Deux options de recherche

Nous continuons d’adapter la nouvelle version de Recherche dans la collection à vos besoins. Pendant cette période, vous pourrez essayer la nouvelle mouture ou conserver l’ancienne. Celle-ci ne sera plus modifiée ni améliorée, car nous concentrerons nos efforts sur le nouveau moteur de recherche afin qu’il convienne à tous les chercheurs.

Pour nous aider, faites-nous part de vos commentaires sur la nouvelle version.

Des changements dans vos résultats de recherche

Des résultats plus pertinents

L’ancien moteur de recherche était muni d’un dictionnaire de synonymes intégré. Il retournait donc des résultats supplémentaires en fonction de ces synonymes. Le nouveau moteur donne seulement des résultats en fonction du radical des termes employés.

Afin de mieux servir nos clients dans notre contexte, nous pouvons créer et mettre à jour un dictionnaire de synonymes dans le nouveau moteur de recherche. Par exemple, nous pourrions dresser une liste de synonymes pour les termes autochtones.

Des résultats qui ne sont plus limités par les caractères accentués

Le nouveau moteur de recherche ne tient pas compte des accents dans les mots-clés pour inclure ou exclure des résultats.

Par exemple : Une recherche avec « Québec » donnera tous les résultats avec l’accent, puis ceux avec « Quebec » sans accent.

Fonctionnalités de recherche

Le nouveau moteur de recherche élimine certaines limites de l’ancien. Voici quelques exemples d’améliorations pour les recherches et l’accès :

Nouveau moteur

  •   Jusqu’à 30 000 résultats
  •   5 000 résultats pouvant être exportés
  •   Algorithme personnalisable
  •   Traitement neutre des accents
  •   Nombre exact de résultats
  •   Quantité illimitée de filtres
  •   Possibilité pour nous de modifier la liste de synonymes
  •   Aucun doublon
  •   Possibilité de surligner les résultats
  •   Tous les documents peuvent être trouvés, peu importe leur taille

Ancien moteur de recherche

  •   Jusqu’à 5 000 résultats consultables par recherche
  •   3 000 résultats pouvant être exportés
  •   Algorithme qu’on ne peut pas modifier
  •   Résultats de recherche incohérents à cause des accents
  •   Nombre inexact de résultats dans la section « Limiter à »
  •   Maximum de 100 filtres
  •   Impossibilité pour nous de modifier la liste de synonymes
  •   Doublons dans les résultats
  •   Impossibilité de surligner les mots-clés dans les résultats de recherche
  •   Certains documents impossibles à trouver à cause de leur taille

À propos de l’algorithme

Le nouveau moteur de recherche utilise un algorithme de classement appelé Okapi Best Match 25 (BM25) pour vous retourner les documents les plus pertinents. Cet algorithme tient compte du nombre d’occurrences des termes dans les documents, de leur rareté ou fréquence, et de la longueur des documents.

Advantages

  • L’algorithme classe les documents en fonction de la répartition des termes dans la collection, ce qui le rend adapté aux divers documents et recherches.
  • Il fonctionne bien avec les requêtes qui ont de nombreux termes, car il gère les répétitions et tient compte de la longueur des documents.

Inconvénients

  • L’algorithme ne tient pas compte du sens des termes de recherche ou des documents, et il ne tient pas compte des accents. Les résultats comprennent des homonymes. Par exemple, une recherche du mot « pêche » donne des résultats avec le mot « péché ».
  • Les résultats ne sont pas personnalisés : toutes les requêtes sont traitées de la même manière, donc les résultats ne sont pas adaptés à un utilisateur en particulier.

Recherche de radical

La recherche de radical consiste à ramener un mot à sa racine, c’est-à-dire à sa forme de base. Elle traite plusieurs variantes d’un même mot pour améliorer la précision des résultats. Par exemple, « blanchir », « blancheur » et « blanchâtre » proviennent de la même racine, soit « blanc », et « pêcher » et « pêcheur » viennent de « pêche ». Grâce à ce processus, les ordinateurs comprennent que des variantes d’un mot correspondent à un même concept, ce qui facilite la recherche.

Dans l’ancien moteur, la technique de recherche de radical n’était pas apparente et nous n’étions pas en mesure de la modifier pour répondre aux besoins des chercheurs. Dans le nouveau moteur cependant, la méthode est connue et nous avons un certain contrôle sur la manière dont elle influence les résultats de recherche. La difficulté consiste à nous assurer que la recherche de radical fonctionne aussi bien en français qu’en anglais.

Concrètement, vous obtiendrez probablement plus de résultats fondés sur la racine des mots qu’avec l’ancienne version. Grâce à votre rétroaction, nous pourrons adapter notre approche au fil du temps.