Articles techniques / Qu’est-ce que la recherche hybride ?
Recherche

Qu’est-ce que la recherche hybride ?

Michael Eggleton
Écrit par Michael Eggleton
Publié 2024-07-25
Qu’est-ce que la recherche hybride ?

À mesure que l’ère numérique évolue, le volume et la complexité des informations ne cessent de croître. Trouver votre aiguille dans cette botte de foin en perpétuelle expansion est donc plus difficile, mais plus crucial que jamais. Notre vie et notre travail sont bien souvent tributaires de notre capacité à trouver ces éléments d’information. Ce constat est particulièrement valable dans des domaines comme la santé, où trouver la bonne réponse au bon moment peut faire toute la différence. 

Au cours des dernières années, la technologie de recherche a connu d’importantes avancées pour suivre le mouvement. Nous sommes passés de la simple recherche par mots-clés à la recherche sémantique plus avancée pour en arriver à la recherche hybride alimentée par l'IA.

Mais qu'est-ce que la recherche hybride et pourquoi a-t-elle vu le jour? Cet article se penche sur les différences des méthodes afin que vous puissiez déterminer quelle approche de recherche est la plus adaptée à vos besoins.

Dans cet article

  • Comprendre la requête — la pierre angulaire d’une recherche efficace

  • Recherche par mots-clés : faire correspondre les mots exacts

  • Recherche sémantique : au-delà des mots-clés

  • Recherche hybride : le meilleur des deux mondes

Le fondement de toute recherche : bien comprendre la requête

Les moteurs de recherche fonctionnent généralement en suivant une structure commune : comprendre et traiter la requête, trouver tous les résultats correspondants, puis les classer en fonction de leur pertinence par rapport  à la recherche initiale et à d'autres règles prédéfinies.

Cette première étape est aussi l’étape la plus critique, sans laquelle il ne saurait y avoir de bonnes réponses.  Lorsqu’il s’agit de comprendre et de traiter la requête, il existe deux principaux types de technologie sous-jacente : la recherche par mots-clés et la recherche sémantique. 

Recherche par mots-clés: La correspondance des mots

La  recherche par mots-clés, soit la plus conventionnelle, repose sur l’idée de repérer les mots correspondants à travers l’ensemble de vos données, à l’instar de l'index d'un livre qui permet de trouver précisément l'endroit où se trouve l'information.

Recherche par mots-clés


💡 Une démonstration du fonctionnement de la recherche par mots-clés en santé

🔍 Recherche des « antécédents de diabète » dans le DME

  1. Le moteur de recherche trouvera tous les résultats correspondant aux termes « antécédents de diabète ». Selon la configuration, il recherchera les correspondances entre « antécédents de diabète », « diabète » et « antécédents » (un opérateur ET), ou « diabète » ou « antécédents » (un opérateur OU). Sur la base de cette règle d’opérateur, les résultats seront très différents, sans tenir compte de la finalité de la requête.

  2. Le système classe ces résultats en fonction de différents facteurs de pertinence, comme la fréquence. Par exemple, les résultats où les « antécédents de diabète » sont mentionnés fréquemment et de façon proéminente risquent d’être mieux classés.


La recherche par mots-clés en action : avantages et inconvénients

La recherche par mots-clés est optimale pour obtenir rapidement des résultats cohérents, qui correspondent aux mots utilisés dans la requête. En général, cette méthode est la plus efficace pour trouver un nom, un numéro de téléphone ou un terme spécifique. Si vous savez exactement ce que vous recherchez — et que vous disposez des bons mots-clés — vous pouvez trouver les résultats très rapidement.

Cependant, cette méthode a également ses limites. Elle dépend largement de la capacité de l’utilisateur à spécifier les bons mots-clés sans prendre en compte les mots ayant un sens similaire (synonymes) ou toutes autres considérations grammaticales (comme la pluralité ou le temps). Cela signifie qu’un certain nombre de résultats à la fois importants et  pertinents pourraient ne pas être pris en compte. 


TLDR Visual

💡 Implications pour le secteur de santé 💡

Dans le domaine de la santé en particulier,  les utilisateurs ne connaissent pas toujours la terminologie exacte ou peuvent passer à côté d’informations importantes si elles ne correspondent pas aux  mots clés choisis.

Cette éventualité peut être due à des différences de langage, de niveaux d'expertise ou de spécialisation, mais la recherche par mots-clés ne permet pas de mesurer ni d'interpréter ces variations régulières dans le langage naturel. 


Recherche sémantique : au-delà des mots

La recherche sémantique, comme son nom l’indique, tient compte du sens d’une requête et utilise cette interprétation pour trouver les réponses les plus pertinentes, sans se limiter aux résultats qui correspondent uniquement aux mots-clés utilisés.

Recherche sémantique

Recherche sémantique : Traitement du Langage Naturel (NLP), graphes de connaissance et incorporations vectorielles

Les technologies sous-jacentes offrent différentes capacités sémantiques pour interpréter un mot-clé ou une série de mots-clés.Deux principales approches sont généralement utilisées, soit l'utilisation de graphes de connaissances organisés manuellement et la recherche vectorielle alimentée par l'IA.

Recherche sémantique traditionnelle

Comparativement à la recherche par mot-clé, cette approche est plus évoluée quant à la compréhension de l’intention sous-jacente à une requête. Elle peut traiter des textes plus longs et plus complexes, et faire le lien avec des mots ayant des significations similaires ou connexes, pour mieux cerner l’objet de la requête.

Pour ce faire, le système établit manuellement une liste de mots et de concepts connexes, organisée sous la forme d'un graphe des connaissances. Cela permet au système de connecter les mots associés à la requête initiale, en faisant correspondre la liste élargie de mots-clés pertinents aux résultats potentiels dans l’index.  Bien que cette méthode permette d’obtenir des résultats plus nuancés et complets, elle requiert un travail manuel important pour organiser la liste, et ne couvre généralement que les requêtes et les concepts les plus courants, en négligeant les requêtes de longue traîne plus uniques ou spécialisées.

Recherche vectorielle

Même si les méthodes de recherche sémantique traditionnelles offrent un contexte supplémentaire par rapport aux recherches de mots-clés, elles sont encore loin d’offrir une compréhension aussi profonde que celle qu’aurait un être humain. La recherche vectorielle permet un niveau de compréhension beaucoup plus avancé  des requêtes grâce à  l'incorporation vectorielle - une représentation numérique d’informations probantes ou des relations d’une phrase, d’un mot ou d’un jeton.  Cette représentation des données peut être comprise comme des points dans un espace multidimensionnel, où les emplacements de chaque point de données sont sémantiquement significatifs. 

Cette méthode permet aux machines d’obtenir  des résultats plus précis et pertinents sur le plan contextuel, quelle que soit la requête ou les mots-clés utilisés. D’autant plus qu’elle permet d’éviter la curation manuelle à travers un graphe de connaissances,ce qui s’avère particulièrement utile dans les domaines comme la santé, où la précision dans la compréhension de la terminologie et de ses relations peut jouer un rôle crucial dans la prise de décisions et les résultats.


TLDR Visual

💡 Implications pour le secteur de santé 💡

Il est essentiel de comprendre le cas d'utilisation et le flux de travail pour chaque méthode de recherche. Dans le cas où l’utilisateur rechercherait une correspondance textuelle exacte sur des données telles qu’un nom, un numéro de téléphone ou une référence à une condition spécifique, une recherche par mots-clés représente généralement la meilleure option.

Toutefois, dans le cas où un patient n’utilisait pas r le bon mot-clé, ou un prestataire souhaitait s’assurer que tous les résultats pertinents sont extraits pour dresser un  contexte plus complet— en incluant des symptômes, des conditions ou des médicaments synonymes ou connexes — une recherche sémantique s’avérerait une meilleure option.


Recherche hybride : le meilleur des deux mondes

Maintenant, vous réalisez peut-être que les recherches par mots-clés et les recherches vectorielles ont toutes deux leurs avantages et leurs limites, selon le cas d’usage. Les recherches par mots-clés sont rapides et précises pour les requêtes bien définies, mais elles ont du mal à saisir le contexte et la sémantique. En revanche, les recherches sémantiques excellent dans la compréhension du contexte et des relations, mais elles peuvent exiger plus de ressources en plus de nécessiter un travail en amont important.

Comment pouvez-vous tirer profit de leurs avantages respectifs?  Avec la recherche hybride

La recherche hybride permet de fusionner le meilleur de la recherche de mots-clés et de la recherche vectorielle au sein d'une seule API. Cette approche améliore l’expérience de recherche dans son ensemble, fournissant une recherche sémantique performante lorsque la pertinence et le contexte importent, et une recherche par mots-clés particulièrement efficace pour les requêtes où le mot-clé exact est connu.

Principales caractéristiques de la recherche hybride :

  • Résultats précis et pertinents sur le plan contextuel.  Qu’il s’agisse de termes médicaux hautement spécialisés ou des mots employés par le patient en langage naturel, vous pouvez obtenir des résultats précis et pertinents à partir de données structurées et non structurées. Qu’il s’agisse de résultats de laboratoire, de listes de prestataires et de données démographiques des patients, ou de contenu de santé, de notes textuelles et de lettres de recommandation, les utilisateurs peuvent extraire des résultats à partir d’un plus large éventail de sources fiables et pertinentes afin de fournir avec plus de certitude les bons résultats et offrir une expérience de recherche plus efficace.

  • Réponse rapide.  Le temps de réponse joue un rôle crucial dans le domaine de la santé. En mettant en place un moteur de recherche à la hauteur des standards dudit secteur, vous permettez à vos utilisateurs d’accéder rapidement à la bonne réponse, sans avoir à reformuler leur requête pour trouver la bonne information.

  • Optimisée pour chaque cas d’utilisation.  En offrant une API pour la recherche par mots-clés et la recherche sémantique, les organisations peuvent garantir des expériences de recherche performantes et optimisées pour chaque cas d’utilisation ou flux de travail, le tout à travers leurs applications et à partir d’un seul entrepôt de données.

La recherche hybride au service de la santé

Vous comprenez maintenant comment fonctionne la recherche hybride.

Mais ce n’est pas tout. La mise en œuvre d’un système de recherche hybride requiert beaucoup d’efforts et d’attention. Chaque industrie a des exigences et des défis uniques qui doivent être abordés pour assurer le bon fonctionnement de la technologie.

C’est particulièrement vrai dans le secteur de la santé, où les enjeux sont considérables. Dans notre prochain article, nous examinerons de plus près la recherche hybride dans le contexte de la santé. Nous nous pencherons plus précisément sur les considérations nécessaires au bon fonctionnement de la recherche dans ce domaine où les résultats sont toujours cruciaux, et nous verrons la façon dont Clinia aborde la recherche hybride pour arriver à offrir des capacités de recherche précises et fiables.

Restez à l’affût.