Bots : focus synonymes & questions alternatives

Chez Hubi.ai, nous avons créé des dizaines de bases de connaissances regroupées dans des modules sur étagère. Ces bases de connaissances permettent à votre bot d’accéder à des centaines voire des milliers de connaissances. Mais comment Hubi fait-il pour comprendre et répondre à toutes vos questions ? C’est ce que nous allons découvrir dans cet article.

Que contiennent les bases de connaissances ?

Rappelez-vous : dans l’article “Gestion de la connaissance : la clef d’un projet de chatbot réussi !”, nous expliquions que les bases de connaissances sont des collections de couples questions-réponse. Ces couples de questions-réponse sont subdivisés en deux parties :

  • Un ensemble de questions
  • Une réponse.

En résumé, un ensemble de questions pointent vers la même réponse. Dans l’équipe éditoriale Hubi, ces questions s’intitulent les “Questions alternatives”. Comme leur nom l’indique, les questions alternatives ne sont ni plus ni moins que des formulations différentes d’une seule et même question, appelée “Question principale”. La question principale est généralement la question la plus explicite quant à la réponse attendue : elle reflète au plus près le contenu de la réponse.

Les questions alternatives

Dans la vie de tous les jours, il existe des dizaines de façons différentes de formuler une question pour obtenir une seule et même réponse.

Prenons un exemple : vous souhaitez supprimer un fichier mais vous ne savez pas comment faire. La première question qui peut vous venir en tête est la suivante : “Comment supprimer un fichier ?”. Cependant, il existe d’autres formulations à cette question auxquelles vous n’auriez peut-être pas pensé. Voici une dizaine de formulations alternatives de la question “Comment supprimer un fichier ?” :

  • Comment faire pour supprimer un fichier ?
  • Comment on supprime un fichier ?
  • De quelle manière supprime-t-on un fichier ?
  • Quelle est la méthode pour supprimer un fichier ?
  • De quelle façon puis-je supprimer un fichier ?
  • Je voudrais supprimer un fichier
  • Je veux supprimer un fichier
  • Supprimer un fichier
  • Quelles sont les étapes à suivre pour supprimer un fichier ?
  • Indique-moi la procédure pour supprimer un fichier
  • Explique-moi comment supprimer un fichier
  • Je ne sais pas comment supprimer un fichier

La plupart de ces énoncés utilisent toujours les mêmes mots clés : le verbe “supprimer” et le nom commun “fichier”. Cependant, ces mots-clés peuvent être remplacés, conjugués ou encore accordés. Par exemple, le verbe “supprimer” peut être remplacé par le verbe “effacer” ou encore le nom commun “suppression”, et le nom commun “fichier” peut être remplacé par le nom commun “document”. C’est ce qu’on appelle les synonymes.

Les synonymes

L’utilisation de synonymes dans les questions alternatives d’un couple de questions-réponse est un bon moyen pour couvrir un maximum de formulations alternatives d’une même question, notamment celles auxquelles les créateurs de contenus n’auraient pas pensé ou auraient oublié. Pour que les synonymes soient identifiés comme tels, il faut qu’un même terme apparaisse plusieurs fois dans la liste de questions alternatives. Plus il y a d’occurrences et de questions, mieux c’est. Les utilisateurs seront libres de formuler leur question avec le vocabulaire qui leur convient le mieux. L’exactitude des réponses du bot est également améliorée.

Toutefois, il est nécessaire de vérifier que les questions alternatives des divers couples de questions-réponse inter et intra bases de connaissances ne soient pas identiques ou trop proches. L’apparition de doublons de questions alternatives favoriserait les comportements de confusion et d’hésitation, ce qui affecterait de manière négative les résultats du bot.

Pourtant, réécrire à la main la liste de questions ci-dessus en utilisant des synonymes est un travail fastidieux et chronophage. L’automatisation de la création des questions alternatives serait-elle une bonne alternative ?

Conclusion

La gestion des questions alternatives dans les bases de connaissances est une tâche primordiale et l’utilisation de synonymes ne doit pas être négligée. En effet, Hubi s’entraîne sur ces listes de questions alternatives pour remonter la réponse qui correspond le mieux à l’entrée de l’utilisateur. Plus il y aura de formulations alternatives, plus le bot sera à même d’identifier la bonne réponse avec un indice de confiance élevé et ce, quel que soit l’entrée utilisateur.