Cet article est une transcription de notre intervention cette semaine à Haystack - une conférence sur l'amélioration de la pertinence des moteurs de recherche. Nous avons montré une méthode permettant d'enrichir et de réécrire les requêtes des utilisateurs en utilisant Wikidata et le percolator Elasticsearch.
Haystack nous a donné la parole lors de la conférence. Nous avons présenté une méthode innovante qui peut être utilisée afin de réécrire les requêtes des utilisateurs. Cette méthode a l’avantage de ne nécessiter qu’une instance d’Elasticsearch et des Open Data provenant de Wikidata.
Lorsqu’il s’agit de recherche vocale, d’un chatbot ou même d’un certain type d’utilisateurs ou de cas d’utilisation, les requêtes des utilisateurs peuvent être assez verbeuses. Un processus de réécriture est alors nécessaire pour extraire les mots-clés significatifs.
Pour cette tâche, nous utilisons Wikidata - une base de données Open Source maintenue par la Wikimedia Foundation et le percolator Elasticsearch - une fonctionnalité disponible dans Elasticsearch depuis les premiers jours mais encore peu connue.
Les slides suivantes présentent en détail le processus que nous avons mis en place.
Vous pouvez facilement mettre en œuvre le même cadre sur votre infrastructure mais si vous avez besoin d’aide, n’hésitez pas à nous contacter.