menu icon

La revue de presse du 25 Novembre 2021

Bientôt le weekend, bientôt l'hiver, alors une petite revue de presse pour occuper vos longues soirées...

La revue de presse du 25 Novembre 2021

Quand l’interface homme machine est une voix, comme c’est le cas pour les assistants personnels, les chatbots ou encore les moteurs de recherche, l’expérience utilisateur et les services que votre application fournit doivent s’adapter davantage. Les outils et services fournis par les grands acteurs du Mobile et du Cloud (Google, AWS, Microsoft, Apple) sont très avancés. Mais qu’en est-il de l’offre Open Source ? Elle a beaucoup évolué ces deux dernières années notamment grace à l’intégration de techniques issues de l’Intéligence Artificielle et du Machine Learning. Dans cette conférence nous faisons un survol des outils et techniques pour le traitement de la voix et du langage disponibles dans l’écosystème Open Source. Nous développons quelques cas d’utilisations, faisons des retours d’expérience et présentons l’état de l’art. Nous aborderons également les sujets qui peuvent encore être améliorés et sur lesquels vous pouvez encore contribuer.

  • Un meetup Elastic de la semaine dernière, qui parle de speech to text et indexation de vidéos et des usages qu’on peut en faire, dans un contexte NLP pour de l’extraction de connaissances. tres accessible et instructif. Meetup ElasticFR #68 : Elasticsearch pour analyser les discours politiques en ligne

  • En parlant de speech to text, des ressources à trouver du coté de l’accessibilité. En effet, sans le speech to text, nos moteurs de recherche sont des malentendants (presque) comme les autres ! https://github.com/emma11y/sous-titres/ à examiner.

  • Une histoire qui fait un peu peur donc à ne pas lire avant d’aller se coucher ;-) On ne lit pas souvent ce genre de retour d’expérience, c’est d’autant plus intéressant et instructif ! La sécurité est une chaine qui concerne tous les systemes, à commencer par celui qui se trouve entre la chaise et l'écran. Nous y sommes particulièrement sensibles dans le contexte des moteurs de recherche, pour lesquels nous traitons des données sensibles, et où la facilité de mise en oeuvre peut parfois faire oublier les fondamentaux. https://www.lemagit.fr/etude/Recit-comment-Manutan-sest-sorti-de-la-cyberattaque-du-21-fevrier

Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne – retour sur la conférence ElasticON

10/03/2023

Retour sur la présentation Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne par Roudy Khoury et Aline Paponaud à ElasticON 2023

Lire l'article

Question answering, une approche plus humaine à nos recherches sur all.site.

19/01/2023

Tout sur les Question-Answering et comment l'implémenter en utilisant flask et elasticsearch.

Lire l'article

Retour d’Expérience - Fine-tuning d’un modèle VOSK

05/01/2022

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

Retour d’Expérience - Indexation des transcriptions de fichiers média

17/12/2021

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

Nouveau meetup Search & Data - E-Commerce Search et Open Source

28/10/2021

La cinquième édition du meetup Search and Data est dédiée au search e-commerce et à l'open source. Un bel agenda pour cette édition de rentrée et de reprise.

Lire l'article

Expédition vers Synonym Graph dans Elasticsearch

21/04/2021

Dans cet article, nous expliquons comment nous sommes passés des anciens filtres de synonymes d'Elasticsearch aux nouveaux filtres de type graphe, les Synonym Graph Token Filter.

Lire l'article

Quand les requêtes sont très verbeuses

22/02/2021

Dans cet article, nous présentons une méthode simple pour réécrire les requêtes utilisateurs afin qu'un moteur de recherche basé sur des mots clés puisse mieux les comprendre. Cette méthode est très utile dans le contexte d'une recherche vocale ou une conversation avec un chatbot, contexte dans lequel les requêtes utilisateur sont généralement plus verbeuses.

Lire l'article

Enrichir les données et réécrire les requêtes avec le percolator Elasticsearch

26/04/2019

Cet article est une transcription de notre intervention cette semaine à Haystack - une conférence sur l'amélioration de la pertinence des moteurs de recherche. Nous avons montré une méthode permettant d'enrichir et de réécrire les requêtes des utilisateurs en utilisant Wikidata et le percolator Elasticsearch.

Lire l'article

A2 le moteur qui sublime Elasticsearch

13/06/2018

Elasticsearch est une technologie ouverte qui permet aux intégrateurs de construire des solutions toujours plus innovantes et puissantes.

Lire l'article