menu icon

Nouveau meetup Search & Data - E-Commerce Search et Open Source

La cinquième édition du meetup Search and Data est dédiée au search e-commerce et à l'open source. Un bel agenda pour cette édition de rentrée et de reprise.

Nouveau meetup Search & Data - E-Commerce Search et Open Source

Nous voilà de retour avec notre cinquième meetup. Nous dédions ce meetup au search e-commerce et à l’open source.

Pour ce meetup de rentrée et de reprise, nous vous avons préparé un bel agenda avec

// René Kriegler, Director E-commerce chez OpenSource Connections, qui nous parlera du feedback implicite des utilisateurs et comment l’utiliser pour améliorer un moteur de recherche e-commerce. Une présentation pour les data scientists mais pas seulement :-)

// Lucian Precup, CTO de all.site, qui présentera Elasticsearch et les adaptations à prévoir pour intégrer cette technologie Open Source dans un moteur de recherche e-commerce.

// Jérémy Mésière, Manager de l'équipe Digital Factory chez Manutan, qui fera un retour d’expérience sur l’intégration d’Elasticsearch dans les futurs moteurs de recherche e-commerce de Manutan International.

Merci de nouveau à Station F pour nous héberger, en parallèle de la conférence France is AI. Un grand merci aussi à la conférence Open Source Experience à laquelle nous devons la visite de René à Paris.

Petite précision sur la logistique : pour avoir accès aux locaux, il faudra presenter un Pass sanitaire. L’inscription Meetup doit être complétée avec l’inscription via ce formulaire

Ci-dessous le détail des présentations.

Abstract

More than other domains, e-commerce search depends on implicit user feedback to optimise search result ranking. While search relevance is probably still a major criterion of search result quality in e-commerce, the user finally takes the buying decision based on criteria such as ‘an attractive price’ and ‘brand sympathy’ that are very hard to make explicit. On the other hand, this decision making can be observed implicitly in web tracking.

Unfortunately, e-commerce search cannot just use more generally known approaches to click modelling. Many of these models assume that the user would view the search results sequentially, top to bottom, while in e-commerce search we often use a grid layout which invites the user to go back and forth between results, especially given the heavy use of product imagery on the search result page. In addition, our model needs to consider contexts beyond the well-known position bias, such as the device type (mobile vs desktop) or the time of the day, together with the different types of signals (clicks, add-to-basket, checkout). Last but not least, many general click models ignore the fact that the number of observations can vary a lot between query-product pairs. Our greater uncertainty in the case of sparse events should be reflected in the model.

In this talk, I shall introduce an approach to using implicit user feedback that is based on Bayesian hierarchical modelling. It will provide a solution for dealing with position bias, including for grid layouts, and for dealing with further contexts, such as device types. The model will cope with varying quantities of observations and it allows to incorporate different types of events, such as clicks and checkouts.

Bio

René works as Director E-commerce at OpenSource Connections, empowering the company’s clients to make onsite search a key driver for improving their online sales.

He has worked in search for 15 years, including on projects for some of the top 10 German e-commerce sites. He is co-founder and co-organiser of MICES (Mix-Camp E-commerce Search), an event that brings together the e-commerce search community each year. His technological focus is on Solr, Elasticsearch and Lucene. He created and maintains the Querqy open source library for query rewriting. René is co-initiator of the Chorus project – an open source software stack that combines Querqy with other powerful tools to build e-commerce search and to measure and improve search quality.

Talk 2 : Elasticsearch pour le e-commerce

Abstract

Elasticsearch est une technologie Open Source basée sur Apache Lucene - la bibliothèque moteur de recherche la plus utilisée dans le monde. La technologie Elasticsearch, et plus généralement la suite ELK, sont beaucoup utilisées et très bien adaptées pour les cas d’utilisation Monitoring, Observability, Logs et Sécurité. Les domaines comme l’Enterprise Search, le Workplace Search, Site Search et plus particulièrement le E-Commerce Search nécessitent des adaptations spécifiques.

Lucian présentera une liste exhaustive d’une trentaine de points d’attention lors de l’intégration d’Elasticsearch dans un contexte e-commerce. Des sujets comme l’architecture générale, l’auto-completion, la pertinence, les facettes, filtres et autres manières d’affiner les recherches, les synonymes et taxonomies ainsi que la personnalisation seront particulièrement abordés.

Un focus sera fait sur l'écosystème de l’e-commerce et les modules, algorithmes et utilitaires nécessaires pour avoir une suite logicielle complète, puissante et pertinente.

Bio

Lucian Precup est CTO de all.site et développe des solutions pour l’indexation, la recherche et l’analyse de données d’entreprise. Depuis 2010, Lucian a participé à une trentaine de projets de moteur de recherche e-commerce parmi lesquels Fnac.com et Carrefour.fr. Son dernier projet all.site est un moteur de recherche collaboratif permettant aux entreprises, institutions et utilisateurs particuliers d’organiser les données pour les rendre accessibles de manière pertinente, performante et sécurisée.

Talk 3 : Retour d’Expérience Manutan International

Le Groupe Manutan est le leader européen du e-commerce BtoB. Spécialiste de la distribution d'équipements pour les entreprises et les collectivités, Manutan ne cesse d’innover pour améliorer l’expérience de ses clients.

Dans le cadre de sa transformation numérique, Manutan a lancé plusieurs projets de refonte de ses différents systèmes. Le plus récent est le projet de refonte du moteur de recherche des sites e-commerce du groupe dont Manutan.fr. Le futur moteur de recherche est basé sur une suite logicielle ouverte et moderne :

  • Cloud Azure
  • DevOps: Docker, Kubernetes, Ansible, Jenkins, Prometheus, Grafana
  • Back: Java, Quarkus
  • Front: React, Next, Typescript, Jest
  • Q&A: Cucumber, Cypress
  • Apigee, MongoDB et bien entendu ElasticSearch

Cette présentation donne un aperçu du projet et des différents challenge techniques.

Bio

Jérémy Mésière est le Fondateur et Manager de l'équipe Digital Factory chez Manutan International. Créée il y a un peu plus d’un an, l'équipe Digital Factory a mis en place une stack technique moderne au service des différentes lignes métier du groupe Manutan.

Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne – retour sur la conférence ElasticON

10/03/2023

Retour sur la présentation Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne par Roudy Khoury et Aline Paponaud à ElasticON 2023

Lire l'article

Question answering, une approche plus humaine à nos recherches sur all.site.

19/01/2023

Tout sur les Question-Answering et comment l'implémenter en utilisant flask et elasticsearch.

Lire l'article

Retour d’Expérience - Fine-tuning d’un modèle VOSK

05/01/2022

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

Retour d’Expérience - Indexation des transcriptions de fichiers média

17/12/2021

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

La revue de presse du 25 Novembre 2021

25/11/2021

Bientôt le weekend, bientôt l'hiver, alors une petite revue de presse pour occuper vos longues soirées...

Lire l'article

Expédition vers Synonym Graph dans Elasticsearch

21/04/2021

Dans cet article, nous expliquons comment nous sommes passés des anciens filtres de synonymes d'Elasticsearch aux nouveaux filtres de type graphe, les Synonym Graph Token Filter.

Lire l'article

Quand les requêtes sont très verbeuses

22/02/2021

Dans cet article, nous présentons une méthode simple pour réécrire les requêtes utilisateurs afin qu'un moteur de recherche basé sur des mots clés puisse mieux les comprendre. Cette méthode est très utile dans le contexte d'une recherche vocale ou une conversation avec un chatbot, contexte dans lequel les requêtes utilisateur sont généralement plus verbeuses.

Lire l'article

Enrichir les données et réécrire les requêtes avec le percolator Elasticsearch

26/04/2019

Cet article est une transcription de notre intervention cette semaine à Haystack - une conférence sur l'amélioration de la pertinence des moteurs de recherche. Nous avons montré une méthode permettant d'enrichir et de réécrire les requêtes des utilisateurs en utilisant Wikidata et le percolator Elasticsearch.

Lire l'article

A2 le moteur qui sublime Elasticsearch

13/06/2018

Elasticsearch est une technologie ouverte qui permet aux intégrateurs de construire des solutions toujours plus innovantes et puissantes.

Lire l'article