Bientôt le weekend, bientôt l'hiver, alors une petite revue de presse pour occuper vos longues soirées...
Les podcasts sont particulièrement d’actualité chez nous (plus d’information bientôt !), voici donc un épisode à écouter (et à indexer ?) qui parle vraiment de search : https://ifttd.io/chercher-lequilibre-entre-qualite-et-rapidite/ il s’agit de Paul Masurel (ex. Exalead, ex Google) qui a créé pas moins de 2 moteurs de recherche : tantivy (un port de Lucene en rust), et quickwit qui est plutot orienté indexation de logs / time series.
Notre talk à Open Source Experience est en ligne : De la voix au texte, la puissance de l'écosystème open source. Pour une expérience augmentée, nous vous conseillons d’y accéder via le site SIDO-OSXP.
Quand l’interface homme machine est une voix, comme c’est le cas pour les assistants personnels, les chatbots ou encore les moteurs de recherche, l’expérience utilisateur et les services que votre application fournit doivent s’adapter davantage. Les outils et services fournis par les grands acteurs du Mobile et du Cloud (Google, AWS, Microsoft, Apple) sont très avancés. Mais qu’en est-il de l’offre Open Source ? Elle a beaucoup évolué ces deux dernières années notamment grace à l’intégration de techniques issues de l’Intéligence Artificielle et du Machine Learning. Dans cette conférence nous faisons un survol des outils et techniques pour le traitement de la voix et du langage disponibles dans l’écosystème Open Source. Nous développons quelques cas d’utilisations, faisons des retours d’expérience et présentons l’état de l’art. Nous aborderons également les sujets qui peuvent encore être améliorés et sur lesquels vous pouvez encore contribuer.
Un meetup Elastic de la semaine dernière, qui parle de speech to text et indexation de vidéos et des usages qu’on peut en faire, dans un contexte NLP pour de l’extraction de connaissances. tres accessible et instructif. Meetup ElasticFR #68 : Elasticsearch pour analyser les discours politiques en ligne
En parlant de speech to text, des ressources à trouver du coté de l’accessibilité. En effet, sans le speech to text, nos moteurs de recherche sont des malentendants (presque) comme les autres ! https://github.com/emma11y/sous-titres/ à examiner.
Une histoire qui fait un peu peur donc à ne pas lire avant d’aller se coucher ;-) On ne lit pas souvent ce genre de retour d’expérience, c’est d’autant plus intéressant et instructif ! La sécurité est une chaine qui concerne tous les systemes, à commencer par celui qui se trouve entre la chaise et l'écran. Nous y sommes particulièrement sensibles dans le contexte des moteurs de recherche, pour lesquels nous traitons des données sensibles, et où la facilité de mise en oeuvre peut parfois faire oublier les fondamentaux. https://www.lemagit.fr/etude/Recit-comment-Manutan-sest-sorti-de-la-cyberattaque-du-21-fevrier