ManoMano



Dataquitaine 2024 - SESSION 2.1 - Amphi 1 - 21/03/2024 14h20 > 14h50

Maximisation de l'autonomie et de la productivité de l'équipe Data Science ManoMano avec une approche éco responsable

ManoMano

Résumé

Introduction

Afin d’améliorer l’expérience de ses clients, la marketplace ManoMano a recours à de nombreux algorithmes de data-science : catégorisation, extraction automatique des caractéristiques produits, recommandations de produits, cross-selling, etc. Dans son contexte de scale-up avec une augmentation des besoins (IA génératives, etc) et du nombre de Data Scientists, il est primordial d’également faire grandir les capacités de la plateforme pour leur permettre de travailler dans les meilleures conditions et raccourcir les cycles de développement tout en optimisant les coûts et en réduisant l’empreinte carbone.
Méthodologie

Nous nous appuierons sur les retours d’expérience de notre évolution de la plateforme data science chez ManoMano depuis 2 ans. D’une solution on premise à une utilisation de ressources Cloud à la demande, nous détaillerons les problématiques rencontrées. La première d'entre elles porte sur la concurrence d'accès aux ressources matérielles. Très présentes on-premise, l'utilisation de la conteneurisation dans le Cloud à permis de la solutionner pour les phases d'entraînement et d'inférence mais aussi pour les phases d'exploration et d'expérimentation via la conteneurisation de l'environnement de développement grâce à l'outil Devspace et un SDK interne.
Combinée à l'utilisation de Kubernetes, nous avons pu adresser également les besoins spécifiques en mémoire et en GPU en fonction des projets et des phases de développement, tout en homogénéisant les environnements d'exécution, raccourcissant ainsi les temps de cycle et améliorant la productivité des Data Scientists La mise à disposition de ressource à la demande associée à des stratégies pour optimiser les typologies de machines et leur temps d'utilisation nous ont permis de trouver le bon équilibre entre les besoins matériels grandissant, la résilience de l'infrastructure et l'optimisation de notre consommation de carbone.
Le changement de région de notre fournisseur Cloud nous a également permis d'optimiser cette dernière avec une électricité plus verte.
Originalité / perspective

La conteneurisation de l'ensemble du cycle de développement d'un modèle même lors de l'exploration et de l'expérimentation, nous a permis d'utiliser de manière ponctuelle des ressources matérielles et d'optimiser leur consommation notamment par la réutilisation de machine déjà disponible (aws spot instance) plutôt que par leur réservation. De plus, l'environnement quotidien des data scientists est le même que celui utilisé pour l'entraînement et l'inférence, permettant de détecter les problèmes au plus tôt et ainsi raccourcir les cycles et les consommations de ressources associées. Notre approche nous a permis de réduire de 30% notre consommation AWS et donc d'autant l'empreinte carbone associée, malgré une hausse du nombre de projets. Nous souhaitons par la suite étudier comment mettre à disposition des machines ayant un meilleur ratio entre leur puissance de calcul et leur consommation énergétique
Références

https://about.manomano.com/fr/mano-impact/
https://www.devspace.sh

Revoir la vidéo :






A propos des orateurs



Cédric CLINARD
Data Platform Product Manager

Ingénieur logiciel de formation, j'ai eu l'opportunité d'orienter ma carrière vers le domaine du Big Data dès 2010.A travers différentes expériences dans le Web Analytics, l'Industrie et l'ECommerce, je me suis spécialisé dans l'ingénierie et les architectures de données, répondant aux besoins analytiques et de Data Science. Aujourd'hui, en tant que Product Manager au sein de l'équipe Data Platform chez ManoMano, j'accompagne les équipes dans la construction d'infrastructures et de solutions offrant autonomie et efficacité à nos équipes Data.

ManoMano

Pedropablo LOPEZ AMAYA
Senior MLOps

J'ai commencé ma carrière en tant que Développeur Software dans le secteur du paiement. Je me suis orienté très vite vers l'Intelligence Artificielle appliquée à divers domaine comme le NLP, l'imagerie, le son, etc. Poursuivant mon parcours en tant que Lead DataScientist transverse au sein des différents pôles d'une société de service, j'ai dû trouver un équilibre entre les contraintes de l'entreprise, l'infrastructure, la performance et les besoins du métier. Aujourd'hui comme Senior MLOps chez ManoMano, je réponds aux besoins en Intelligence Artificielle de nos équipes dans le but d'automatiser et industrialiser de manière efficace les différents projets.

ManoMano



S'inscrire !
Organisation

           

Avec le soutien de

              

              



Cet événement a bénéficié d'une aide de l’État gérée par l'Agence Nationale de la Recherche au titre du Plan France 2030, portant la référence ANR-21-EXES-0004

Avec la participation de

Partenaire OR & ARGENT


Partenaire PLATINE


                   

              
{\rtf1}