Cdiscount
Amphi 1 - SESSION # 4.1 - 07/02/2018 16:30 > 17:00


Catégorisation de produits : du sémantique (k-NN) à l'image (CNN)



Le catalogue de Cdiscount est alimenté de nouveaux produits chaque jour qu'il faut ranger parmi la plus pertinente des 8000 catégories de produits sur le site. Derrière ce problème se cachent des questions complexes du machine learning : grand nombre de classes avec une distribution déséquilibrée, dérive contextuelle, qualité des données... Nous allons voir comment exploiter le texte, avec une approche sémantique traditionnelle TF-IDF + k-NN et l'image avec une approche plus moderne à base de CNN.


Télécharger les slides

Revoir le live :



Mickaël Poussevin
Chef d'activité data


S'inscrire !
Nos sponsors

Les stands partenaires

{\rtf1}