C-Discount : Quelques challenges (analytiques) de Data Science dans le e-Commerce

Publié le dans seminar-past

Le 18 décembre dernier, le Mastère Spécialisé Big Data de Télécom ParisTech a reçu la visite de Matthieu Cornec, ancien élève de l’Ecole Polytechnique et de l’ENSAE. Titulaire d’un Master of Science à l’Université de Berkeley et d’un doctorat en mathématiques appliquées, il travaille depuis 10 ans dans la modélisation appliquée dans divers secteurs : énergie, économie, digital, transport.

Matthieu Cornec est aujourd’hui Chief Data Scientist chez Cdiscount, leader français du e-commerce, où il est en charge du moteur de recherche et de l’acquisition média. Cdiscount est le leader de l’e‐Commerce en France, il a enregistré plus de 16 millions de clients depuis sa création et a réalisé un volume d’affaires TTC de 2,6 Mds$ en 2013 (incluant la Marketplace). Le site est présent au Brésil, en Colombie, en Equateur, en Thaïlande, au Vietnam, en Côte d’Ivoire, au Sénégal, au Cameroun et en Belgique.

Aujourd’hui filiale de Cnova N.V, le pôle e-Commerce du groupe Casino, Cdiscount propose à ses millions de clients une large gamme de produits de plus de 11 millions d'offres au travers de prix attractifs et de solutions innovantes de livraison et de paiement.

La recommandation, un défi Big Data

Le concept de recommandation est apparu chez Netflix suite à un constat très simple : une fois que les clients avaient regardé la dizaine de films qu’ils avaient en tête, ils arrêtaient tout simplement d’utiliser le service. Comment les encourager à regarder plus de films ? Plus de 40 000 équipes dans le monde ont travaillé sur ce challenge Netflix pour proposer un système de recommandation de films. Depuis la recommandation est devenu un sujet central pour tous les sites de vente en ligne.

Cdiscount teste en continu de nouvelles solutions de recommandation et de cross selling pour améliorer le service fourni aux clients.

Traiter de plus en plus de données… mais pas forcément très denses

Les data-scientists de Cdiscount analysent en permanence les données massives générées par l’activité de ses clients. C’est un enjeu majeur que pouvoir utiliser ces données fortement parcimonieuses (phénomène de « sparsity ») et hétérogènes afin d’apporter aux équipes de Cdiscount des éléments décisionnels qui :

  • Visent à améliorer les  produits et services existants et à créer de nouveaux
  • Servent à l'invention de nouveaux modèles économiques: plateforme technique mise à disposition des commerçants locaux, géolocalisation des zones de chalandises, commerce connecté (magasins physique / vente on line, etc.)
  • Permettent une amélioration continue de l’expérience client et la qualité du service : gestion automatique des stocks et des prix en temps réel dans les magasins physique ou sur les sites de vente en ligne.

Le moteur de recherche, un enjeu clé

L’amélioration du moteur de recherche est un enjeu clé pour les ecommercants car le nombre de produits disponibles ne cessent de croître avec l’apparition des market places où des vendeurs tiers vendent leur produit. La diversité des requêtes (marque, modèle, produit…) ainsi que leur grand nombre fait de l’analyse de ces dernières un  vrai défi de data science.