Carrefour, une vision data centric

Publié le dans seminar-past

Le groupe Carrefour est un des leaders mondiaux de la grande distribution. Avec 380 000 collaborateurs répartis sur plus de 30 pays, il compte 12 000 magasins. En France, il dénombre 11 687 collaborateurs. Depuis quelques années, le groupe développe une approche digitale de la grande distribution avec la mise en place de nombreux sites e-commerce dont Ooshop. Plus récemment, il a acquis rueducommerce.fr.

Le marché mondial du groupe est considérable : il y a près de 13 millions de passages en caisse par jour dans le monde et le chiffre d'affaires est de 86 milliards d’euros en 2016. Carrefour diversifie ses points de distributions avec les proxy-markets qui sont essentiellement des franchises, les supers et les hypers. Cette diversification demande une optimisation de la logistique qui ne peut passer que par une transformation digitale performante avec des solutions dédiées. Cette transformation digitale s’accompagne d’une vision data centric et de l’utilisation de la méthode agile dans la gestion des projets data.

Depuis plus de deux ans, Carrefour développe en interne le programme PHENIX qui permet de simplifier et de centraliser les programmes informatiques utilisés dans les différents services. Il permet également de gérer le Big Data et le Fast Data. Un des problèmes rencontrés est la diversité des formats et la captation des données entre les magasins, les entrepôts et les fournisseurs. La nécessité de capter les données en temps réel pour optimiser la logistique a eu pour conséquence la création d’un data lake et le développement d’APIs dédiées mises à disposition pour les fournisseurs ou pour l’aspect open data. La difficulté de cet agencement réside essentiellement dans la diversification des données métiers : marketing, finance, supply-chain ou données externes comme les réseaux sociaux. Des solutions ont été mises en oeuvre comme le développement d’une architecture lambda pour la gestion des données et la création d’un cloud interne.

Le cas d’étude présenté pour illustrer PHENIX est la problématique de l’approvisionnement d’un magasin. Alors que pour chaque étape, avant PHENIX, on devait interroger une base de données différente liée à une infrastructure spécifique (entrepôts, magasins, etc), il est désormais possible de centraliser la base de données ce qui est un gain de temps considérable.

Un autre exemple présenté est celui d’une référence article non reconnue  en caisse. L'hôtesse de caisse a la possibilité d’interroger directement PHENIX pour la mise à jour de la base de données.

PHENIX s’appuie sur des technologies Big Data open source:

  • HDFS pour le batch processing,
  • Kafka pour la gestion du pipeline
  • Spark streaming en sur-couche de kafka
  • Cassandra et Elastic Search pour la base de données

En savoir plus sur Phenix (Le Mag IT)

En savoir plus sur le groupe Carrefour : www.carrefour.com/fr

Compte rendu rédigé par les étudiants du Mastère Spécialisé® Big Data Eric Fokou et Audrey Quessada