Deuxième soutenance de thèse de la Chaire Machine Learning for Big Data

Publié le 30/11/2017 dans event-france

Réalisée dans le cadre d’un stage effectué chez Adobe, Claire Vernade a développé sa recherche sur les problématiques rencontrées sur la plateforme « Marketing Cloud ». Cette plateforme d’Adobe consiste à vendre à de grands comptes des outils de Marketing sous la forme de « software as a service » (http://www.adobe.com/fr/marketing-cloud.html). Les données des sites web sont collectées dans les cloud d'Adobe et exploitées pour personnaliser/optimiser les pages internet, les produits proposés, les campagnes publicitaires, etc. Une des offres de service consiste à envoyer des emails publicitaires ciblés : le défis réside donc le choix du segment marketing (type de consommateur) auquel sera proposé tel ou tel produit et sous quelle forme (couleur, message, etc.).

La solution pratique apportée à la complexité statistique de ce problème a pu être mis en application sur des données réelles et sera mise en production dans les serveurs d’Adobe.

Adapter le contenu de pages web aux préférences des utilisateurs est un objectif important qui intervient dans divers cadres : la publicité en ligne en est une application importante, ainsi que la personnalisation des pages d’accueil ou des résultats de recherche pour n’en citer que quelques-unes. Les algorithmes de bandits manchots, développés à l’origine dans le cadre d’essais cliniques séquentiels, ont très tôt trouvé leur application dans ces problématiques d’optimisation de contenu Web. En effet, l’ensemble des choix de design et de recommandations peuvent être assimilés à un espace d’action tandis que les utilisateurs sont vus comme un générateur aléatoire de clics, réalisations de variables aléatoires de Bernoulli, qui permettent d’évaluer les actions de l’algorithme de bandit. Pourtant, malgré la pertinence de ce modèle, il apparaît que dans la plupart des applications citées plus haut, la génération de clics par les utilisateurs est perturbée par des variables externes et non contrôlées par l’algorithme.

La thèse de Claire Vernade consiste d’abord à identifier de tels problèmes pour en proposer une modélisation adéquate dans le formalisme du bandit manchot. Trois principaux modèles sont considérés :

l’un s’attache à prendre en compte la position du contenu et son influence sur la probabilité de clic,
le second étend le premier en autorisant cette fois l’utilisateur à choisir la position,
tandis que le troisième considère le problème du délai entre la présentation du contenu et l’observation effective d’une réponse de l’utilisateur.

Dans ces trois cas, la complexité du problème de bandits résultant est étudiée à travers une borne inférieure sur le regret cumulé. Cela permet notamment de quantifier l’influence de l’incertitude due à l’environnement et qui échappe au contrôle de l’algorithme. D’autre part, des algorithmes reposant sur le principe d’optimisme face à l’incertain sont proposés et analysés. Pour chaque approche, une borne supérieure sur le regret contrôle la performance espérée, montrant qu’il est possible, dans certains cas, d’atteindre le comportement optimal correspondant à la borne inférieure précédemment prouvée.

En complément de la soutenance de thèse de Claire Vernade s’est tenu le « Online Learning Workshop » en présence de Csaba Szepesvári de l’Université d’Alberta et de Google DeepMind ainsi que de Wouter M. Koolen du CWI Amsterdam. L’intervention de Csaba Szepesvári a porté sur les optimisations adaptatives non convexe : « Adaptive (Non-)Convex Optimization: Optimism, Composite Objectives, and Variational Bounds ». Wouter Koolen a quant à lui abordé la question de la conception de méthodes adaptatives d’apprentissage en ligne « The Design of Adaptive Online Learning Methods. ».

Tout en restant en contact avec les équipes de chercheurs d’Adobe, afin d’affiner les résultats obtenus, Claire Vernade va poursuivre sa carrière professionnelle dans les bureaux Berlinois d’Amazon.