Thématiques

Publié le

Big Data

Au-delà du buzz médiatique dont il fait l’objet, le « Big Data » est un sujet stratégique majeur, au coeur d’enjeux économiques et sociétaux considérables. Son impact est désormais perçu dans presque tous les secteurs de l’activité humaine : de la recherche scientifique à la médecine en passant, entre autres, par la finance, le bâtiment, l’e-commerce, la défense ou les transports. 

Les avancées technologiques, l’omniprésence des capteurs (systèmes embarqués, objets connectés, internet …) et l’explosion des réseaux sociaux s’accompagnent d’un véritable déluge de données, propulsant les sciences de l’information au centre du processus de valorisation des « Big Data ». Au-delà de la collecte et du stockage, l’enjeu est de pouvoir les analyser afin d’optimiser les décisions et mettre au point de nouvelles applications, toujours plus performantes (par ex. en maintenance prédictive dans les réseaux et transports, ciblage commercial, biométrie). 

Machine-Learning

Le traitement statistique de ces masses de données convoque à la fois mathématiques appliquées et informatique, à travers une discipline en plein essor : le Machine Learning. La variété des données aujourd’hui disponibles (nombres, images, textes, signaux), leur grande dimension et leur volumétrie rendent souvent inopérantes les méthodes statistiques traditionnelles reposant sur le prétraitement humain et un long travail de modélisation. Le Machine Learning vise à élaborer et étudier des algorithmes, à vocation prédictive le plus souvent, permettant à des machines d’apprendre automatiquement à partir des données, à effectuer des tâches de façon performante (comme par exemple pour les moteurs de recommandation ou la détection d’anomalies). La Chaire « Machine Learning for Big Data » a pour but de produire une recherche méthodologique répondant au challenge que constitue l’analyse statistique des données massives et d’animer la formation dans ce domaine à Télécom ParisTech.

Une compétence au coeur de Télécom ParisTech

Avec des enseignements et une recherche d’excellence couvrant l’ensemble des technologies de l’information et des usages, Télécom ParisTech a mis au point un écosystème d’innovation unique, basé sur une forte interaction entre sa formation, son centre de recherche et ses deux incubateurs d’entreprises. Ses liens étroits avec l’Industrie en font un témoin privilégié de l’émergence du phénomène Big Data et de son impact technologique dans le domaine de la formation et de la recherche. En savoir plus sur www.telecom-paristech.fr/bigdata.

L’un des points forts de Télécom ParisTech réside depuis toujours dans ses compétences et son expertise quant au traitement de l’information structurée (signaux, réseaux, images, vidéos, données textuelles). L’ubiquité du « Machine Learning » dans ses activités de recherche et de développement combinée à une capacité d’adapter les méthodes d’analyse à la nature des données à traiter et aux systèmes d’information déployés, lui permet de contribuer significativement à l’état de l’art. 

Une chaire industrielle de recherche et d'enseignement

Créée en septembre 2013 pour une durée de 5 ans avec le soutien de la Fondation Télécom et financée par quatre entreprises partenaires : Safran, PSA Peugeot Citroën, Criteo et BNP Paribas, la Chaire « Machine Learning for Big Data » est portée par le mathématicien Stéphan Clémençon, enseignant-chercheur, Professeur au sein du Département du Traitement du Signal et des Images de Télécom ParisTech.

La Chaire proposant cinq axes de recherche méthodologiques dans le domaine de l'Apprentissage Statistique s'incarnant dans des applications industrielles concrètes (e.g. ciblage commercial, recommandation, gestion des risques, monitoring de systèmes complexes):

  • Apprentissage par renforcement, approximation/simulation stochastique
  • Analyse statistique de (grands) graphes, réseaux sociaux
  • Ranking et recommandation
  • Apprentissage distribué, randomisé
  • Grande dimension, données temporelles/fonctionnelles

Elle a pour objectif d’animer, de façon collaborative et en interaction avec ses partenaires, une activité de recherche de pointe en Machine Learning, ainsi que des programmes de formation dans le domaine de la science des masses de données: