Academic Team

Published on

Machine Learning at Télécom ParisTech

Machine learning is an essential field of investigation in the information and communication sciences and technologies because of the importance of its applications, ranging from indexing and automatic document search to predicting behavior through the detection of anomalies, the recommendation, the visualization of massive information or the analysis of social networks.

Télécom ParisTech brings together a number of well-known specialists in this area, mainly in the IDS (Image, Data, Signal) and INFRES (Computer & Networks) Departments.

Learning techniques are not exclusively used in these departments, they are also relevant in the field of digital communications (for example, on "location fingerprinting"). However, the results obtained in the field of learning theory at Télécom ParisTech are mainly the result of researchers working within the research groups S2A, DIG, AAO, TII and MM.

The Academic Team

Stephan Clémençon is Full Professor at Télécom ParisTech, Institut Mines-Télécom, within the Image, Data, Signal Department and head of the S2A Research group. His research activity in Applied Maths takes place in the Télécom ParisTech LTCI Lab. His research topics are mainly related to machine-learning, probability and statistics. He is in charge of the « Big Data » Post-Master Degree at Télécom ParisTech and holds the Chair « Machine-Learning for Big Data ». Keywords: ranking, clustering, anomaly detetction, graph-mining, recommending systems


Eric Moulines est Professeur à l'Ecole polytechnique et Professeur associé à Télécom ParisTech. Ses thèmes de recherche incluent le machine-learning, les méthodes de type Monte Carlo, la statistique pour le traitement du signal. Editeur en chef de la revue Bernoulli, il est responsable du Master "Mathématiques pour la science des masses de données". Médaille d'argent du CNRS en 2010, il est également récipiendaire du Grand Prix France Télécom de l'Académie des Sciences en 2011. Mots-clés : approximation stochastique, apprentissage statistique, HMM, méthodes particulaires

Gaël Richard is Professor at Télécom-ParisTech, Institut Mines-Télécom and head of the Image, Data, Signal (IDS) department. His research work is dedicated to the analysis, the transformation, the understanding and automatic indexing of acoustic signals (speech, music, environenmental sounds...) and to a lesser extent of heterogeneous and multimodal signals. In particular, he developed several source separation methods for audio and musical signals based on machine learning approaches. Keywords: Machine listening, Matrix Factorization, Representation and subspace learning, Music Information Retrieval (MIR), Sound recognition, Audio source separation.  

Joseph Salmon is an Assistant Professor at Télécom ParisTech since 2012, specialized in statistical machine learning, signal processing, and their applications to image processing. His research interests include convex optimization for machine learning, statistical analysis of such procedures and inverse problems for image processing. Before joining Télécom ParisTech he was a post-doctoral associate at Duke University, under the supervision of R. Willett. Keywords: Sparse models, high dimensional linear models (Lasso, Logistic Regression), convex optimization, denoising, statistical aggregation

Fabian M. Suchanek is a Full Professor at the Télécom ParisTech University in Paris. Fabian developed inter alia the YAGO-Ontology, one of the largest public knowledge bases on the Semantic Web, which earned him a honorable mention of the SIGMOD dissertation award. His interests include information extraction, automated reasoning, and knowledge bases. Fabian has published around 60 scientific articles, among others at ISWC, VLDB, SIGMOD, WWW, CIKM, ICDE, and SIGIR, and his work has been cited more than 6000 times. Keywords: Semantic Web, Knowledge Bases, Information Extraction, Natural Language Processing, Automatic Reasoning

Slim Essid est enseignant-chercheur à Télécom ParisTech depuis 2006. Sa recherche s'intéresse au machine-learning pour le traitement du signal et l'analyse de données multimodales. Les applications traitées incluent l'analyse de contenus audiovisuels et musicaux, l'analyse d'activités humaines et la reconnaissance des émotions, et l'analyse des signaux EEG. Il a été impliqué depuis 2005 dans plusieurs projets collaboratifs nationaux et européens (FP6 et FP7). Mots-clés : Apprentissage discriminatif, CRF, analyse en variables latentes, factorisation de matrices, données multimodales.

Alexandre Gramfort is Associate Professor in the Signal and Image Processing department at Télécom ParisTech. His research are on signal processing, statistical machine learning and scientific computing with as primary application the analysis of neuroscience data. He is one of the core developers of the Scikit-Learn software project which is the main machine learning library in Python. Keywords: supervised learning, optimization, sparse methods, software.

Ons Jelassi est enseignante à la formation continue de Télécom ParisTech. Elle a travaillé dans le domaine de la métrologie et des performances des réseaux dans le cadre de sa thèse et en tant que consultante auprès de grandes entreprises pour des missions d'audit et d'expertise. Ses travaux de recherche au sein du groupe S2A portent sur le passage à l'échelle des algorithmes d'apprentissage. Mots-clés : apprentissage, performances, passage à l'échelle, algorithmes distribués.

Chloé Clavel est enseignant-chercheur à Telecom-ParisTech. Ses activités de recherche appartiennent au domaine de l’Affective Computing. Elle a précédemment travaillé en tant que chercheuse à Thales Research and Technology puis à EDF R&D. Ses travaux concernant l’analyse des opinions et des sentiments dans les textes, ont notamment été abordés dans un contexte applicatif de gestion de la relation client sur des corpus riches en expressions spontanées (forums de relation client, transcriptions manuelles et automatiques des centres d’appels, etc.). Mots-clés : analyse des opinions, text mining, apprentissage, traitement de la parole, reconnaissance des émotions.

Pascal Bianchi est né en 1977 à Nancy. Il est titulaire d’un Master en Sciences de l'Université de Paris XI et de  Supélec en 2000 et d’un doctorat de l'Université de Marne-la-Vallée en 2003. De 2003 à 2009, il était Maître de Conférences au Département des télécommunications de Supélec. En 2009, il a rejoint le groupe Statistiques et Applications au LTCI de Télécom ParisTech. Ses intérêts de recherche actuels se trouvent dans le domaine de l'optimisation continue appliquée au traitement du signal et aux systèmes distribués. Mots-clés : traitement statistique du signal, optimisation convexe, optimisation distribuée, réseaux de capteurs.

Laurence Likforman est Professeur Associé (HDR) à Télécom ParisTech depuis 1991. Elle est responsable du cours Reconnaissance des formes et enseigne également en Traitement du signal, Analyse de documents et Statistiques. Mots-Clés : Reconnaissance d'écriture, modèles Markoviens, Réseaux Bayesiens, Réseaux de neurones récurrents.

 

 

Florence d'Alché-Buc est Professeur à Télécom-ParisTech, Institut Mines-Télécom depuis 2014. Elle était auparavant professeur à l’Université d’Evry,  titulaire d’une ATIGE et co-directrice du laboratoire IBISC. Ses recherches portent sur l’apprentissage statistique, l’inférence de réseaux, la prédiction structurée et la modélisation de systèmes dynamiques avec des différentes applications à la biologie computationnelle. Mots-clés : apprentissage statistique, méthodes à noyaux, prédiction structurée, prédiction de liens, inférence de réseaux, systèmes dynamiques.

François Roueff est Professeur à Télécom-ParisTech, Institut Mines-Télécom, au sein du groupe S2A et professeur associé au département de mathématiques appliquées de l'École Polytechnique. Ses thèmes de recherche se situent principalement dans les domaines du traitement statistique du signal, de l'analyse et la modélisation aléatoire des séries temporelles et des statistiques pour les processus stochastiques. Mots-clés : longue dépendence, analyse en ondelettes, processus de Hawkes, processus localement stationnaires.
Olivier Fercoq est Maître de Conférences à Télécom ParisTech. Il a un Master de Paris 6 et de l'Ensta ParisTech. Pendant son doctorat à l'École Polytechnique (2009-2012), il a étudié des problèmes d'optimisation liés au référencement des pages web et à des applications en biologie. Il a passé deux ans à l'Université d'Édimbourg où il a travaillé sur les méthodes de descente par coordonnée. Il a rejoint Télécom ParisTech en 2014. Ses intérêts de recherche actuels portent sur le développement et l'étude d'algorithmes d'optimisation pour des problèmes de grande dimension. Mots-clés : optimisation, algorithmes stochastiques, vitesse de convergence, grande dimension, calculs en parallèle.

Patrice Bertail est Professeur de mathématiques (section 26) à l'université Paris-Ouest-Nanterre-La Défense, Professeur associé à Télécom ParisTech. Ses thèmes de recherche portent essentiellement sur les probabilités et la statistique non-paramétrique, avec des travaux notamment sur les méthodes de ré-échantillonnage, les valeurs extrêmes, les bornes exponentielles en apprentissage, en indépendant ou pour des chaînes de Markov. Il développe actuellement des techniques basées sur les sondages et le sous-échantillonnage pour le "big data". Il a été responsable du Master ISIFAR, spécialisé autour du risque pour les assurances, à  l'université Paris-Ouest. Mots-clés : Ré-échantillonnage, Apprentissage Statistique, Extrêmes, Sondages, chaîne de Markov

François Portier est Maître de Conférences dans le groupe S2A du département TSI e Télécom ParisTech. François Portier a réalisé son doctorat sur la réduction de la dimension en régression à l’Université de Rennes 1, sous la direction de Bernard Delyon (2010-2013). Il effectue, depuis septembre 2013, un postdoctorat à l’Université catholique de Louvain sous la direction de Ingrid Van Keilegom et Johan Segers. Ses thèmes de recherche portent sur l’asymptotique et le bootstrap des estimateurs semi-paramétriques. Mots-clés : Estimation semi-paramétrique, Efficacité, Bootstrap, Processus empirique, Réduction de la dimension.

Umut Simsekli is an Assistant Professor at Telecom ParisTech. He received his PhD degree in 2015 on inference methods for large-scale matrix and tensor factorization models in the Department of Computer Engineering at Bogaziçi University, İstanbul, Turkey. His research interests are in scalable Bayesian machine learning, audio and music processing, and recommendation systems. Keywords: matrix and tensor factorizations, Markov Chain Monte Carlo, audio and music processing.

Albert Bifet is Associate Professor at Télécom ParisTech and heads the Data, Intelligence and Graphs Group. He is one of the leaders of MOA and Apache SAMOA software environments for implementing algorithms and running experiments for online learning from evolving data streams. He is the author of a book on Adaptive Stream Mining and Pattern Learning and Mining from Evolving Data Streams. Previously he worked at Huawei Noah's Ark Lab in Hong Kong, Yahoo Labs in Barcelona, University of Waikato and UPC BarcelonaTech. He was serving as Co-Chair of the Industrial track of IEEE MDM 2016, ECML PKDD 2015, and as Co-Chair of BigMine (2017-2012), and ACM SAC Data Streams Track (2018-2012). Keywords: Data Streams, IoT, Real-Time Analytics, Machine Learning, Artificial Intelligence, Graph Mining

Giovanna Varni joined Telecom ParisTech as an Assistant Professor in 2017. Her research activities focus on the field of socio-affective computing. Previously, Giovanna Varni was a postdoctoral researcher at the University of Genoa (Italy) on the InfoMus Lab team and then in the INTERACTION team (IMI2S group) at the Pierre et Marie Curie University in Paris 6. Her work focuses on the analysis of non-verbal multimodal signals in human-human interaction and man-machine interaction. Since 2006, she has been involved in several European projects (FP7, EU-ICT, STREP and FET). Keywords: human-human  and man-machine interaction, socio-affective signal processing, interpersonal synchrony, expressive gesture

Robert M. Gower joined Telecom ParisTech as an Assistant Professor in 2017. He is interested in designing and analyzing new stochastic algorithms for solving big data problems in Machine Learning and scientific computing. A mathematician by training, his academic studies started with a Bachelors and a Masters degree in applied mathematics at the state University of Campinas (Brazil), where he designed the current state-of-art algorithms for automatically calculating high order derivatives using back-propagation. His PhD in stochastic numerics at the University of Edinburgh earned him the 2nd place of the 2017 Leslie Fox prize in numerical analysis. After which in 2016 he was granted the Fondation Sciences Mathématiques de Paris postdoctral Laureate fund to continue his work as a postdoc in ENS. Keywords: Stochastic optimization, randomized numerical linear algebra, convex optimization, machine learning, automatic differentiation

Pietro Gori is Assistant Professor at Télécom ParisTech in the IDS departmenent (Image, Data, Signal). He mainly works on the development of statistical and computational methods for the analysis of multimodal medical imaging data. His research interests lie primarily in the fields of computational anatomy and statistical learning in neuroimaging. He participates to the development of the open source software suite deformetrica for the statistical shape analysis of 2D and 3D image and image-derived data (e.g. landmarks, curves, surfaces). Keywords: computational anatomy, statistical shape analysis, supervised learning, medical imaging

Thomas Bonald is a professor at Télécom ParisTech. His research interests include graph analysis, machine learning and performance analysis of networks and data centers. In 2013, he received the Blondel Medal for his work on modeling Internet traffic. Keywords: Graph mining, learning, anomaly detection, spectral methods, Markov chains

 

 

Anne Sabourin is assistant professor in the S2A group at Telecom ParisTech since 2013. She received her PhD degree in 2013 on multivariate extreme values and Bayesian inference at Lyon 1 University, under the supervision of Anne-Laure Fougères and Philippe Naveau. Her research interests concern multivariate extreme value theory, dependence between rare events, dimension reduction in extreme regions, with various applications ranging from environmental risk to machine learning applications such as anomaly detection. keywords: Multivariate extreme value theory, rare events, dimension reduction, anomaly detection.

And also :

Doctorants

Nicolas Goix effectue son doctorat au département IDS de Télécom ParisTech (groupe S2A) depuis octobre 2013. Normalien en mathématiques à l’ENS Cachan, il a effectué avant sa thèse un stage d'une année de recherche au LPMA (Paris VI). Sa thèse encadrée par Stéphan Clémençon et Anne Sabourin porte sur les méthodes d'apprentissage pour la détection d'anomalies. Il est aussi contributeur de Scikit-Learn dans le cadre du projet Paris-Saclay Center for Data Science, sous l'encadrement d'Alexandre Gramfort. Mots-clés : apprentissage non-supervisé, détection d'anomalies, extrêmes multivariés, réduction de dimension.

Gabriela Ciolek is a PhD student in Télécom ParisTech since September 2016. She holds her master’s degree in Financial and Insurance Mathematics. She was also an Eiffel French Government Scholarship holder under supervision of Patrice Bertail during which she was working on bootstrap procedures for Harris recurrent Markov chains. Gabriela’s research interests revolve around  the theory of Markov chains with applications to machine learning, bootstrap for dependent data, concentration inequalities for Markov chains and empirical processes. Her thesis is supervised by Patrice Bertail and Stephan Clémençon and concerns statistical learning for Markovian dependent data. Keywords: Markov chains, empirical processes, statistical learning, concentration inequalities, bootstrap, generalization bounds

Mastane Achab est doctorant au sein du groupe S2A depuis le 3 septembre 2016. Il est titulaire du diplôme d'ingénieur de l’Ecole polytechnique et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Stephan Clémençon, Aurélien Garivier et Anne Sabourin, porte sur l'apprentissage par renforcement de stratégies robustes aux risques extrêmes qui existent dans de nombreuses applications (médecine, assurance, finance). Mots-clés : reinforcement learning, multi-armed bandit, risk aversion, extreme value theory.​

Etudiants en thèse financée par la Chaire

Claire Vernade est doctorante au LTCI depuis le 1er octobre 2014. Elle est issue de la formation d'ingénieur de Télécom ParisTech ainsi que du master MVA (ENS Cachan) qu'elle a suivi dans le cadre du double diplôme cohabilité par l'école. Sa thèse, sous la direction d'Olivier Cappé, concerne principalement l'étude de modèles d'apprentissage en ligne pour les systèmes de recommandation (Axe 1). Ses thèmes de recherches incluent notamment les méthodes de bandits (multi-armed bandit models), l'apprentissage par renforcement et l'apprentissage en ligne (Online Learning). Mots-clés : recommandation dynamique, problèmes de bandits, apprentissage en ligne, apprentissage par renforcement.

Luis Galárraga est doctorant au département INFRES de Télécom ParisTech (groupe DIG) depuis février 2014 sous l'encadrement de Fabian Suchanek et travaille sur l'Axe 2 : graph-mining et analyse des réseaux sociaux. Il avait commencé son doctorat à l'Institut Max Planck à Sarrebruck en 2012. Il a effectué ses études de premier cycle en Ingénierie Informatique à ESPOL (Escuela Superior Politécnica del Litoral) en Équateur. Il est titulaire d’un Master en Sciences de l'Université de Sarre en Allemagne. Ses domaines de recherche incluent l'extraction des règles d'association dans les bases de connaissances et le traitement distribué de données sémantiques (RDF). Pendant son doctorat il a effectué un stage de 3 mois chez Google Inc. Mots-clés : Extraction de règles, Bases de connaissance, Web sémantique, RDF, traitement distribué.

Valentin Barrière is currently PhD student in the S2A team of Telecom ParisTech since October 2015. His work focuses on the detection and analysis of opinion in both humain-agent and humain-humain speech interactions. He uses machine learning graphical models in order to recognize audio, linguistic and semantic patterns characteristic of the opinion expressions. Keywords: opinion analysis, text mining, hybrid learning models, speech processing

Guillaume Papa, élève de Télécom ParisTech, en Master Probabilités et Modèles Aléatoires de l'UPMC. Stage financé d'avril à septembre 2014. A partir d'octobre 2014, il a débuté une thèse sous la direction de Stéphan Clémençon et Pascal Bianchi sur l'Axe 4 : cloud learning et algorithmes d'apprentissage distribués.

Eugène Ndiaye est doctorant au sein du groupe S2A depuis le 15 octobre 2015 sous la direction d'Olivier Fercoq et de Joseph Salmon. Il est titulaire du master de Probabilités et Statistiques de l'Université Paris-Sud, Orsay ; et travaille principalement sur les algorithmes efficaces de sélection de variables en grande dimension. Mots-clés : coordinate descent, Lasso, sparsity, screening rules.
 

Anna Korba est doctorante au sein du groupe S2A depuis le 1er octobre 2015. Elle est titulaire du diplôme de l’ENSAE ParisTech et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Stephan Clémençon, Jérémie Jakubowicz et Eric Sibony, porte sur l’analyse statistique des données de rankings (ordres) qui apparaissent dans de nombreux domaines (élections, compétitions, e-commerce). Ses travaux de recherches concernent principalement l’agrégation de rankings et les systèmes de recommandation. Mots-clés : Ranking, Preference Learning, Analyse Multirésolution, Systèmes de recommandation, Agrégation de rankings.​

Moussab Djerrab est doctorant au sein du groupe S2A depuis le 1er octobre 2015. Il est titulaire du diplôme de l’ENSAE ParisTech et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Florence d'Alché-Buc, porte sur le traitement des problèmes de prédictions structurés. Ces méthodes d'apprentissages ont des applications variées depuis les problèmes "image-captionning" aux problèmes de prédiction en bio-informatique (structures des molécules). Mots-clés : Prédiction structurée, méthode à noyaux, manifold learning.

Pierre Laforgue est doctorant au sein du groupe S²A (ex STA) depuis le 10 octobre 2016. Diplômé de l'ENSAE ParisTech, il est également titulaire du Master 2 "Mathématiques, Apprentissage et Sciences Humaines" de l'Université Paris Dauphine. Sa thèse, encadrée par Florence D'Alché-Buc et Stephan Clémençon, porte sur l'apprentissage non-supervisé de représentations, avec pour objectif de l'appliquer aux séries temporelles. Mots-clés : unsupervised learning, representation learning, time series