Stephan Clémençon en ouverture de la conférence «voyage au cœur du big data»
Publié le
Le CEA, organisme de recherche sur des activités très larges telles que la défense et la sécurité, les énergies nucléaires et les technologies de l’industrie, a organisé le 15 juin 2017 une conférence intitulée « voyage au cœur du big data » à la Gaîté Lyrique à Paris. Cet évènement a permis de mettre en lumière l’implication du CEA dans la conception et la mise en œuvre d’infrastructures de traitement des données de simulation et de visualisation. A travers une succession de tables rondes et interventions d’experts du domaine, les applications du big data dans l’industrie et les sciences (l’astrophysique et la médecine en particulier) et leurs impacts à la fois scientifiques et sociétaux ont été les principaux thèmes abordés.
« Vous allez nous dire ce qu’il y a derrière ce mot big data. […] Certaines applications existent déjà mais vous dites qu’il y a beaucoup de choses à écrire encore ». Fabienne Chauvière, journaliste chez France Inter et animatrice de la conférence, présente ainsi l’intervention de Stephan Clémençon, enseignant-chercheur à Télécom ParisTech et porteur de la chaire Machine Learning for Big Data.
Ce dernier axe son discours d’introduction sur les principaux changements observés dans la récupération et le traitement des données. Dans tous les domaines d’activités, ce qui nous est donné à voir « est beaucoup plus riche qu’auparavant » et les critères de volumétrie, vélocité et variété dans la science des données doivent être repensés. Par exemple, les approches distribuées pour le traitement des données massives sont encore frustes : l’avenir est aux algorithmes capables de décider s’il faut ou non transmettre l’information récupérée, et donc la traiter ou pas.
Stephan Clémençon poursuit son analyse sur la notion de variété. Celle-ci appelle de nouvelles représentations des données à l’instar de l’analyse par ondelettes en traitement de l’image. Dans la perspective d’un traitement automatisé, l’analyse de données ne provenant pas d’un plan d’expérience bien contrôlé présente des dangers considérables qu’il faudra appréhender avec vigilance.
Avant d’être la solution, le big data correspond d’abord à un « grand nombre de problèmes qu’il faut s’attacher à résoudre efficacement ». L’enseignant-chercheur conclut ainsi son discours en rappelant que nous ne sommes qu’au début de l’aventure big data.