Séminaire : l’apprentissage automatique en génomique et protéomique
Publié le dans event-france
Le jeudi 1er octobre de 14h à 15h à Télécom ParisTech, 46 rue Barrault, amphi B 312
Au cours de ce séminaire, François Laviolette présentera deux exemples concrets d’applications du “machine Learning” en bio-informatique.
Le premier vient d’une problématique liée à la découverte de médicaments. Plus exactement, on verra comment par des méthodes à noyaux il est possible d’accélérer la découverte de peptides pouvant inhiber certaines protéines cibles. Cette approche a nécessité la mise au point d’un nouveau noyau PSD, le General-String-kernel, que nous présenterons en détails.
Dans le second cas, on verra comment il est possible de retrouver différent phénotypes (tel la résistance à certains antibiotiques) en étudiant le génome de différentes familles de bactéries. L’approche de "machine Learning” utilisé ici est le “Set Covering Machine”. Cet algorithme a ceci de particulier, qu’il permet de considérer l’ensemble du génome en entrée et surtout que le prédicteur produit par l’algorithme est suffisamment parcimonieux pour être interprétable par des experts en génomique. Cette dernière propriété est d’autant plus importante qu’il est bien connu que tout expert du domaine a une hantise de tout prédicteur de type "boite noire".
François Laviolette est professeur titulaire au département d’informatique et de génie logiciel de l’Université Laval. Il a obtenu son doctorat en théorie des graphes à l’Université de Montréal en 1995. Sa thèse résolvait un problème vieux de 60 ans qui avait entre autre été étudié par le mathématicien Paul Erdos.
Depuis plus de 10 ans, son principal axe de recherche est l’apprentissage automatique (Machine Learning) et la bioinformatique. Plus spécialement, il développe des algorithmes d’apprentissage permettant de résoudre de nouveaux types de problèmes d’apprentissage, notamment des problèmes liés à la génomique et à la protéomique.
Il est actuellement le directeur du tout nouveau centre de recherche en données massives de l’Université Laval, le CRDM_UL.