Méthodes d’apprentissage structuré pour la microbiologie : spectrométrie de masse et séquençage haut-débit.
Auteur / Autrice : | Kevin Vervier |
Direction : | Jean-Philippe Vert |
Type : | Thèse de doctorat |
Discipline(s) : | Bio-informatique |
Date : | Soutenance le 25/06/2015 |
Etablissement(s) : | Paris, ENMP |
Ecole(s) doctorale(s) : | École doctorale Sciences des métiers de l'ingénieur (Paris) |
Partenaire(s) de recherche : | Laboratoire : Centre de bio-informatique (Paris, Ile-De-France) |
Jury : | Examinateurs / Examinatrices : Jean-Philippe Vert, Stéphane Robin, Éric Gaussier, Pierre Mahe |
Rapporteurs / Rapporteuses : Nicola Segata, Stéphane Canu |
Mots clés
Résumé
L'utilisation des technologies haut débit est en train de changer aussi bien les pratiques que le paysage scientifique en microbiologie. D'une part la spectrométrie de masse a d'ores et déjà fait son entrée avec succès dans les laboratoires de microbiologie clinique. D'autre part, l'avancée spectaculaire des technologies de séquençage au cours des dix dernières années permet désormais à moindre coût et dans un temps raisonnable de caractériser la diversité microbienne au sein d'échantillons cliniques complexes. Aussi ces deux technologies sont pressenties comme les piliers de futures solutions de diagnostic. L'objectif de cette thèse est de développer des méthodes d'apprentissage statistique innovantes et versatiles pour exploiter les données fournies par ces technologies haut-débit dans le domaine du diagnostic in vitro en microbiologie. Le domaine de l'apprentissage statistique fait partie intégrante des problématiques mentionnées ci-dessus, au travers notamment des questions de classification d'un spectre de masse ou d'un “read” de séquençage haut-débit dans une taxonomie bactérienne.Sur le plan méthodologique, ces données nécessitent des développements spécifiques afin de tirer au mieux avantage de leur structuration inhérente: une structuration en “entrée” lorsque l'on réalise une prédiction à partir d'un “read” de séquençage caractérisé par sa composition en nucléotides, et un structuration en “sortie” lorsque l'on veut associer un spectre de masse ou d'un “read” de séquençage à une structure hiérarchique de taxonomie bactérienne.