Reconstruction de profils protéiques pour la recherche de biomarqueurs
Auteur / Autrice : | Pascal Szacherski |
Direction : | Jean-François Giovannelli, Pierre Grangeat |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, productique, signal et image, ingénierie cognitique |
Date : | Soutenance le 21/12/2012 |
Etablissement(s) : | Bordeaux 1 |
Ecole(s) doctorale(s) : | École doctorale des sciences physiques et de l’ingénieur (Talence, Gironde ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Intégration du Matériau au Système |
Jury : | Président / Présidente : Daniel Commenges |
Examinateurs / Examinatrices : Jean-Philippe Charrier, François Caron, Audrey Giremus | |
Rapporteurs / Rapporteuses : Jérôme Idier, Alfred Hero |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse préparée au CEA Leti, Minatec Campus, Grenoble, et à l’IMS, Bordeaux, s’inscrit dans le thème du traitement de l’information pour des données protéomiques. Nous cherchons à reconstruire des profils protéiques à partir des données issues de chaînes d’analyse complexes associant chromatographie liquide et spectrométrie de masse. Or, les signaux cibles sont des mesures de traces peptidiques qui sont de faible niveau dans un environnement très complexe et perturbé. Ceci nous a conduits à étudier des outils statistiques adaptés. Ces perturbations peuvent provenir des instruments de mesure (variabilité technique) ou des individus (variabilité biologique). Le modèle hiérarchique de l’acquisition des données permet d’inclure ces variabilités explicitement dans la modélisation probabiliste directe. La mise en place d’une méthodologie problèmes inverses permet ensuite d’estimer les grandeurs d’intérêt. Dans cette thèse, nous avons étudié trois types de problèmes inverses associés aux opérations suivantes: 1. la quantification de protéines cibles, vue comme l’estimation de la concentration protéique, 2. l’apprentissage supervisé à partir d’une cohorte multi-classe, vu comme l’estimation des paramètres des classes, et 3. la classification à partir des connaissances sur les classes, vue comme l’estimation de la classe à laquelle appartient un nouvel échantillon.La résolution des problèmes inverses se fait dans le cadre des méthodes statistiques bayésiennes, en ayant recours pour les calculs numériques aux méthodes d’échantillonnage stochastique (Monte Carlo Chaîne de Markov).