Thèse de doctorat en MBS - Modèles, méthodes et algorithmes en biologie, santé et environnement
Sous la direction de Olivier François et de Olivier Michel.
Soutenue le 11-12-2017
à l'Université Grenoble Alpes (ComUE) , dans le cadre de École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble) , en partenariat avec Techniques de l’ingénierie médicale et de la complexité - Informatique, Mathématiques et Applications (Grenoble) (laboratoire) .
Le président du jury était Michaël Blum.
Le jury était composé de Thomas Burger, Jean-Luc Bosson.
Les rapporteurs étaient Christophe Ambroise, Charles Bouveyron.
Nous présentons des méthodes statistiques reposant sur des problèmes de factorisation matricielle. Une première méthode permet l'inférence rapide de la structure de populations à partir de données génétiques en incluant l'information de proximité géographique. Une deuxième méthode permet de corriger les études d'association pour les facteurs de confusion. Nous présentons dans ce manuscrit les modèles, ainsi que les aspects théoriques des algorithmes d'inférence. De plus, à l'aide de simulations numériques, nous comparons les performances de nos méthodes à celles des méthodes existantes. Enfin, nous utilisons nos méthodes sur des données biologiques réelles. Nos méthodes ont été implémentées et distribuées sous la forme de packages R : tess3r et lfmm.
Matrix factorization methods for population genomics and association mapping
We present statistical methods based on matrix factorization problems. A first method allows efficient inference of population structure from genetic data and including geographic proximity information. A second method corrects the association studies for confounding factors. We present in this manuscript the models, as well as the theoretical aspects of the inference algorithms. Moreover, using numerical simulations, we compare the performance of our methods with those of existing methods. Finally, we use our methods on real biological data. Our methods have been implemented and distributed as R packages: tess3r and lfmm.
Il est disponible au sein de la bibliothèque de l'établissement de soutenance.