Méthodes de factorisation matricielle pour la génomique des populations et les tests d'association
Auteur / Autrice : | Kévin Caye |
Direction : | Olivier François, Olivier Michel |
Type : | Thèse de doctorat |
Discipline(s) : | MBS - Modèles, méthodes et algorithmes en biologie, santé et environnement |
Date : | Soutenance le 11/12/2017 |
Etablissement(s) : | Université Grenoble Alpes (ComUE) |
Ecole(s) doctorale(s) : | École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Techniques de l’ingénierie médicale et de la complexité - Informatique, mathématiques et applications (Grenoble, Isère, France) |
Jury : | Président / Présidente : Michaël Blum |
Examinateurs / Examinatrices : Thomas Burger, Jean-Luc Bosson | |
Rapporteurs / Rapporteuses : Christophe Ambroise, Charles Bouveyron |
Mots clés
Résumé
Nous présentons des méthodes statistiques reposant sur des problèmes de factorisation matricielle. Une première méthode permet l'inférence rapide de la structure de populations à partir de données génétiques en incluant l'information de proximité géographique. Une deuxième méthode permet de corriger les études d'association pour les facteurs de confusion. Nous présentons dans ce manuscrit les modèles, ainsi que les aspects théoriques des algorithmes d'inférence. De plus, à l'aide de simulations numériques, nous comparons les performances de nos méthodes à celles des méthodes existantes. Enfin, nous utilisons nos méthodes sur des données biologiques réelles. Nos méthodes ont été implémentées et distribuées sous la forme de packages R : tess3r et lfmm.