Statistiques bayésiennes en génétique des populations : modèle à facteurs et processus gaussiens pour étudier la variation génétique neutre et adaptative
Auteur / Autrice : | Nicolas Duforet-Frebourg |
Direction : | Michaël Blum |
Type : | Thèse de doctorat |
Discipline(s) : | Modèles, méthodes et algorithmes en biologie, santé et environnement |
Date : | Soutenance le 02/10/2014 |
Etablissement(s) : | Grenoble |
Ecole(s) doctorale(s) : | École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Techniques de l’ingénierie médicale et de la complexité - Informatique, mathématiques et applications (Grenoble, Isère, France) |
Jury : | Président / Présidente : Denis Allard |
Examinateurs / Examinatrices : Julien Mairal | |
Rapporteur / Rapporteuse : Renaud Vitalis, Christophe Ambroise |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Nous présentons dans cette thèse plusieurs travaux de statistiques bayésiennes appliquées à la génétique des populations. La génétique des populations a pour but d'expliquer les variations génétiques au sein d'une espèce, et d'inférer les processus ayant conduits à ces variations. Pour cela, des données génétiques massives sont utilisées et il y a un besoin grandissant de méthodes statistiques pour traiter ces données. Le travail de cette thèse s'inscrit dans cet effort de modélisation statistique pour répondre aux enjeux de la génétique des populations, et de la biologie de l'évolution. Nous nous intéressons tout particulièrement à la détection de traces d'adaptation locale dans les génomes, et à l'inférence des variations spatiales non stationnaires.Un modèle d'analyse factorielle bayésien est proposé pour détecter les traces d'adaptation locale. Nous comparons notre approche aux méthodes existantes, et démontrons qu'elle permet d'obtenir un plus faible taux de fausses découvertes. Nous présentons également un modèle bayésien basé sur des processus gaussiens pour caractériser les variations génétiques spatiales dans l'aire de répartition d'une espèce. Les performances de ces méthodes sont démontrées sur différents exemples issus de simulations ou de données. Plusieurs logiciels open source qui implémentent ces méthodes ont été développés pendant la thèse.