Thèse soutenue

Extensions du modèle standard neutre pertinentes pour l'analyse de la diversité génétique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Marguerite Lapierre
Direction : Guillaume AchazAmaury Lambert
Type : Thèse de doctorat
Discipline(s) : Génétique et génomique
Date : Soutenance le 25/09/2017
Etablissement(s) : Paris 6
Ecole(s) doctorale(s) : École doctorale Complexité du vivant (Paris)
Partenaire(s) de recherche : Laboratoire : Institut de systématique, évolution, biodiversité (Paris ; 2009-....)
Jury : Président / Présidente : Frédéric Hospital
Examinateurs / Examinatrices : Michaël Blum, Raphaël Leblois, Line Le Gall
Rapporteurs / Rapporteuses : Michaël Blum, Laurent Excoffier

Résumé

FR  |  
EN

Cette thèse se place dans le cadre de l'analyse des forces évolutives qui génèrent les polymorphismes et les divergences entre les génomes d'une même espèce. Le cadre théorique utilisé dans la majorité des domaines de l'évolution moléculaire est la théorie neutraliste, proposée par Motoo Kimura en 1968. Ce modèle est caractérisé par les hypothèses de neutralité, de taille constante de la population étudiée, et de panmixie. Dans un premier temps nous avons cherché à comprendre comment ce cadre théorique est utilisé en pratique et quelles peuvent être les conséquences de ces hypothèses sur les inférences et les prédictions faites dans ce cadre théorique. Pour cela nous avons mené deux études confrontant des données à des méthodes existantes d'inférence démographique. Une première étude a montré que les méthodes utilisées fréquemment pour l'inférence démographique microbienne, basées sur la reconstruction d'un arbre phylogénétique unique, sont biaisées par la sélection, la recombinaison et les biais d'échantillonnage. Nous avons ensuite comparé plusieurs méthodes d'inférence démographique en les appliquant à une population humaine africaine, les Yoruba. Cette étude a montré les limites d'une méthode existante, et elle illustre le problème d'identifiabilité des histoires démographiques lorsque l'inférence est basée sur le spectre de fréquence. Enfin, dans un troisième temps nous avons analysé plusieurs jeux de données de polymorphisme génétique avec un modèle de référence alternatif à coalescences multiples avec démographie. Nous avons comparé comment le modèle de référence actuel et ce modèle alternatif pouvaient expliquer les données observées de diversité génétique.