Procédures de tests multiples avec pondérations dans les études d'association pangénomiques
Auteur / Autrice : | Ludivine Obry |
Direction : | Cyril Dalmasso |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de la vie et de la santé |
Date : | Soutenance le 10/10/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Structure et dynamique des systèmes vivants (Gif-sur-Yvette, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Mathématiques et Modélisation d'Évry (Evry, Essonne) |
Référent : Université d'Évry-Val-d'Essonne (1991-....) | |
graduate school : Université Paris-Saclay. Graduate School Life Sciences and Health (2020-….) | |
Jury : | Président / Présidente : Elisabeth Petit-Teixeira |
Examinateurs / Examinatrices : Pierre Neuvial, Mathieu Emily, Anne-Louise B. Leutenegger, Philippe Broët | |
Rapporteur / Rapporteuse : Pierre Neuvial, Mathieu Emily |
Mots clés
Résumé
Avec le développement récent des technologies de séquençage, il est aujourd'hui possible de réaliser des études d'association pangénomiques (GWAS) à très large échelle. Dans ce contexte, l'approche standard consiste à tester chaque marqueur génétique individuellement. Afin de limiter le nombre de faux positifs, des procédures de tests multiples visant à contrôler un risque d'erreur global sont appliquées. Cependant, les approches classiques sont limitées, d'une part, par le fait que la sélection initiale ne tire pas parti des informations a priori et des connaissances d'experts, d'autre part, par la difficulté à identifier des variants rares qui peuvent pourtant avoir des effets importants. L'incorporation de pondérations dans les procédures de tests multiples peut alors être une solution. Dans cette thèse, nous avons évalué différentes procédures de tests multiples avec pondérations dans le contexte spécifique des GWAS. Nous avons également introduit une approche originale permettant d'améliorer la puissance de détection des variants rares tout en maintenant une bonne puissance globale. Nous avons évalué les différentes procédures à travers une étude de simulations dont les résultats montrent les bonnes performances de notre approche par rapport aux procédures existantes. Les différentes méthodes ont été appliquées à un jeu de données réelles.