Auteur / Autrice : | Antoine Bichat |
Direction : | Christophe Ambroise, Mahendra Mariadassou |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 09/12/2020 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Mathématiques et Modélisation d'Évry (Evry, Essonne) - Laboratoire de Mathématiques et Modélisation d'Évry (Evry, Essonne) |
référent : Université d'Évry-Val-d'Essonne (1991-....) | |
Jury : | Président / Présidente : Nathalie Villa-Vialaneix |
Examinateurs / Examinatrices : Etienne Roquain, Joseph Salmon, Julie Aubert, Agathe Guilloux | |
Rapporteurs / Rapporteuses : Etienne Roquain, Joseph Salmon |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse porte sur l'inclusion d'informations hiérarchiques dans des procédures de détection d'abondance différentielle sur des données métagénomiques. Les différents taxons qui composent le microbiote sont généralement accompagnés d'un arbre, comme la taxonomie ou la phylogénie, qui traduit une proximité biologique entre eux. Il est alors naturel de vouloir tirer parti de cette information hiérarchique afin d'augmenter la puissance des tests de détection de taxons différentiellement abondants. Dans un premier temps, nous nous sommes intéressés aux performances des procédures hiérarchiques existantes et à l'impact du choix de l'arbre sur celles-ci. Dans un second temps, nous avons développé notre propre méthode hiérarchique de détection d'abondance différentielle. Celle-ci modélise les z-scores associés à chaque taxon comme la réalisation d'un processus d'Ornstein-Uhlenbeck sur arbre avec sauts dans la valeur optimale du processus puis effectue une régression de type lasso pour déterminer les positions et intensités optimales des sauts.