Thèse soutenue

Prise en compte de la dépendance pour des problèmes de test global et de prédiction

FR  |  
EN
Auteur / Autrice : Florian Hébert
Direction : David CauseurMathieu Emily
Type : Thèse de doctorat
Discipline(s) : Z- mathématiques appliquées
Date : Soutenance le 28/11/2019
Etablissement(s) : Rennes, Agrocampus Ouest
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Equipe de recherche : Institut de recherche mathématique (Rennes ; 1996-....)
Laboratoire : Institut de Recherche Mathématique de Rennes / IRMAR
Jury : Président / Présidente : Éric Matzner-Løber
Examinateurs / Examinatrices : Éric Matzner-Løber, Pierre Neuvial
Rapporteurs / Rapporteuses : Nathalie Villa-Vialaneix

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans de nombreux types de données, tels que les données génomiques ou fonctionnelles, les variables explicatives sont caractérisées par une forte structure de dépendance. Pour des problèmes variés, comme la construction de tests globaux ou de règles de prédiction, la prise en compte de cette structure de dépendance reste un problème ouvert. Plusieurs auteurs recommandent de prendre explicitement en compte cette dépendance, tandis que d’autres proposent de l’ignorer complètement. En réalité, il apparaît que le meilleur choix entre ces deux possibilités dépend à la fois de la structure de dépendance elle-même, mais aussi de la forme du signal d’association entre les variables explicatives et la variable réponse. Dans cette thèse, des approches adaptatives sont proposées, visant à déterminer la meilleure façon de prendre en compte la dépendance.Une méthode de test global est construite, notamment pour les problèmes de tests d’association gène-phénotype en études d’association pangénomiques. De façon similaire, une règle de régression adaptative est développée. Dans les deux cas, la prise en compte adaptative de la dépendance est permise par l’introduction de poids. Une expression explicite des poids optimaux est ensuite obtenue. Celle-ci dépend à la fois de la structure de dépendance des variables explicatives et du signal d’association. Les résultats obtenus sur des simulations et des jeux de données non simulés démontrent que les méthodes proposées offrent de bonnes performances dans des situations variées.