Thèse soutenue

Information auxiliaire non paramétrique : géometrie de l'information, processus empirique et applications

FR  |  
EN
Auteur / Autrice : Sofiane Arradi-Alaoui
Direction : Philippe Berthet
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 13/07/2022
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Toulouse (2007-....)
Jury : Examinateurs / Examinatrices : Philippe Berthet, Stéphane Puechmorel, Jean-Claude Fort, Agnès Lagnoux
Rapporteur / Rapporteuse : Elena Di Bernardino, Matthieu Lerasle

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Le premier objectif de cette thèse a été de développer une méthode d'injection optimale d'une information auxiliaire c'est à dire une information extérieure à l'expérience statistique observée. Ainsi nous proposons de rechercher la mesure de probabilité discrète ayant pour support l'échantillon vérifiant l'information auxiliaire et qui soit la plus proche de la mesure empirique au sens de la géométrie de l'information. Nous prouvons qu'il existe deux solutions à ce problème et nous montrons qu'il existe aussi une approximation commune explicite et facilement calculable de ces deux solutions. Nous la définissons comme étant la mesure empirique informée. Par la suite, nous étudions les propriétés de cette mesure empirique informée en établissant des résultats non asymptotiques de concentration et asymptotique du type P-Glivenko-Cantelli et P-Donsker. La conséquence majeure d'une information exacte est la diminution uniforme de la variance asymptotique du processus empirique. Le deuxième objectif de cette thèse a été de généraliser la mesure empirique informée à des informations auxiliaires dites faibles (préférence d'un expert par exemple). Après avoir généralisé la mesure empirique informée à ces informations auxiliaires faibles, nous lui étendons des résultats asymptotiques du type P-Glivenko-Cantelli et P-Donsker. Le troisième objectif de cette thèse a été d'étudier l'impact de l'utilisation d'une information auxiliaire fausse et de mettre en place une procédure adaptative permettant de sélectionner les informations auxiliaires pertinentes pour l'estimation d'un paramètre d'intérêt. Enfin nous terminons cette thèse en proposant des applications de la mesure empirique informée à des problèmes variés issus de la statistique et de la simulation stochastique (utilisation de variables auxiliaires, amélioration de la méthode de Monte-Carlo, maximum de vraisemblance informé, moindres carrés avec informations auxiliaires, apprentissage etc). Ces applications illustrent l'impact positif et relativement immédiat d'une information auxiliaire.