Thèse soutenue

Contributions à la théorie des U-statistiques et processus empiriques

FR  |  
EN
Auteur / Autrice : Amel Nezzal
Direction : Salim Bouzebda
Type : Thèse de doctorat
Discipline(s) : Mathématiques Appliquées : Laboratoire de Mathématiques Appliquées de Compiègne (Unité de recherche EA-2222)
Date : Soutenance le 28/10/2022
Etablissement(s) : Compiègne
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur (Compiègne)
Partenaire(s) de recherche : Laboratoire : Laboratoire de Mathématiques Appliquées de Compiègne / LMAC

Résumé

FR  |  
EN

Dans cette thèse, nous nous intéressons principalement à l’estimation des modèles de régression non paramétrique. Plus précisément, nous nous intéressons à une classe d’estimateurs des U-statistiques conditionnelles. Les U-statistiques conditionnelles peuvent être considérées comme une généralisation de l’estimateur de Nadaray-Watson. Ce dernier utilise les méthodes à noyau pour “moyenner” les valeurs des variables réponses. Stute généralise l’estimateur de Nadaraya-Watson en remplaçant les moyennes pondérées simples au numérateur et au dénominateur par des U-statistiques. Ensuite, en utilisant une collection de variables aléatoires prédictives, il prédit l’espérance conditionnelle de la fonction noyau des U-statistiques. Cette généralisation est prospère et influente dans la statistique mathématique en raison de son utilité scientifique exceptionnelle et de sa fascinante complexité théorique. Cependant, comme toute autre technique d’estimation par noyau, la question du choix de la fenêtre de lissage appropriée pour équilibrer le compromis variance-biais, est un sujet qui reste mal abordé dans la littérature sur les U-statistiques conditionnelles lorsque les variables explicatives sont fonctionnelles. Dans la première partie de la thèse, nous introduisons l’estimateur k des plus proches voisins des U-statistiques conditionnelles dépendant d’une covariable de dimension infinie. La convergence uniforme en termes de nombre de voisinages (UINN) pour l’estimateur proposé est présentée. Un tel résultat permet de varier le nombre de voisinages dans une plage complète pour laquelle l’estimateur reste consistant. Par conséquent, ce résultat représente une ligne directrice intéressante dans la pratique pour sélectionner le nombre de voisinages optimal dans l’analyse des données fonctionnelles non paramétriques. De plus, nos résultats sont uniformes sur une classe de fonctions convenablement choisie F, dans les deux cas bornée et non bornée, satisfaisant des conditions de moment et certaines conditions générales sur l’entropie. En tant que sous-produit de nos preuves, nous énonçons des résultats de convergence pour le k-NN des U-statistiques conditionnelles, dans le cadre de la censure aléatoire, uniformes en nombre de voisins. La deuxième partie de la thèse traite un cadre général d’estimation non paramétrique incluant l’estimateur de Stute comme cas particulier. La classe des « estimateurs de delta séquence » est introduite et traitée dans ce travail. Cette classe comprend également les séries orthogonales et les méthodes d’histogramme. Nous étendons partiellement ces résultats au cadre des données fonctionnelles. La majeure partie de la thèse est motivée par les problèmes d’apprentissage, y compris parmi beaucoup d’autres, les problèmes de discrimination, l’apprentissage métrique et le "classement multipartite".