Thèse soutenue

Techniques de lissage et de régularisation en analyse discriminante

FR
Auteur / Autrice : Conchita Callant
Direction : Edwin Diday
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance en 1991
Etablissement(s) : Paris 9

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Dans cette étude nous avons abordé les techniques de régularisation et de lissage appliquées à la construction et à la validation de modèles de discrimination. Pour chaque partie, nous présentons des études numériques sur des données générées de façon aléatoire. Dans la partie I, nous abordons le modèle d'analyse discriminante régularisée proposé par Friedman (1989). Ce modèle permet de traiter les problèmes pauvrement-posés ou mal-posés sans sélectionner les variables et utilise deux paramètres de régularisation qui modifient les matrices de variance-covariance. Nous proposons une méthode d'estimation des valeurs de ces paramètres par une méthode de type quasi-Newton. Nous minimisons directement le critère du taux d'erreur par validation croisée. Au contraire de Friedman, nous optons pour le plus petit degré de régularisation pour les deux paramètres lorsque les paramètres fournissent des taux d'erreur égaux par validation croisée. Cette stratégie peut produire des valeurs très différentes pour les paramètres et peut être préférée dans certains cas (taille d'échantillon pas trop petite ou bon pouvoir discriminant potentiel de la discrimination quadratique). Dans la partie II , nous présentons un aperçu des différentes méthodes de ré-échantillonnage et leur régularisation. Bien que les méthodes de ré-échantillonnage soient des méthodes non paramétriques, elles sont fortement sensibles aux points atypiques. Nous proposons une nouvelle méthode de validation croisée dite validation croisée régularisée (VCR). Elle utilise deux paramètres de régularisation: le premier pour réduire l'influence d'un point atypique contenu dans l'échantillon d'apprentissage, le deuxième pour réduire l'influence d'un point atypique contenu dans l'échantillon test. Son originalité et son intérêt résident dans la régularisation du critère de validation croisée à partir de la distribution de groupe. La VCR fournit des règles de décision plus robustes. Elle permet de traiter les échantillons contenant des points atypiques sans les supprimer. Les études numériques montrent la fiabilité et la validité des nouvelles techniques proposées