Méthodes de sélection de variables, parmi un grand nombre, dans un cadre de discrimation
| Auteur / Autrice : | Jean-François Robineau |
| Direction : | Catherine Garbay |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique et statistique |
| Date : | Soutenance en 2004 |
| Etablissement(s) : | Université Joseph Fourier (Grenoble, Isère, France ; 1971-2015) |
Mots clés
Mots clés contrôlés
Résumé
L'objet de ces travaux est le développement de méthodes de sélections de variables en apprentissage supervisé. La problématique de sélection de prédicteurs se rencontre dans le domaine émergeant de la fouille de données qui fait intervenir un grand nombre de variables. Nous cherchons a développer un environnement, a la fois théorique et pratique, afin de mettre en place des méthodes de sélection indépendantes de tout modèle probabiliste et autre méthode de discrimination. En s'inspirant de critères entropiques issus de la théorie de l'information nous proposons un processus de quantisation supervisée des prédicteurs continus suivant la variable de classe préalablement a la sélection des sous-ensembles de variables pertinentes. Les mesures d'information utilisées pour la quantisation supervisée sont par la suite mises en oeuvre dans la procédure de sélection de variables. Divers méthodes de sélection sont proposées, soulignant l'impossibilité pratique de découvrir le sous-ensemble idéal.