Apprentissage en distributions déséquilibrées
Auteur / Autrice : | Fatma Hamdi |
Direction : | Younès Bennani |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2012 |
Etablissement(s) : | Paris 13 |
Ecole(s) doctorale(s) : | École doctorale Galilée (Villetaneuse, Seine-Saint-Denis) |
Jury : | Examinateurs / Examinatrices : Vladimir Radevski, Khalid Benabdeslem, Christophe Fouqueré, Stéphane Lallich, Vincent Lemaire |
Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Jean-Charles Lamirel |
Résumé
Le travail de recherche présenté dans cette thèse concerne le développement d’approches à base d’apprentissage artificiel pour le traitement des bases de données déséquilibrées. Afin d’apporter des éléments de réponse pour cette problématique, nous proposons différentes contributions. Une première méthode qui agit au niveau des données d’apprentissage SNCR, c’est une technique d’échantillonnage structurel adaptatif qui permet de rééquilibrer les données par sous-échantillonnage de la classe majoritaire. La méthode proposée est guidée par la structure topologique des données et leur distribution. La seconde contribution proposée dans cette thèse aborde le problème de l’apprentissage à partir d’une seule classe, c’est un moyen permettant de contourner le problème de classes déséquilibrées à un problème de détection de nouveauté. Le modèle RS-NDF est basée sur un ensemble de filtres adaptatif. Chaque filtre est conçu dans un espace de description dont les composantes et la dimension sont choisies aléatoirement. Nous avons proposé en outre une amélioration de la qualité de RS-NDF par une extension plus économe SRS-NDF, permettant de réduire le nombre de modèles participant à la prise de décision. L’objectif est de choisir parmi cet ensemble de filtres, le sous ensemble qui permet d’atteindre les meilleurs performances. Enfin nous avons proposé une adaptation de l’approche RS-NDF au problème de la détection de la dérive de concept. Les résultats obtenus sur la validation des approches traités an cette étude sont encourageants et prometteurs.