Thèse soutenue

Apprentissage en distributions déséquilibrées

FR  |  
EN
Auteur / Autrice : Fatma Hamdi
Direction : Younès Bennani
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2012
Etablissement(s) : Paris 13
Ecole(s) doctorale(s) : École doctorale Galilée (Villetaneuse, Seine-Saint-Denis)
Jury : Examinateurs / Examinatrices : Vladimir Radevski, Khalid Benabdeslem, Christophe Fouqueré, Stéphane Lallich, Vincent Lemaire
Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Jean-Charles Lamirel

Résumé

FR  |  
EN

Le travail de recherche présenté dans cette thèse concerne le développement d’approches à base d’apprentissage artificiel pour le traitement des bases de données déséquilibrées. Afin d’apporter des éléments de réponse pour cette problématique, nous proposons différentes contributions. Une première méthode qui agit au niveau des données d’apprentissage SNCR, c’est une technique d’échantillonnage structurel adaptatif qui permet de rééquilibrer les données par sous-échantillonnage de la classe majoritaire. La méthode proposée est guidée par la structure topologique des données et leur distribution. La seconde contribution proposée dans cette thèse aborde le problème de l’apprentissage à partir d’une seule classe, c’est un moyen permettant de contourner le problème de classes déséquilibrées à un problème de détection de nouveauté. Le modèle RS-NDF 􀀀est basée sur un ensemble de filtres adaptatif. Chaque filtre est conçu dans un espace de description dont les composantes et la dimension sont choisies aléatoirement. Nous avons proposé en outre une amélioration de la qualité de RS-NDF par une extension plus économe SRS-􀀀NDF, permettant de réduire le nombre de modèles participant à la prise de décision. L’objectif est de choisir parmi cet ensemble de filtres, le sous ensemble qui permet d’atteindre les meilleurs performances. Enfin nous avons proposé une adaptation de l’approche RS-NDF au problème de la détection de la dérive de concept. Les résultats obtenus sur la validation des approches traités an cette étude sont encourageants et prometteurs.