Etude de la classification dans un trés grand nombre de catégories
Auteur / Autrice : | Raphael Puget |
Direction : | Nicolas Baskiotis, Patrick Gallinari |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 04/07/2016 |
Etablissement(s) : | Paris 6 |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris |
Partenaire(s) de recherche : | Laboratoire : LIP6 (1997-....) |
Jury : | Président / Présidente : Marie-Jeanne Lesot |
Examinateurs / Examinatrices : Jérémie Mary | |
Rapporteurs / Rapporteuses : Massih-Reza Amini, Marc Tommasi |
Mots clés
Mots clés contrôlés
Résumé
La croissance des données disponibles aujourd'hui génère de nouvelles problématiques pour lesquelles l'apprentissage statistique ne possède pas de réponses adaptées. Ainsi le cadre classique de la classification qui consiste à affecter une ou plusieurs classes à une instance est étendu à des problèmes avec des milliers, voire des millions de classes différentes. Avec ces problèmes viennent de nouveaux axes de recherches comme \deleted{le temps} \added{la réduction de la compléxité} de classification qui est habituellement linéaire en fonction du nombre de classes du problème\deleted{.} \added{, ce qui est problématique lorsque le nombre de classe devient trop important.} Plusieurs familles de solutions pour cette problématique ont émergé comme la construction d'une hiérarchie de classifieurs ou bien l'adaptation de méthodes ensemblistes de type ECOC. Le travail présenté ici propose deux nouvelles méthodes pour répondre au problème de classification extrême. Le premier travail consiste en une nouvelle mesure asymétrique pour le partitionnement de classes dans le cadre d'une classification hiérarchique alors que le second axe explore l'élaboration d'un algorithme séquentiel actif d'agrégation des classifieurs les plus intéressants.