Thèse soutenue

Classification non supervisée : de la multiplicité des données à la multiplicité des analyses
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Jacques-Henri Sublemontier
Direction : Christel Vrain
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 07/12/2012
Etablissement(s) : Orléans
Ecole(s) doctorale(s) : École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....)
Laboratoire : Laboratoire d'Informatique Fondamentale d'Orléans
Jury : Président / Présidente : Pierre Gancarski
Examinateurs / Examinatrices : Christel Vrain, Pierre Gancarski, Younes Bennani, Yves Lechevallier, Stephane Lallich, Guillaume Cleuziou, Lionel Martin
Rapporteurs / Rapporteuses : Younes Bennani, Yves Lechevallier

Résumé

FR  |  
EN

La classification automatique non supervisée est un problème majeur, aux frontières de multiples communautés issues de l’Intelligence Artificielle, de l’Analyse de Données et des Sciences de la Cognition. Elle vise à formaliser et mécaniser la tâche cognitive de classification, afin de l’automatiser pour la rendre applicable à un grand nombre d’objets (ou individus) à classer. Des visées plus applicatives s’intéressent à l’organisation automatique de grands ensembles d’objets en différents groupes partageant des caractéristiques communes. La présente thèse propose des méthodes de classification non supervisées applicables lorsque plusieurs sources d’informations sont disponibles pour compléter et guider la recherche d’une ou plusieurs classifications des données. Pour la classification non supervisée multi-vues, la première contribution propose un mécanisme de recherche de classifications locales adaptées aux données dans chaque représentation, ainsi qu’un consensus entre celles-ci. Pour la classification semi-supervisée, la seconde contribution propose d’utiliser des connaissances externes sur les données pour guider et améliorer la recherche d’une classification d’objets par un algorithme quelconque de partitionnement de données. Enfin, la troisième et dernière contribution propose un environnement collaboratif permettant d’atteindre au choix les objectifs de consensus et d’alternatives pour la classification d’objets mono-représentés ou multi-représentés. Cette dernière contribution ré-pond ainsi aux différents problèmes de multiplicité des données et des analyses dans le contexte de la classification non supervisée, et propose, au sein d’une même plate-forme unificatrice, une proposition répondant à des problèmes très actifs et actuels en Fouille de Données et en Extraction et Gestion des Connaissances.