Partitionnement non supervisé de données de grandes dimensions spatiale et spectrale pour l'aide à la décision
Auteur / Autrice : | Jihan Alameddine |
Direction : | Kacem Chehdi |
Type : | Thèse de doctorat |
Discipline(s) : | Signal, image, vision |
Date : | Soutenance le 15/11/2022 |
Etablissement(s) : | Rennes 1 |
Ecole(s) doctorale(s) : | MATHSTIC |
Partenaire(s) de recherche : | Laboratoire : Institut d'Électronique et de Télécommunications (Rennes) |
Jury : | Président / Présidente : Didier Coquin |
Examinateurs / Examinatrices : Jenny Benois Pineau, Claude Cariou | |
Rapporteurs / Rapporteuses : Gabriela Ciuperca, Anissa Mokraoui |
Mots clés
Résumé
Le partitionnement d'un ensemble de données de grande taille, où le nombre de classes, d'échantillons d'apprentissage et d'autres connaissances a priori ne sont pas disponibles, pose un défi considérable. Ainsi, la conception de méthodes de partitionnement fiables, où toutes les décisions sont prises uniquement sur la base du tableau de données croisant objets/attributs est un problème complexe. Pour apporter une solution à ce problème, nous nous intéressons dans la cadre de cette thèse au développement de méthodes de partitionnement non supervisées et non paramétriques adaptées aux données de grande taille quel que soit le domaine applicatif. La première partie consacrée aux travaux de l’état de l’art présente d’abord les principaux critères d’évaluation d’une partition et donne ensuite une synthèse des principales méthodes de partitionnement mettant en évidence leurs avantages et leurs limites. La seconde partie présente les trois approches de partitionnement non supervisées développées. Pour confirmer leur caractère général, elles ont été appliquées à trois domaines : l’environnement, la reconnaissance des visages avec expressions et la médecine, avec des données acquises par des capteurs différents. Les évaluations montrent le succès des méthodes développées au vue de la pertinence des résultats. En effet, sans aucune intervention de l'utilisateur, les performances sont meilleures que celles des méthodes semi-supervisées et non supervisées les plus efficaces de l’état de l’art.