Méthodes fréquentielles pour la reconnaissance d'images couleur : une approche par les algèbres de Clifford
Auteur / Autrice : | José Mennesson |
Direction : | Laurent Mascarilla, Christophe Saint-Jean |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, Image et Signal |
Date : | Soutenance le 18/11/2011 |
Etablissement(s) : | La Rochelle |
Ecole(s) doctorale(s) : | Sciences et Ingénierie pour l'information |
Partenaire(s) de recherche : | Collectivité : Region Poitou-Charentes |
Jury : | Président / Présidente : Ludovic Macaire |
Examinateurs / Examinatrices : Laurent Mascarilla, Christophe Saint-Jean, Ludovic Macaire, Johel Miteran, Stephen J. Sangwine, Jesús Angulo López | |
Rapporteurs / Rapporteuses : Johel Miteran, Stephen J. Sangwine |
Résumé
Dans cette thèse, nous nous intéressons à la reconnaissance d’images couleur à l’aide d’une nouvelle approche géométrique du domaine fréquentiel. La plupart des méthodes existantes ne traitent que les images en niveaux de gris au travers de descripteurs issus de la transformée de Fourier usuelle. L’extension de telles méthodes aux images multicanaux, comme par exemple les images couleur, consiste généralement à reproduire un traitement identique sur chacun des canaux. Afin d’éviter ce traitement marginal, nous étudions et mettons en perspective les différentes généralisations de la transformée de Fourier pour les images couleur. Ce travail nous oriente vers la transformée de Fourier Clifford pour les images couleur définie dans le cadre des algèbres géométriques. Une étude approfondie de celle-ci nous conduit à définir un algorithme de calcul rapide et à proposer une méthode de corrélation de phase pour les images couleur. Dans un deuxième temps, nous cherchons à généraliser à travers cette transformée de Fourier les définitions des descripteurs de Fourier de la littérature. Nous étudions ainsi les propriétés, notamment l’invariance à la translation, rotation et échelle, des descripteurs existants. Ce travail nous mène à proposer trois nouveaux descripteurs appelés “descripteurs de Fourier couleur généralisés”(GCFD) invariants en translation et en rotation.Les méthodes proposées sont évaluées sur des bases d’images usuelles afin d’estimer l’apport du contenu fréquentiel couleur par rapport aux méthodes niveaux de gris et marginales. Les résultats obtenus à l’aide d’un classifieur SVM montrent le potentiel des méthodes proposées ; les descripteurs GCFD se révèlent être plus compacts, de complexité algorithmique moindre pour des performances de classification au minimum équivalentes. Nous proposons également des heuristiques pour le choix du paramètre de la transformée de Fourier Clifford.Cette thèse constitue un premier pas vers une généralisation des méthodes fréquentielles aux images multicanaux.