Thèse soutenue

Analyse de contenus visuels en 2D et en 3D : évaluation de la pertinence d'un point de vue d'un objet 3D

FR  |  
EN
Auteur / Autrice : Marie Pelissier-Combescure
Direction : Géraldine MorinSylvie, Julie Chambon
Type : Thèse de doctorat
Discipline(s) : Informatique et Télécommunications
Date : Soutenance le 24/06/2024
Etablissement(s) : Université de Toulouse (2023-....)
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)
Etablissement délivrant conjointement le doctorat : Institut national polytechnique (Toulouse ; 1969-....)
Jury : Président / Présidente : Jean-Luc Mari
Examinateurs / Examinatrices : Géraldine Morin, Sylvie, Julie Chambon, Jean-Luc Mari
Rapporteurs / Rapporteuses : Romain Raffin, Michèle Gouiffès

Résumé

FR  |  
EN

Dans notre monde tridimensionnel, les objets sont souvent représentés en deux dimensions, principalement visualisés à travers des supports 2D tels que des catalogues en papier ou des écrans d'ordinateur. La sélection du point de vue pour observer un objet en 3D sur un support 2D a un impact significatif sur son identification, la visualisation de ses caractéristiques et la compréhension de son utilité. Cette tâche est primordiale dans différents domaines applicatifs tels que les jeux vidéos, l'imagerie médicale, l'architecture et la conception industrielle.Cette thèse se penche sur la problématique du choix du point de vue 2D le plus adapté pour un objet 3D donné, avec pour objectif de mesurer la pertinence de ce point de vue au regard des "informations essentielles" de l'objet, c'est-à-dire les informations qui permettent de le reconnaître et d'en extraire les attributs caractéristiques. Nous proposons une méthode pour déterminer automatiquement le point de vue 2D le plus pertinent en extrayant et en quantifiant les "informations essentielles" de chaque point de vue disponible.Deux axes de recherche ont été explorés dans cette étude. Le premier axe concerne l'évaluation de la pertinence des points de vue fixes offerts par des images texturées par rapport à un objet 3D. La géométrie de cet objet est définie par un modèle 3D. Le deuxième axe se concentre sur l'analyse d'un modèle 3D géométrique défini par un maillage 3D non texturé de l'objet. Nous proposons de déterminer automatiquement le point de vue le plus représentatif de l'objet, celui qui permet une identification et une compréhension sans ambiguïté.Pour notre premier axe de recherche, nous développons une approche s'appuyant sur la détection des caractéristiques saillantes de l'objet tout en filtrant les informations non pertinentes comme l'apparence, en tirant parti à la fois des images 2D et des modèles 3D. Nous introduisons un score de pertinence, dérivé des attributs géométriques et des recommandations liées à la photographie, qui nous permet de classer les points de vue. Pour valider l'approche, nous comparons les scores de pertinence avec les scores de confiance obtenus à partir de méthodes d'apprentissage, et les résultats obtenus montrent l'intérêt et l'efficacité de la proposition. Lors de la seconde partie, une méthode géométrique est proposée pour déterminer le point de vue le plus représentatif d'un objet en considérant son utilisation plutôt que son esthétisme. Plus précisément, nous proposons d'évaluer la quantité de surfaces visibles ainsi que la saillance intrinsèque, tout en pondérant chaque sommet visible en fonction de l'angle de vue. Les résultats ont été validés par une étude utilisateur et utilisatrice, tout en assurant la cohérence avec la perception humaine. De plus, pour démontrer l'efficacité de notre approche, nous avons réalisé une comparaison avec deux méthodes de l'état de l'art qui proposent également des techniques de sélection de la meilleure vue d'un objet. Cependant, contrairement à ces deux méthodes, notre approche pour sélectionner le meilleur point de vue est plus élaborée, impliquant une combinaison d'attributs géométriques et sémantiques propres à l'objet 3D étudié.En conclusion, nos contributions portent sur la sélection automatique du point de vue le plus pertinent pour un objet 3D donné. Autrement dit, nous identifions la vue optimale qui représente le mieux l'objet 3D, c'est-à-dire, celle qui permet de visualiser le plus de caractéristiques essentielles de l'objet 3D, facilitant ainsi son identification et sa compréhension. Dans nos deux axes de travail, cette identification se réalise à l'aide d'une quantification de la pertinence, basée sur l'extraction de l’information essentielle de l'objet étudié.