Thèse soutenue

Apprentissage profond pour les maillages 3D

FR  |  
EN
Auteur / Autrice : Nitika Verma
Direction : Edmond Boyer
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique
Date : Soutenance le 20/10/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble)
Jury : Président / Présidente : Élisa Fromont
Examinateurs / Examinatrices : Jakob Verbeek, Iasonas Kokkinos
Rapporteurs / Rapporteuses : Emanuele Rodola, Christian Wolf

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les méthodes d'apprentissage profond ont connu un succès phénoménal dans plusieurs domaines scientifiques dont la vision par ordinateur, le traitement du langage naturel ou encore la reconnaissance vocale. C’est le cas des réseaux de neurones convolutifs (CNNs) qui sont désormais omniprésents dans les algorithmes qui considèrent des images 2D pour faire de la classification, de la détection ou bien de la segmentation.Si les CNNs s'étendent naturellement à d'autres domaines où les données sont également organisées en grilles rectangulaires, par exemple l'audio et la vidéo, ils généralisent mal à des structures de données irrégulières telles que celles utilisées pour représenter des formes 3D, notamment les maillages de points. Cette limitation constitue un défi à l'extension des méthodes d'apprentissage profond aux formes 3D. Dans cette thèse nous présentons deux contributions importantes dans ce contexte.Dans notre première contribution, nous proposons une nouvelle architecture de réseau à convolution de graphe qui s'appuie sur une formulation générique de la couche de convolution dans un réseau. Cette formulation permet de relâcher la contrainte de correspondance fixe entre les poids des filtres de convolution et les éléments voisins du sommet au centre de la convolution. La principale nouveauté est alors que cette association entre poids du filtre et voisins sur le maillage se fait de manière dynamique en fonction des caractéristiques de la couche précédente du réseau, et est apprise comme une partie intégrante du réseau neuronal. Nous avons évalué cette stratégie en l’appliquant au problème de la mise en correspondance de formes 3D. Les résultats obtenus ont constitué, au moment de la publication, une amélioration significative de l’état de l’art sur la correspondance de formes.Dans une deuxième contribution, nous explorons comment ces réseaux peuvent être étendus à une représentation duale des maillages triangulaires de surfaces, où les nœuds représentent alors les facettes triangulaires en lieu des sommets du maillage. Cette représentation duale offre plusieurs avantages par rapport à la représentation primaire basée sur les sommets : (i) elle est régulière, c'est-à-dire que chaque facette triangulaire a exactement trois voisins (ii) plusieurs propriétés des formes sont naturellement définies sur les facettes, par exemple les normales à la surface ou l'aire de la surface. Nous avons également évalué cette approche avec la mise en correspondance de formes 3D et nous avons aussi étudié sa robustesse aux changements de connectivité des maillages considérés.