Thèse en cours

A PRIORI GÉOMÉTRIQUES POUR LES MODÈLES D'APPRENTISSAGE PROFOND DANS LES NUAGES DE POINTS 3D

FR  |  
EN
Auteur / Autrice : Pierre Onghena
Direction : Santiago Velasco-ForeroBeatriz Marcotegui
Type : Projet de thèse
Discipline(s) : Morphologie mathématique
Date : Inscription en doctorat le 01/10/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique (Paris)
Partenaire(s) de recherche : Laboratoire : Mathématiques et Systèmes
Equipe de recherche : CMM - Centre de Morphologie Mathématique
établissement opérateur d'inscription : Mines Paris-PSL

Résumé

FR  |  
EN

Les modèles d'apprentissage profond constituent l'état de l'art en matière de segmentation et de classification d'objets dans de multiples tâches. Cependant, l'une des principales faiblesses des modèles d'apprentissage profond est la difficulté de comprendre leurs décisions et/ou de restreindre les résultats en fonction des connaissances préalables sur le problème. Nous pensons que l'inclusion/utilisation de connaissances d'experts réduirait l'effort d'annotation tout en améliorant l'interprétabilité du réseau. Dans cette thèse, nous souhaitons explorer la possibilité d'utiliser les connaissances géométriques préalables suivantes pour les modèles d'apprentissage profond dans les nuages de points 3D : (1) Informations relatives aux caractéristiques morphologiques/de forme telles que la taille, le nombre de composants. Des travaux antérieurs ont montré l'intérêt d'inclure des caractéristiques morphologiques dans l'apprentissage supervisé et des descripteurs de forme pour la segmentation. pour la segmentation. (2) Relations géométriques et spatiales des objets (être à côté de, être au-dessus de, être à l'intérieur de), être à l'intérieur). Pour les CNN, l'inclusion d'informations sur les symétries a permis de réduire la taille des modèles et de produire des modèles invariants par rapport à la construction sans perte significative de performance. Des exemples de ces méthodes comprennent la convolution de groupe, les images mobiles, les dérivées gaussiennes. dérivés gaussiens. (3) La structure hiérarchique des objets d'intérêt est un moyen naturel de coder l'information selon différents niveaux de simplification. Dans ce domaine, nous souhaitons explorer l'utilisation de hiérarchies basées sur la vérité terrain, basées sur des hiérarchies morphologiques et/ou combinées avec les invariances de (2).