Thèse soutenue

Proposition d’approches utilisant les réseaux de neurones profonds et les méthodes géométriques pour la reconstruction d’un visage 3D à partir d’une seule image
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Oussema Bouafif
Direction : Mohamed Daoudi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 25/06/2021
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Lille Douai
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur (Lille)
Partenaire(s) de recherche : Entreprise : Mcq-Scan
Laboratoire : IMT Lille Douai - Centre de Recherche en Informatique, Signal et Automatique de Lille
Jury : Président / Présidente : Olivier Colot
Examinateurs / Examinatrices : Bogdan Khomutenko, Catherine Soladié
Rapporteurs / Rapporteuses : Kevin Bailly, Rachid Oulad Haj Thami

Résumé

FR  |  
EN

La reconstruction 3D d’un visage à partir d’une image 2D est un problème fondamental de la vision par ordinateur qui suscite un intérêt considérable en raison de ses diverses applications telles que la surveillance, la santé, les jeux-vidéo, le cinéma, etc. Cette thèse présente deux approches hybrides de reconstruction 3D de visage à partir d’une image couleur 2D qui combinent les techniques d’apprentissage profond et de géométrie. Pour faire face au manque de données nécessaires à l’apprentissage des réseaux de neurones, un générateur de têtes humaines synthétiques a été conçu. Ce qui a permis de constituer une base de données d’images faciales avec plusieurs cartes qui contiennent des informations caractéristiques de la géométrie du visage. Les deux approches de reconstruction de visage 3D utilisent des CNN pour produire deux types de cartes à partir d’une image d’un visage humain. La première approche produit une carte de champ des normales et une carte du module de gradient de la carte de profondeur du visage. Par la suite, ces deux sorties sont utilisées dans un processus d’intégration du champ des normales basée sur les moindres carrées pondérées pour générer une surface faciale 3D. Dans la deuxième approche, le réseau de neurones produit une carte de points de repère et une carte de champ des normales similaires à celle produite dans la première approche. Elles sont utilisées dans un processus de régression qui vise à trouver la meilleure combinaison linéaire des bases d’un modèle paramétrique (3DMM) et d’obtenir ainsi le modèle 3D qui s’ajuste au visage présent dans l’image d’entrée.