Auteur / Autrice : | Oussema Bouafif |
Direction : | Mohamed Daoudi |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 25/06/2021 |
Etablissement(s) : | Ecole nationale supérieure Mines-Télécom Lille Douai |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Lille) |
Partenaire(s) de recherche : | Entreprise : Mcq-Scan |
Laboratoire : IMT Lille Douai - Centre de Recherche en Informatique, Signal et Automatique de Lille | |
Jury : | Président / Présidente : Olivier Colot |
Examinateurs / Examinatrices : Bogdan Khomutenko, Catherine Soladié | |
Rapporteurs / Rapporteuses : Kevin Bailly, Rachid Oulad Haj Thami |
Mots clés
Résumé
La reconstruction 3D d’un visage à partir d’une image 2D est un problème fondamental de la vision par ordinateur qui suscite un intérêt considérable en raison de ses diverses applications telles que la surveillance, la santé, les jeux-vidéo, le cinéma, etc. Cette thèse présente deux approches hybrides de reconstruction 3D de visage à partir d’une image couleur 2D qui combinent les techniques d’apprentissage profond et de géométrie. Pour faire face au manque de données nécessaires à l’apprentissage des réseaux de neurones, un générateur de têtes humaines synthétiques a été conçu. Ce qui a permis de constituer une base de données d’images faciales avec plusieurs cartes qui contiennent des informations caractéristiques de la géométrie du visage. Les deux approches de reconstruction de visage 3D utilisent des CNN pour produire deux types de cartes à partir d’une image d’un visage humain. La première approche produit une carte de champ des normales et une carte du module de gradient de la carte de profondeur du visage. Par la suite, ces deux sorties sont utilisées dans un processus d’intégration du champ des normales basée sur les moindres carrées pondérées pour générer une surface faciale 3D. Dans la deuxième approche, le réseau de neurones produit une carte de points de repère et une carte de champ des normales similaires à celle produite dans la première approche. Elles sont utilisées dans un processus de régression qui vise à trouver la meilleure combinaison linéaire des bases d’un modèle paramétrique (3DMM) et d’obtenir ainsi le modèle 3D qui s’ajuste au visage présent dans l’image d’entrée.