Thèse en cours

Vers une accélération de la synthèse d'images photoréalistes grâce à l'apprentissage par renforcement

FR  |  
EN
Auteur / Autrice : Franck Vandewiele
Direction : Samuel DelepoulleChristophe Renaud
Type : Projet de thèse
Discipline(s) : Informatique-25DIN0
Date : Inscription en doctorat le 04/10/2023
Etablissement(s) : Littoral
Ecole(s) doctorale(s) : Sciences, Technologie, Santé
Partenaire(s) de recherche : Laboratoire : LISIC - Laboratoire d'Informatique, Signal et Image de la Côte d'Opale

Résumé

FR  |  
EN

La simulation d'éclairage est un sous-domaine de la synthèse d'images qui vise à calculer la propagation des chemins lumineux entre une source de lumière et un capteur (caméra, œil) au sein d'une scène 3D virtuelle. Les images obtenues sont qualifiées de photo-réalistes, au sens où la majorité des phénomènes physiques sous-jacents est simulée : propagation des rayons lumineux avec ou sans milieux participants (air, fumées, etc.), interactions précises entre la lumière et les matériaux dont sont constitués les objets (réflexions directionnelles, phénomènes de réfraction, etc.) L'équation du rendu est une équation fondamentale utilisée en informatique graphique pour modéliser l'interaction de la lumière avec les objets d'une scène virtuelle. Elle décrit comment la lumière est émise par une source, réfléchie, absorbée et transmise à travers les surfaces pour finalement atteindre l'œil du spectateur ou la caméra. L'estimation de Monte Carlo permet de résoudre l'équation du rendu par échantillonnage stochastique : des échantillons aléatoires sont générés pour estimer les différentes composantes de l'équation du rendu. Ces échantillons sont ensuite pondérés et combinés afin de calculer une estimation de la luminance des objets de la scène. L'un des principaux problèmes des algorithmes utilisés réside dans leur temps de convergence très long vers l'image finale (de l'ordre de plusieurs heures pour une image de taille raisonnable), restreignant d'autant leur diffusion dans le domaine de la production audiovisuelle, pour lequel des dizaines de milliers d'images doivent être calculées par heure de vidéo. Dans ce contexte, ce projet vise à explorer la manière dont les avancées récentes en matière d'apprentissage automatique peuvent être exploitées pour accélérer la convergence des méthodes existantes de simulation d'éclairage, en vue de fournir des images exploitables plus rapidement. Les travaux s'intéresseront principalement aux méthodes d'apprentissage par renforcement, dans le contexte d'images statiques et d'animations. Les travaux de Dahm et Keller en 2017 ont montré que les équations utilisées pour l'apprentissage par renforcement et pour la simulation du transport de la lumière sont étroitement liées. Ils ont proposé une méthode permettant d'apprendre l'importance de chaque contribution tout en échantillonnant l'espace des chemins. Cette approche utilise l'apprentissage par renforcement pour apprendre progressivement d'où vient la lumière, et en utilisant ces informations pour l'échantillonnage d'importance, les informations sur la visibilité sont également prises en compte. Ces travaux s'appuient sur l'équation de Bellman et son utilisation dans le Q-learning. Les algorithmes d'apprentissage par renforcement ont toutefois connu de nombreuses améliorations au cours de la dernière décennie. Ils peuvent ainsi désormais traiter des situations caractérisées par un grand nombre de dimensions avec des états et des actions continus. Par exemple, l'algorithme PPO (Proximal Policy Optimization) proposé par Schulman et al. est un algorithme d'apprentissage par renforcement utilisé pour entraîner des agents à prendre des décisions dans un environnement complexe. L'objectif de l'algorithme est d'optimiser une politique de prise de décision, c'est-à-dire une fonction qui associe à chaque état de l'environnement une distribution de probabilité dans l'espace des actions pouvant être entreprises. L'algorithme PPO se base sur la méthode de descente de gradient stochastique pour ajuster la politique de manière itérative.