Modèles génératifs pour des données visuelles complexes
Auteur / Autrice : | Marlène Careil |
Direction : | Marco Cagnazzo, Jakob Verbeek |
Type : | Projet de thèse |
Discipline(s) : | Informatique, données, IA |
Date : | Inscription en doctorat le 22/03/2021 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) |
Equipe de recherche : MM : MultiMédia |
Mots clés
Résumé
Des progrès remarquables ont été observés ces dernières années concernant la modélisation de distributions de données complexes grâce aux réseaux de neurones profonds, permettant une amélioration considérable des modèles génératifs pour les images, vidéos et autres contenus. Cependant, malgré les avancées, ces modèles génératifs ont un champ d'application qui reste très limité, ce qui motive plusieurs axes de recherche. Premièrement, un des facteurs limitants est la faible complexité des données traitées par les modèles actuels. Or, la segmentation sémantique indiquant la position et le type d'objets présents dans l'image pourrait être un élément clé améliorant la diversité et complexité des images générées. Il s'agirait de développer des modèles capables d'extraire des informations haut niveau sur la structure sémantique des données qui guideraient la génération d'images. Par ailleurs, face à la difficulté des modèles génératifs à généraliser et obtenir de bons résultats à partir de peu de données, une solution serait d'utiliser des techniques dites de « transfer learning » et « multi-task learning » déjà couramment exploitées pour les modèles discriminatifs, mais peu explorées pour les modèles génératifs. Enfin, il existe un compromis entre le réalisme et la diversité des images générées qu'il est actuellement difficile de maitriser. Il serait souhaitable d'acquérir une meilleure compréhension des mécanismes à l'origine de cette tension afin de mieux la contrôler.