Thèse soutenue

Vers le déploiement du codage vidéo neuronal appris de bout en bout

FR  |  
EN
Auteur / Autrice : Marwa Tarchouli
Direction : Olivier DéforgesThomas Guionnet
Type : Thèse de doctorat
Discipline(s) : Signal, Image, Vision
Date : Soutenance le 04/07/2024
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes)
Partenaire(s) de recherche : Entreprise : ATEME
Laboratoire : @Institut d'Électronique et des Technologies du numéRique
Jury : Président / Présidente : Frédéric Dufaux
Examinateurs / Examinatrices : Thomas Guionnet, Anissa Mokraoui, Touradj Ebrahimi, Meriem Bayou-Outtas
Rapporteurs / Rapporteuses : Frédéric Dufaux, Anissa Mokraoui, Touradj Ebrahimi

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’évolution exponentielle de la consommation de vidéo a engendré une demande croissante pour une qualité de vidéo supérieure avec des résolutions plus élevées. Cette demande incite à perfectionner les algorithmes de codage vidéo, introduisant ainsi, la norme VVC en 2020, qui offre une amélioration des performances débit-distorsion de 50% par rapport à son prédécesseur HEVC. En outre, les récentes avancées des algorithmes d’apprentissage profond ont démontré des performances remarquables dans divers domaines notamment dans le traitement d’image, ce qui a suscité l’intérêt des communautés de la compression vidéo et l’intelligence artificielle. Ces facteurs ont contribué à l’émergence de la compression neuronale. Cette thèse explore les systèmes de compression neuronale des vidéos, en se focalisant sur deux méthodologies principales : les codecs basés sur les VAEs et les codecs basés sur les INRs. Alors que les codecs basés sur les VAEs ont surpassé les performances du dernier codec vidéo VVC, leur complexité accrue présente des défis pour un déploiement pratique dans l’industrie. En revanche, les codecs basés sur les INR sont conçus pour maintenir une faible complexité et intègrent des réseaux adaptatifs au contenu. Néanmoins, ils n’ont pas encore atteint un niveau d’efficacité de codage suffisant pour rivaliser avec les codecs vidéo traditionnels. Dans cette thèse, une première contribution est proposée pour les codecs basés sur les VAE afin d’atténuer le problème de complexité de calcul accrue. De plus, une deuxième contribution est introduite pour améliorer l’efficacité de codage des codecs basés sur les INRs.