Thèse soutenue

Réduction de complexité de l’encodage vidéo VVC à l’aide de techniques d’apprentissage automatique

FR  |  
EN
Auteur / Autrice : Alexandre Tissier
Direction : Daniel Ménard
Type : Thèse de doctorat
Discipline(s) : Signal, Image, Vision
Date : Soutenance le 25/05/2022
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Institut d'Électronique et des Technologies du numéRique / IETR
Jury : Président / Présidente : François-Xavier Coudoux
Examinateurs / Examinatrices : François-Xavier Coudoux, Anissa Mokraoui, Marco Cagnazzo, Wassim Hamidouche, Jarno Vanne

Résumé

FR  |  
EN

La visualisation de contenu vidéo a été révolutionnée en une décennie avecl’émergence de nouveaux services tels que la vidéo à la demande, le streaming vidéoou les plateformes de partage vidéo. Les nouveaux formats vidéo et l’explosion du traficvidéo IP nécessitent de nouvelles techniques de compression vidéo encore plus efficacesque les techniques existantes. L’organisation JVET ISO/IEC, ITU-T a standardiséen juillet 2020 la norme de codage vidéo VVC ITU-T H.266 comme successeur de HEVC.Les nouveaux outils inclus dans VVC permettent une réduction de près de 40% du débit mais au détriment d’une augmentation significative de la complexité de calcul de l’encodeur, estimée à 859% (x8) par rapport à HEVC.L’objectif de ce travail de recherche est de proposer des techniques de réduction de la complexité de l’encodage VVC tout en minimisant la perte de qualité du codage. La première contribution analyse les possibilités de réduction de complexité du processus d’encodage VVC en fonction des outils de codage. Les contributions suivantes se concentre sur la réduction de la complexité du processus de partitionnement en arbre QT-MTT à l’aide de techniques de ML. Tout d’abord, une solution basée sur un CNN est développée afin d’extraire les probabilités de partitionnement associées aux différents segments présents au sein d’un CTU dans le cas d’une configuration AI. Une première technique de réduction de complexité exploitant ce CNN et utilisant un ensemble de seuils pré-calculés pour les prises de décision de partitionnement a été définie. Une seconde technique utilisant une approche de ML basée sur des arbres de décision (DT) pour la prise de décision de partitionnement est proposée. Finalement, une technique intégrant un CNN et une approche de ML basée DT est proposée dans le cas d’uneconfiguration inter.