Réduction de complexité de l’encodage vidéo VVC à l’aide de techniques d’apprentissage automatique
Auteur / Autrice : | Alexandre Tissier |
Direction : | Daniel Ménard |
Type : | Thèse de doctorat |
Discipline(s) : | Signal, Image, Vision |
Date : | Soutenance le 25/05/2022 |
Etablissement(s) : | Rennes, INSA |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Institut d'Électronique et des Technologies du numéRique / IETR |
Jury : | Président / Présidente : François-Xavier Coudoux |
Examinateurs / Examinatrices : François-Xavier Coudoux, Anissa Mokraoui, Marco Cagnazzo, Wassim Hamidouche, Jarno Vanne |
Mots clés
Résumé
La visualisation de contenu vidéo a été révolutionnée en une décennie avecl’émergence de nouveaux services tels que la vidéo à la demande, le streaming vidéoou les plateformes de partage vidéo. Les nouveaux formats vidéo et l’explosion du traficvidéo IP nécessitent de nouvelles techniques de compression vidéo encore plus efficacesque les techniques existantes. L’organisation JVET ISO/IEC, ITU-T a standardiséen juillet 2020 la norme de codage vidéo VVC ITU-T H.266 comme successeur de HEVC.Les nouveaux outils inclus dans VVC permettent une réduction de près de 40% du débit mais au détriment d’une augmentation significative de la complexité de calcul de l’encodeur, estimée à 859% (x8) par rapport à HEVC.L’objectif de ce travail de recherche est de proposer des techniques de réduction de la complexité de l’encodage VVC tout en minimisant la perte de qualité du codage. La première contribution analyse les possibilités de réduction de complexité du processus d’encodage VVC en fonction des outils de codage. Les contributions suivantes se concentre sur la réduction de la complexité du processus de partitionnement en arbre QT-MTT à l’aide de techniques de ML. Tout d’abord, une solution basée sur un CNN est développée afin d’extraire les probabilités de partitionnement associées aux différents segments présents au sein d’un CTU dans le cas d’une configuration AI. Une première technique de réduction de complexité exploitant ce CNN et utilisant un ensemble de seuils pré-calculés pour les prises de décision de partitionnement a été définie. Une seconde technique utilisant une approche de ML basée sur des arbres de décision (DT) pour la prise de décision de partitionnement est proposée. Finalement, une technique intégrant un CNN et une approche de ML basée DT est proposée dans le cas d’uneconfiguration inter.