Réduction de complexité de l’encodage vidéo VVC à l’aide de techniques d’apprentissage automatique : prédiction intra
Auteur / Autrice : | Naïma Zouidi |
Direction : | Daniel Ménard, Nouri Masmoudi |
Type : | Thèse de doctorat |
Discipline(s) : | Signal, Image, Vision |
Date : | Soutenance le 19/12/2023 |
Etablissement(s) : | Rennes, INSA en cotutelle avec Université de Sfax (Tunisie) |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Institut d'Électronique et de Télécommunications (Rennes) |
Jury : | Président / Présidente : François-Xavier Coudoux |
Examinateurs / Examinatrices : Daniel Ménard, Nouri Masmoudi, François-Xavier Coudoux, Anissa Mokraoui, Mohamed Atri, Maher Jridi, Amina Kessentini, Wassim Hamidouche | |
Rapporteurs / Rapporteuses : Anissa Mokraoui, Mohamed Atri |
Mots clés
Mots clés contrôlés
Résumé
En juillet 2020, la nouvelle norme de codage vidéo, appelle Versatile Video Coding (VVC), a été publiée par le groupe Joint Video Experts Team (JVET). Cette norme permet un niveau plus élevé de polyvalence avec une meilleure performance en compression vidéo par rapport à son prédécesseur, High-Efficiency Video Coding (HEVC). En effet, elle introduit plusieurs nouveaux outils de codage tels que les modes de prédiction intra à granularité plus fine (IPMs) et la division QuadTree Multi-type Tree (QTMT). Étant donné que la recherche des meilleures décisions de codage est généralement précédée par l’optimisation du coût en distorsion et débit binaire, l’introduction de nouveaux outils de codage ou l’amélioration des outils existants nécessite des calculs supplémentaires. En fait, la norme VVC est 31 fois plus complexe que la norme HEVC. Par conséquent, cette thèse vise à réduire la complexité de calcul de la norme VVC et plus particulièrement au niveau des outils de prédiction Intra. Elle étudie en premiers lieu les opportunités de réduction de la complexité dans la décision du mode intra de la norme VVC. Puis, deux algorithmes rapides de décision de mode de prédiction intra basé sur des modèles d’apprentissage automatique telles que les réseaux de neurones convolutifs multi-tachés et l’arbre de décision LightGradient Boosting Machine (Light-GBM) ont été proposés.