Thèse soutenue

Réduction de complexité de l’encodage vidéo VVC à l’aide de techniques d’apprentissage automatique : prédiction intra

FR  |  
EN
Auteur / Autrice : Naïma Zouidi
Direction : Daniel MénardNouri Masmoudi
Type : Thèse de doctorat
Discipline(s) : Signal, Image, Vision
Date : Soutenance le 19/12/2023
Etablissement(s) : Rennes, INSA en cotutelle avec Université de Sfax (Tunisie)
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Institut d'Électronique et de Télécommunications (Rennes)
Jury : Président / Présidente : François-Xavier Coudoux
Examinateurs / Examinatrices : Daniel Ménard, Nouri Masmoudi, François-Xavier Coudoux, Anissa Mokraoui, Mohamed Atri, Maher Jridi, Amina Kessentini, Wassim Hamidouche
Rapporteurs / Rapporteuses : Anissa Mokraoui, Mohamed Atri

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

En juillet 2020, la nouvelle norme de codage vidéo, appelle Versatile Video Coding (VVC), a été publiée par le groupe Joint Video Experts Team (JVET). Cette norme permet un niveau plus élevé de polyvalence avec une meilleure performance en compression vidéo par rapport à son prédécesseur, High-Efficiency Video Coding (HEVC). En effet, elle introduit plusieurs nouveaux outils de codage tels que les modes de prédiction intra à granularité plus fine (IPMs) et la division QuadTree Multi-type Tree (QTMT). Étant donné que la recherche des meilleures décisions de codage est généralement précédée par l’optimisation du coût en distorsion et débit binaire, l’introduction de nouveaux outils de codage ou l’amélioration des outils existants nécessite des calculs supplémentaires. En fait, la norme VVC est 31 fois plus complexe que la norme HEVC. Par conséquent, cette thèse vise à réduire la complexité de calcul de la norme VVC et plus particulièrement au niveau des outils de prédiction Intra. Elle étudie en premiers lieu les opportunités de réduction de la complexité dans la décision du mode intra de la norme VVC. Puis, deux algorithmes rapides de décision de mode de prédiction intra basé sur des modèles d’apprentissage automatique telles que les réseaux de neurones convolutifs multi-tachés et l’arbre de décision LightGradient Boosting Machine (Light-GBM) ont été proposés.