Modélisation de la similarité perceptuelle de textures visuelles statiques et dynamiques : application à l’optimisation perceptuelle de la compression vidéo
Auteur / Autrice : | Karam Adil Naser |
Direction : | Patrick Le Callet, Vincent Ricordel |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences et technologies de l’information et de la communication |
Date : | Soutenance le 19/05/2017 |
Etablissement(s) : | Nantes |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et mathématiques (Nantes) |
Partenaire(s) de recherche : | COMUE : Université Bretagne Loire (2016-2019) |
Laboratoire : Laboratoire des Sciences du Numérique de Nantes | |
Jury : | Président / Présidente : Olivier Déforges |
Examinateurs / Examinatrices : Amy Reibman, Marta Mrak, Marc Antonini | |
Rapporteurs / Rapporteuses : Jens-Rainer Ohm, Marco Cagnazzo |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Les textures sont des signaux particuliers dans la scène visuelle, où elles peuvent couvrir de vastes zones. Elles peuvent être classées en deux catégories : statique et dynamique, où les textures dynamiques impliquent des variations temporelles. Plusieurs travaux sur la perception des textures statiques ont permis de définir des mesures de similarité visuelle pour des applications comme la reconnaissance ou la classification de textures. Ces mesures utilisent souvent une représentation inspirée du traitement neuronal du système visuel humain. Cependant de telles approches ont été peu explorées dans le cas de textures dynamiques. Dans cette thèse, un modèle perceptuel généralisé pour la mesure de similarité applicable aux textures statiques et dynamiques, a été développé. Ce modèle est inspiré du traitement effectué dans le cortex visuel primaire. Il s’avère très efficace pour des applications de classification et de reconnaissance de textures. L’application du modèle dans le cadre de l’optimisation perceptuelle de la compression vidéo, a été également étudiée. En particulier, l’intégration de la mesure de similarité entre textures, a été utilisée pour l’optimisation débit-distorsion de l’encodeur. Les résultats expérimentaux avec observateurs humains montrent une qualité visuelle améliorée des vidéos ainsi codés/décodées, avec une réduction significative du débit par rapport aux approches traditionnelles.