Thèse soutenue

Optimisation du compromis débit-distorsion pour le codage d’images stéréoscopiques utilisant une métrique conjointe entropie-distortion

FR  |  
EN
Auteur / Autrice : Aysha-Khatoon Kadaikar
Direction : Anissa MokraouiGabriel Dauphin
Type : Thèse de doctorat
Discipline(s) : Signaux et Images
Date : Soutenance le 20/11/2017
Etablissement(s) : Sorbonne Paris Cité
Ecole(s) doctorale(s) : École doctorale Galilée (Villetaneuse, Seine-Saint-Denis)
Partenaire(s) de recherche : Laboratoire : Laboratoire de traitement et transport de l'information (Villetaneuse, Seine-Saint-Denis)
Etablissement de préparation : Université Sorbonne Paris Nord (Bobigny, Villetaneuse, Seine-Saint-Denis ; 1970-....)
Jury : Président / Présidente : Maria Trocan
Rapporteur / Rapporteuse : Marco Cagnazzo, François-Xavier Coudoux

Mots clés

FR  |  
EN

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Ces dernières décennies ont vu émerger de nombreuses applications utilisant la technologie 3D, telles que les écrans auto-stéréoscopiques, les écrans de télévisions 3D ou encore la visio-conférence stéréoscopique. Ces applications requièrent des techniques adaptées afin que leur flux de données soit compressé efficacement. En particulier, dans le cas des images stéréoscopiques, ces dernières étant composées de deux vues de la même scène, elles nécessitent à ce titre deux fois plus d’informations à transmettre ou à stocker que dans le cas des images 2D traditionnelles. Nos travaux se situent dans le cadre de la compression des images stéréoscopiques. Plus précisément, ils concernent l’amélioration de l’estimation de la carte de disparité dans le but d’obtenir un meilleur compromis entre le débit binaire nécessaire au codage de la carte de disparité et la qualité de l’image prédite.Généralement, la carte de disparité est estimée en minimisant la distorsion de l’image prédite. Cette minimisation peut être sujette à une contrainte de lissage. L’idée étant qu’une carte de disparité plus lisse nécessitera un débit binaire moindre en supposant que les mêmes vecteurs de disparités seront sélectionnés plus souvent. Néanmoins cette contrainte de lissage ne permet pas toujours de diminuer le coût binaire de la carte. Le lissage peut entraîner par ailleurs une augmentation notable de la distorsion de l’image prédite. Dans le premier chapitre de la thèse, nous présentons un algorithme d’estimation de carte de disparité minimisant une métrique conjointe entropie-distorsion. Le coût binaire finale de la carte de disparité est estimée à chaque étape de l’algorithme et est intégré dans le calcul de la métrique. La distorsion globale de la carte de disparité est aussi mise à jour au fur et à mesure du traitement de l’image. Par ailleurs, cette algorithme repose sur la construction séquentiel d’un arbre dont on ne garde qu’un nombre défini de branches à chaque profondeur de l’arbre. Ainsi, l’algorithme développé apporte une solution sous-optimale en minimisant le coût binaire de la carte de disparité tout en assurant une bonne qualité de l’image prédite. Le chapitre deux étend l’algorithme précédent au cas des images non rectifiées. Dans le troisième chapitre, nous nous intéressons au fait de trouver une solution au problème d’optimisation du compromis débit-distorsion en réduisant la complexité numérique par rapport à l’algorithme précédent. De ce fait, nous avons développé le R-algorithme qui se base sur une solution initiale de Référence (celle minimisant la distorsion de l’image prédite) et la modifie successivement tant qu’une amélioration est constatée en termes de compromis débit-distorsion. Le quatrième chapitre s’intéresse toujours au fait d’accroître les performances de l’algorithme développé tout en réduisant le coût en complexité numérique et donc en temps de traitement. Nous proposons deux approches afin de tirer profit d’un grand espace de recherche sans avoir à tester pour chaque bloc à apparier l’ensemble des disparités qui composent cet espace de recherche. En effet, un espace de recherche plus grand permet plus de choix de disparités et donc potentiellement une meilleur reconstruction de l’image prédite. En contrepartie, il se peut que le coût binaire de la carte de disparité augmente si l’ensemble des disparités sélectionnées constituent un ensemble plus divers qu’auparavant. Les deux approches proposées permettent de restreindre l’espace de recherche à un ensemble composées de certaines disparités permettant de minimiser la distorsion de l’image prédite pour un débit donné. Le dernier chapitre de la thèse s’intéresse à l’utilisation des blocs de taille variable pour la compression des images stéréoscopiques.