Image statistical learning using mixture models

par Charbel Julien

Thèse de doctorat en Informatique

Sous la direction de Djamel Abdelkader Zighed et de Lorenza Saitta.

Soutenue en 2008

à Lyon 2 en cotutelle avec l'Università degli studi (Turin, Italie) .


  • Résumé

    Les travaux de la thèse ont porté essentiellement sur la modélisation du contenu visuel de bas niveau des images (Couleur, Texture, etc…). La modélisation de contenu visuel est la première étape à considérer dans tout système automatique de recherche d'image par contenu, y compris les approches d'apprentissage supervisé, non-supervisé, et semi-supervisé. Dans cette thèse nous avons choisi de modéliser le contenu visuel de bas niveau, par une signature « discret distribution » ou par un modèle du mélange « GMM » au lieu des simples modèles statistiques largement utilisés dans la littérature. En utilisant ces deux types de représentation, un prototype de clustering des bases d'images a été implémenté. Ce prototype est capable d'extraire les signatures et les GMM qui représentent les images, elles sont sauvegardées pour des traitements ultérieurs y compris le clustering des images. Dans ce type de représentation les distances classiques comme la distance Euclidienne, L-2 distance, etc. Ne seront plus applicables. Des distances qui nécessitent une optimisation linéaire peuvent être utilisées pour mesurer la distance entre signatures ou GMMs, exemple : « Mallows distance » et « Earth Mover’s distance EMD ». Calculer un vecteur moyen dans le cas où on utilise des vecteurs multidimensionnels, de longueur fixe, pour représenter les images peut être relativement facile. Par contre, dans notre cas un algorithme itératif qui nécessite de nouveau une optimisation linéaire a été proposé pour apprendre un modèle, signature ou GMM, et cela en exploitant les contraintes fixées par les utilisateurs.


  • Résumé

    This thesis addresses the problem of modeling the low level visual content (Color, Texture, etc…). Modeling the low level visual content is the first step in any content based image retrieval system. In this thesis we have chosen to model low-level visual content by using a discrete distribution (signature) or a discrete mixture model (GMM) as alternatives, instead of using a multi-dimensional feature vector. Learning a model by signature or by a GMM employing user constraints was presented also. In the literature many relevant works prove the better performance of this kind of image representation instead of the classical fixed-size feature vector. A prototype of image database browsing as well as a semi-automatic image organizing tool that exploits user feedbacks was proposed. Canonical distances such as Euclidian distance, L-2 distance, etc. Can’t be used in the case of signatures. Instead, distances like “Mallows distance” and “Earth Mover’s distance EMD” based on linear optimization are to be considered in the case of signatures. We use an iterative algorithm to compute a model that represents image-sets using user constraints. This optimization problem can be considered as an expectation maximization process. For the expectation step, a soft clustering, with a partial weight, is done with every component's distribution associated with a component of the mixture model we seek to compute. The expectation step is worked out by solving a linear optimization problem. Later, using these partial weights we recompute new components and new component-weights of the centroid, i. E. The maximization step.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (103 f.)
  • Annexes : Bibliogr. f. 98-103.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Lumière (Bron). Service commun de la documentation. Bibliothèque universitaire.
  • Consultable sur place dans l'établissement demandeur
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.