Information-geometric methods for mixture models

par Olivier Schwander

Thèse de doctorat en Informatique

Sous la direction de Frank Nielsen.

Soutenue en 2013

à Palaiseau, Ecole polytechnique .

  • Titre traduit

    Méthodes de géométrie de l'information pour les modèles de mélange


  • Résumé

    Cette thèse présente de nouvelles méthodes pour l'apprentissage de modèles de mélanges basées sur la géométrie de l'information. Les modèles de mélanges considérés ici sont des mélanges de familles exponentielles, permettant ainsi d'englober une large part des modèles de mélanges utilisés en pratique. Grâce à la géométrie de l'information, les problèmes statistiques peuvent être traités avec des outils géométriques. Ce cadre offre de nouvelles perspectives permettant de mettre au point des algorithmes à la fois rapides et génériques. Deux contributions principales sont proposées ici. La première est une méthode de simplification d'estimateurs par noyaux. Cette simplification est effectuée à l'aide un algorithme de partitionnement, d'abord avec la divergence de Bregman puis, pour des raisons de rapidité, avec la distance de Fisher-Rao et des barycentres modèles. La seconde contribution est une généralisation de l'algorithme k-MLE permettant de traiter des mélanges où toutes les composantes ne font pas partie de la même famille: cette méthode est appliquée au cas des mélanges de Gaussiennes généralisées et des mélanges de lois Gamma et est plus rapide que les méthodes existantes. La description de ces deux méthodes est accompagnée d'une implémentation logicielle complète et leur efficacité est évaluée grâce à des applications en bio-informatique et en classification de textures.


  • Résumé

    This thesis presents new methods for mixture model learning based on information geometry. We focus on mixtures of exponential families, which encompass a large number of mixtures used in practice. With information geometry, statistical problems can be studied with geometrical tools. This framework gives new perspectives allowing to design algorithms which are both fast and generic. Two main contributions are proposed here. The first one is a method for simplification of kernel density estimators. This simplification is made with clustering algorithms, first with the Bregman divergence and next, for speed reason, with the Fisher-Rao distance and model centroids. The second contribution is a generalization of the k-MLE algorithm which allows to deal with mixtures where all the components do not belong to the same family: this method is applied to mixtures of generalized Gaussians and of Gamma laws and is faster than existing methods. The description of this two algorithms comes with a complete software implementation and their efficiency is evaluated through applications in bio-informatics and texture classification.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (163 p.)
  • Annexes : Bibliographie : 127 réf.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : École polytechnique. Bibliothèque Centrale.
  • Disponible pour le PEB
  • Bibliothèque : École polytechnique. Bibliothèque Centrale.
  • Disponible pour le PEB
  • Cote : G2A 279/2013/SCH
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.