Thèse soutenue

FR
Accès à la thèse
Auteur / Autrice : Nicolas Thorstensen
Direction : Renaud Keriven
Type : Thèse de doctorat
Discipline(s) : Mathématiques. Informatique
Date : Soutenance en 2009
Etablissement(s) : Paris Est

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Extrait du résumé français : Grâce aux bases de données en ligne, le volume de données ne cesse d accroitre. Non seulement la quantité de donnes augmente mais aussi la complexité des donnes est hautement complexe. Ce fait nécessite le développement d algorithmes performants. Récemment, une nouvelle classe de méthodes connue sous le nom de: "apprentissage de variétés" a été introduite. Ces méthodes présentent un formalisme intéressant et performant pour l analyse de données à très haute dimension. Ces méthode assument que les degrés de liberté dans les données sont bien plus petit que la dimension de l espace des données. Le but de ces algorithmes est retrouve une variété plongée dans un espace à haute dimension (voire infinie). La sortie d un tel algorithme est une fonction transformant les données dans un espace (espace de feature) où l'analyse devient plus facile. Souvent cette fonction est considère comme une para métrisation de la variété. Dans la première partie de ce manuscrit, nous allons introduire les idées principales ainsi que la théorie des espaces métriques. Ceci nous fournira les outils de bases pour les méthodes d'apprentissage de variétés. Par la suite nous présenterons des méthodes linéaires et non- linéaires pour l'apprentissage de variétés et analyserons leurs points forts et faibles. La deuxième partie développera deux applications en utilisant l'apprentissage des variétés. Dans les deux cas l'apprentissage de variétés est appliqué pour approximer le métrique dans l espace initiale. Ainsi la distance entre points dans l'espace originale peut être approximé en utilisant la métrique dans l'espace feature. Ainsi nous pouvant résoudre des problèmes d optimisation basée sur les distances entre points. Dans cette idée nous regardons le premier problème connu sous le nom "problème de la pré-image"