Algorithmes d'apprentissage et logiciels pour la statistique, avec applications à la bioinformatique
Auteur / Autrice : | Toby Dylan Hocking |
Direction : | Francis Bach |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 20/11/2012 |
Etablissement(s) : | Cachan, Ecole normale supérieure |
Ecole(s) doctorale(s) : | École doctorale Sciences pratiques (1998-2015 ; Cachan, Val-de-Marne) |
Jury : | Examinateurs / Examinatrices : Jean-Philippe Vert, Idris Eckley, Isabelle Janoueix-Lerosey |
Rapporteur / Rapporteuse : Stéphane Robin, Yves Grandvalet |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L'apprentissage statistique est le domaine des mathématiques qui aborde le développement des algorithmes d'analyse de données. Cette thèse est divisée en deux parties : l'introduction de modèles mathématiques et l'implémentation d'outils logiciels. Dans la première partie, je présente de nouveaux algorithmes pour la segmentation et pour le partitionnement de données (clustering). Le partitionnement de données et la segmentation sont des méthodes d'analyse qui cherche des structures dans les données. Je présente les contributions suivantes, en soulignant les applications à la bioinformatique. Dans la deuxième partie, je présente mes contributions au logiciel libre pour la statistique, qui est utilisé pour l'analyse quotidienne du statisticien.