Approximation Algorithms and Sketches for Clustering

David Saulpic

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Algorithmes d'approximation et sketches pour les problèmes de clustering

FR |

EN

Auteur / Autrice :	David Saulpic
Direction :	Christoph Dürr, Vincent Cohen-Addad
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 13/09/2022
Etablissement(s) :	Sorbonne université
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche :	Laboratoire : LIP6 (1997-....)
Jury :	Président / Présidente : Cristina Bazgan
	Examinateurs / Examinatrices : Chris Schwiegelshohn, Monika Henzinger
	Rapporteurs / Rapporteuses : Laurent Viennot, Robert Krauthgamer

Mots clés

FR |

EN

Mots clés contrôlés

Analyse de données

Algorithmes optimaux

Algorithmes d'approximation

Mots clés libres

Résumé

FR |

EN

Cette thèse présente des contributions à l'étude théorique des problèmes de clustering. Le vaste objectif de ces problèmes est de partitionner un ensemble de données en groupes, telles que les données d'un même groupe soient similaires. Les problèmes des k-médianes et des k-moyennes sont des façons habituelles de modéliser formellement ce problème, sur lesquelles nous nous concentrons dans cette thèse. Dans la première partie, nous présentons un schéma d'approximation en temps linéaire quand l'entrée est dans un espace Euclidien de dimension constante (ou, plus généralement, de doubling dimension constante), i.e., un algorithme très rapide qui calcule une approximation très précise de la solution optimale. Nous étendons les techniques utilisées pour traiter le problème du point de vue de la confidentialité différentielle. Dans la seconde partie, nous cherchons à calculer des représentation simplifiée de l'entrée, qui préservent la structure du problème: nous introduisons plusieurs techniques pour réduire le nombre de donnée, tout en s'assurant que résoudre le problème après la réduction soit presque équivalent à le résoudre sur l'ensemble initial. Nous montrons aussi que dans plusieurs cas, nos techniques sont optimales. Dans le cas particulier des espaces Euclidiens, une autre façon de simplifier l'entrée est de réduire la dimension (en préservant de la même façon la structure de l'entrée). Nous présentons le premier algorithme déterministe pour atteindre une dimension presque optimale. Finalement, nous utilisons les algorithmes et techniques introduits précédemment pour calculer très rapidement des indicateurs statistiques.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Algorithmes d'approximation et sketches pour les problèmes de clustering

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Algorithmes d'approximation et sketches pour les problèmes de clustering

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses