Algorithmes de classification répartis sur le cloud

Matthieu Durut

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Matthieu Durut
Direction :	Fabrice Rossi
Type :	Thèse de doctorat
Discipline(s) :	Informatique et Réseaux
Date :	Soutenance le 28/09/2012
Etablissement(s) :	Paris, ENST
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche :	Laboratoire : Laboratoire Traitement et Communication de l'Information (Paris) / LTCI
Jury :	Président / Présidente : Laurent Pautet
	Examinateurs / Examinatrices : Ludovic Denoyer, Joannès Vermorel, Djamal Zeghlache
	Rapporteurs / Rapporteuses : Frédéric Magoulès, Michel Verleysen

Mots clés

FR |

EN

Mots clés contrôlés

Traitement réparti

Classification

Vitesse de convergence (analyse numérique)

Informatique dans les nuages

Mots clés libres

Algorithme des k-moyennes

Cloud computing

Résumé

FR |

EN

Les thèmes de recherche abordés dans ce manuscrit ont trait à la parallélisation d’algorithmes de classiﬁcation non-supervisée (clustering) sur des plateformes de Cloud Computing. Le chapitre 2 propose un tour d’horizon de ces technologies. Nous y présentons d’une manière générale le Cloud Computing comme plateforme de calcul. Le chapitre 3 présente l’offre cloud de Microsoft : Windows Azure. Le chapitre suivant analyse certains enjeux techniques de la conception d’applications cloud et propose certains éléments d’architecture logicielle pour de telles applications. Le chapitre 5 propose une analyse du premier algorithme de classiﬁcation étudié : le Batch K-Means. En particulier, nous approfondissons comment les versions réparties de cet algorithme doivent être adaptées à une architecture cloud. Nous y montrons l’impact des coûts de communication sur l’efﬁcacité de cet algorithme lorsque celui-ci est implémenté sur une plateforme cloud. Les chapitres 6 et 7 présentent un travail de parallélisation d’un autre algorithme de classiﬁcation : l’algorithme de Vector Quantization (VQ). Dans le chapitre 6 nous explorons quels schémas de parallélisation sont susceptibles de fournir des résultats satisfaisants en terme d’accélération de la convergence. Le chapitre 7 présente une implémentation de ces schémas de parallélisation. Les détails pratiques de l’implémentation soulignent un résultat de première importance : c’est le caractère en ligne du VQ qui permet de proposer une implémentation asynchrone de l’algorithme réparti, supprimant ainsi une partie des problèmes de communication rencontrés lors de la parallélisation du Batch K-Means.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Algorithmes de classification répartis sur le cloud

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Algorithmes de classification répartis sur le cloud

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses