Étude de la distance de transfert entre partitions et recherche de zones denses dans un graphe
Auteur / Autrice : | Lucile Denoeud |
Direction : | Olivier Hudry |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2006 |
Etablissement(s) : | Paris 1 |
Mots clés
Résumé
Ce travail de thèse comporte deux axes principaux. Tout d'abord, on étudie un indice de distance entre partitions, la distance de transfert, qui correspond au nombre minimum d'éléments qui doivent être transférés d'une classe dans une autre (éventuellement vide) pour passer d'une partition à l'autre. On étudie principalement les valeurs maximales de cette distance sur différents ensembles de partitions, suivant que les partitions considérées ont des caractéristiques fixées ou non (nombre de classes, cardinaux des classes). Enfin on étudie la distribution de l'ensemble des partitions en fonction de leur distance de transfert à une partition donnée, puis on utilise cette distance afin de comparer des indices usuels de proximité entre partitions. Dans une deuxième partie, on propose une méthode de classification empiétante dans un graphe, issue d'une problématique biologique. Cette méthode traite des graphes non complets, non orientés et non pondérés dans lesquels les arêtes correspondent à une similarité entre leurs extrémités. Le but est alors de mettre en évidence des sous-ensembles de sommets formant des zones denses en arêtes dans le graphe. Cette méthode est composée de trois étapes: tout d'abord on crée des noyaux initiaux des classes par le biais d'une fonction de densité locale défmie sur les sommets du graphe; on améliore ensuite ces noyaux au moyen d'une méthode de type nuées dynamiques; enfin on étend ces noyaux de manière empiétante suivant un critère sur la qualité des classes obtenues. On teste cette méthode sur des graphes engendrés aléatoirement, et on l'applique ensuite à des données biologiques réelles.