Plongement de graphe pour très grosses bases de données
Auteur / Autrice : | Félix Lefebvre |
Direction : | Gaël Varoquaux |
Type : | Projet de thèse |
Discipline(s) : | Informatique mathématique |
Date : | Inscription en doctorat le 01/01/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : Centre INRIA Saclay - Île-de-France |
Equipe de recherche : Parietal - Modélisation de la structure, du fonctionnement et de la variabilité du cerveau à partir d'IRM à haut champ | |
Référent : Faculté des sciences d'Orsay |
Mots clés
Résumé
Des progrès récents extraient des représentations de bases de données ou graphes de connaissance en utilisant des plongements vectoriels de graphes. Cependant, ces techniques ne montent pas à l'échelle pour les grandes bases, entre autre parce que la mémoire des GPUs n'est pas suffisamment grande pour y stocker la représentation associée à chaque nud du graphe ou entité. Le but de cette thèse est de développer des méthodes de plongement vectoriel adaptées aux très gros graphes de connaissance, par exemple en explorant des approches multiéchelles, et de générer ainsi des représentations numériques pour un très grand nombre d'entités. Il s'agira de concilier efficacité en temps de calcul, en mémoire, mais aussi qualité statistique des représentations obtenues pour une variété de tâches statistiques.