Apprentissage de la Représentation Liée au Recrutement à partir de Graphes et de Données Séquentielles
Auteur / Autrice : | Jun Zhu |
Direction : | Céline Hudelot, Paul-Henry Cournède |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 28/03/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Interfaces : matériaux, systèmes, usages (Palaiseau, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Mathématiques et informatique pour la complexité et les systèmes (Gif-sur-Yvette, Essonne ; 2006-....) |
Référent : CentraleSupélec (2015-....) | |
graduate school : Université Paris-Saclay. Graduate School Sciences de l’ingénierie et des systèmes (2020-….) | |
Jury : | Président / Présidente : Marc Aiguier |
Examinateurs / Examinatrices : Julien Velcin, Lynda Tamine-Lechani, Fragkiskos Malliaros | |
Rapporteur / Rapporteuse : Julien Velcin, Lynda Tamine-Lechani |
Mots clés
Résumé
Le recrutement électronique est devenu l'outil de recrutement le plus important dans la société moderne. Comment traiter efficacement une telle quantité de données et améliorer l'efficacité du recrutement en ligne est un problème important et urgent auquel l'ensemble du secteur est confronté. En tant que pionnier du secteur des services de ressources humaines, Randstad souhaitait améliorer le processus de recrutement, notamment en améliorant l'expérience utilisateur et en réduisant les dépenses. En particulier, en utilisant des techniques liées à l'Intelligence Artificielle (IA), inspirées du succès de l'IA dans de nombreuses applications pratiques. Autour du système de recrutement, de nombreuses sous-tâches connexes doivent être traitées, y compris, mais sans s'y limiter, l'intégration d'informations, la recherche de talents, l'optimisation des algorithmes, etc. Par conséquent, dans cette thèse, nous étudierons comment utiliser des techniques d'IA pour résoudre certaines sous-tâches afin d'aider à construire des recrutement systèmes.Comme d'autres domaines, la technologie de l'IA gagne en popularité dans l'industrie du recrutement. Ces technologies visent à répondre systématiquement aux limites des procédures de recrutement traditionnelles, en particulier pour les tâches répétitives, en intégrant des approches basées sur l'IA. Bien que de nombreuses études aient démontré leur efficacité, elles présentent encore des défis en raison des caractéristiques spécifiques des recrutements données. Par exemple, les ensembles de données ouvertes sont relativement difficiles à obtenir en raison de la confidentialité, ce qui limite l'utilisation de méthodes supervisées, et le domaine du recrutement évolue constamment, de sorte que les méthodes statiques ne peuvent pas s'adapter rapidement aux changements de données. Par ailleurs, les données traitées dans les travaux existants comprennent principalement : (i) les offre-CV paires, (ii) les trajectoires de carrière, et (iii) les emplois ou CV. Il existe des structures cachées dans ces données, principalement des graphes, qui contiennent de nombreuses informations supplémentaires. Cependant, ces informations supplémentaires sont rarement remarquées. En plus de ces informations graphiques cachées, le domaine de recrutement contient également des données prédéfinies bien structurées, telles que la taxonomie des compétences et des professions. Ces taxonomies contiennent souvent beaucoup de connaissances normatives, mais aucun travail ne les a exploitées directement ou indirectement. Dans ce contexte, cette thèse tente de résoudre partiellement les problèmes des travaux existants, tels que l'apprentissage des représentations d'emplois séparément de manière non supervisée pour faire face au manque de données étiquetées et l'utilisation d'une fonction de perte basée sur la similarité pour s'adapter aux mises à jour continues et rapides des éléments. Plus important encore, cette thèse se concentre sur une direction moins étudiée : comment exploiter des données de recrutement implicitement ou explicitement structurées pour améliorer les représentations apprises liées au recrutement.Plus précisément, dans cette thèse, nous étudions trois sous-tâches importantes: (i) Dans le Chapitre 4, nous proposons d'apprendre les représentations des job titres à partir de graphes construits à partir d'histoires professionnelles. (ii) Ensuite, dans le Chapitre 5, nous proposons d'apprendre les représentations des compétences à partir d'un graphe de cooccurrence de compétences construit et d'améliorer les représentations avec une taxonomie de compétences prédéfinie.. (iii) Le Chapitre 6 étudie la tâche de prédiction d'emploi prochain, visant à prédire le prochain emploi le plus probable pour lequel le demandeur d'emploi pourrait postuler à l'aide des séquences de demande d'emploi.