Concevoir et évaluer les algorithmes de recommandation pour le marché du travail
Auteur / Autrice : | Guillaume Bied |
Direction : | Bruno Crépon, Philippe Caillou |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 10/07/2024 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) - Centre de Recherche en Economie et Statistique (Palaiseau ; 1993-....) |
Référent : Faculté des sciences d'Orsay | |
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....) | |
Jury : | Président / Présidente : Jamal Atif |
Examinateurs / Examinatrices : Tijl De Bie, Christine Largeron, Charlotte Laclau, Thomas Le Barbanchon | |
Rapporteur / Rapporteuse : Tijl De Bie, Christine Largeron |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
En apprenant des appariements passés, les systèmes de recommandation ont le potentiel de réduire les frictions informationnelles sur le marché du travail. Cette thèse pose la question de la conception et de l'évaluation d'algorithmes de recommandation d'offres d'emploi, en s'appuyant sur des données détaillées fournies par le service public de l'emploi français. Premièrement, nous proposons une nouvelle architecture neuronale pour la recommandation d'offres d'emploi. Cette architecture présente l'avantage de répondre au problème du démarrage à froid tout en passant à l'échelle. L'approche proposée est comparée à l'état de l'art en termes de performance hors-ligne. Elle est également évaluée sur le terrain en termes de satisfaction des utilisateurs au moyen d'expériences randomisées à grande échelle. Deuxièmement, nous examinons les objectifs possibles qu'un concepteur pourrait assigner à un algorithme de recommandation d'offres d'emploi. Cette analyse est réalisée dans le cadre d'un modèle économique, qui nous permet de discuter les mérites et limites de différentes approches plausibles (satisfaire les critères de recherche exacts des demandeurs, apprendre des candidatures ou des embauches), et de les confronter aux besoins des demandeurs d'emploi. Troisièmement, nous étudions le problème de la congestion qui peut survenir si les recommandations se concentrent sur un ensemble excessivement restreint d'offres, créant des conséquences nuisibles au niveau agrégé. Nous proposons une approche algorithmique utilisant des outils du transport optimal computationnel pour limiter ce phénomène, et étudions ses performances sur des données publiques et propriétaires. Enfin, comme les algorithmes de recommandations sont entraînés sur des données issues du monde réel, ils peuvent reproduire ou aggraver certains comportements indésirables (discriminations, anticipations erronées) existants sur le marché du travail.Afin de répondre à ces inquiétudes, nous réalisons un audit fin de l'algorithme de recommandation (entraîné à partir des embauches) en se focalisant sur les inégalités de genre. En s'inspirant de la littérature en économie du travail, nous proposons des mesures des écarts genrés en termes de caractéristiques des recommandations (salaire, type de contrat...), en moyenne ou conditionnellement aux qualifications et préférences des demandeurs d'emploi. Selon nos résultats, l'algorithme reproduit, sans aggraver,les biais de genre présents dans les données d'entraînement. Nous proposons également une approche dite de ``post-traitement'' dont l'objectif est de réduire les écarts femmes-hommes en termes de caractéristiques des offres recommandées. Nous décrivons les arbitrages entre performance et équité que cette intervention implique.