Thèse soutenue

Équité multipartite du tri sur des plateformes de recommandation

FR  |  
EN
Auteur / Autrice : Till Kletti
Direction : Patrick LoiseauSihem Amer-Yahia
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique
Date : Soutenance le 29/06/2023
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de Grenoble (2007-....)
Equipe de recherche : Équipe-projet Évaluation et optimisation des performances des grandes infrastructures (Montbonnot-Saint-Martin, Isère ; 2016-....)
CIFRE : Naver Labs (Meylan)
Jury : Président / Présidente : Nadia Brauner
Examinateurs / Examinatrices : Jean-Michel Loubès, Jean-Michel Renders
Rapporteurs / Rapporteuses : Nicolas Usunier, Fernando Diaz, Jean-Michel Loubès

Résumé

FR  |  
EN

L’objet d’étude de cette thèse est le classement d’objets potentiellement pertinents en réponse à une requête d’information, par exemple lors de l’utilisation d’un moteur de recherche ou lors de la recommandation de contenu en ligne. Un tel classement met en contact deux groupes:les utilisateurs en quête d’informations pertinentes, mais aussi les producteurs de contenu, dont l’objectif est de faire voir l’information produite. Par exemple lors d’une recherche de restaurants,l’intérêt de l’utilisateur est de se voir proposer des restaurants de qualité et de passer une bonne soirée, tandis que l’intérêt des restaurateurs sera d’être vu par bon nombre de personnes, afin d’attirer de la clientèle. Les objets à classer entrent ainsi en compétition les uns avec les autres et il est dans l’intérêt de la plateforme générant les classements, de veiller à ce que la visibilité allouée aux objets soit équitablement répartie. De toute évidence il existe un grand nombre de possibilités pour définir ce que signifie équitablement et aucune d’entre elles ne fera l’unanimité.Par conséquent dans cette thèse la définition d’équité est prise comme un paramètre représenté par un vecteur de mérite, qui détermine la proportion avec laquelle la visibilité doit être répartie parmi les objets classés dans une situation équitable. Cela rendra notre méthode applicable à un large éventail de définitions possibles.Dès lors deux choses apparaissent. Premièrement il n’existe pas en général de classement,qui soit équitable au sens de la proportionnalité de la visibilité au mérite. Il est donc nécessaire de produire plusieurs classements, qui se compensent les uns les autres de façon à donner, en moyenne, une visibilité équitable aux objets. Deuxièmement ces classements ne donnent en général pas une utilité maximale pour l’utilisateur. En effet pour garantir l’équité, des objets moins pertinents pourraient lui être montrés. Ces deux objectifs, équité et utilité, ne sont donc pas optimisables simultanément.La contribution de cette thèse consiste en l’élaboration de méthodes permettant de déterminer des séquences de classements optimales dans le sens de Pareto, c’est-à-dire telles qu’il ne soit pas possible d’améliorer l’un des deux objectifs sans détériorer l’autre. L’idée est que cela permette à un preneur de décision qualifié de choisir, en connaissance de cause, un compromis adéquat entre utilité de l’utilisateur et équité entre les objets.La détermination de ces séquences optimales est accomplie via l’introduction d’un objet géométrique, d’un polytope baptisé expohédron. Ce polytope exprime exprime l’ensemble des visibilités moyennes atteignables avec des séquences de classement et constitue ainsi un bon espace de décision à la fois pour l’équité et pour l’utilité. L’expohédron permet de calculer les séquences par la seule utilisation de constructions géométriques en son intérieur, mathématiquement exactes, et ce de façon significativement plus rapide que ne le permettaient de faire des méthodes précédentes basées sur des programmes linéaires. De plus la méthode proposée est appicable à deux grandes gammes de modèles de visibilité incluant les modèles plus connus sous leur nom anglais Position Based Model (PBM) et Dynamic Bayesian Network (DBN), ce dernier plus complexe ne permettant pas l’application de programmes linéaires.