Quatre Essais en Économie Numérique : Biais des Algorithmes et Données Personnelles
Auteur / Autrice : | Clara Jean |
Direction : | Fabrice Le Guel, Grazia Cecere |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences économiques |
Date : | Soutenance le 20/05/2021 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Droit, économie, management (Sceaux, Hauts-de-Seine ; 2020-....) |
Partenaire(s) de recherche : | Laboratoire : Réseaux, innovation, territoires et mondialisation (Sceaux, Haut-de-Seine) |
Référent : Faculté de droit, économie, gestion | |
Jury : | Président / Présidente : Bruno Deffains |
Examinateurs / Examinatrices : Yassine Lefouili, Anja Lambrecht, José De Sousa | |
Rapporteur / Rapporteuse : Yassine Lefouili, Anja Lambrecht |
Mots clés
Mots clés contrôlés
Résumé
Une pierre angulaire de l'économie basée sur les données est l'omniprésence des algorithmes comme outil d'aide à la décision. Bien qu'ils soient conçus pour améliorer et accélérer le traitement de l'information, l'opacité des systèmes algorithmiques soulève des inquiétudes. Dans cette thèse, nous étudions à travers des preuves contrefactuelles, les déterminants de la prise de décision algorithmique et les sources de résultats potentiellement biaisés. Le chapitre 1 se concentre sur les moyens de réduire les biais algorithmiques liés au genre. Nous effectuons une série de tests in situ sur Facebook pour étudier comment l'intention de l'annonceur d'attirer un groupe particulier d'utilisateurs via un message ciblé peut avoir des effets indésirables sur l'affichage algorithmique des publicités. Les résultats montrent l'importance d'utiliser un message axé sur le genre pour toucher le public féminin et réduire l'écart d'affichage des publicités entre les hommes et les femmes lorsque les publicités concernent le domaine de l'informatique. Le chapitre 2 tire parti des informations sur le fonctionnement des algorithmes de contenu disponibles par les annonceurs pour comprendre certaines sources potentielles de distorsion. Nous utilisons trois versions du même ensemble de campagnes publicitaires sur deux réseaux sociaux différents (Facebook et Snapchat) pour étudier comment les algorithmes distribuent un contenu qui inclus le genre. Il existe des preuves suggérant que les algorithmes sont dictés par les préférences d'individus situés dans les grands centres de population, ainsi que par la sensibilité des algorithmes aux événements aléatoires, en particulier en cas de rareté de données qui a une incidence sur la durée de la phase d'apprentissage de l'algorithme. Le chapitre 3 examine une approche algorithmique pour réguler la publicité politique dans le contexte de la pandémie COVID-19. Les résultats suggèrent que les publicités diffusées par des organisations gouvernementales pour informer la population sur le COVID-19 sont plus susceptibles d'être interdites par l'algorithme de Facebook que les publicités diffusées par des organisations non gouvernementales. Dans un contexte d'incertitude quant au niveau suffisant de garantie des données personnelles, le chapitre 4 étudie l'existence d'un marché pour les données personnelles. À travers une expérience de terrain impliquant 2000 sites internet, les résultats suggèrent que le partage de données personnelles n'affecte pas le comportement des sites internet américains, mais celui des sites internet français. Il existe également des preuves de partage de données personnelles entre les sites internet. L'accélération de l'apprentissage algorithmique résultant en un apprentissage à partir de données non représentatives constitue notre principale implication en terme de politique publique.