Des études sur l’équité et la confidentialité dans l’apprentissage automatique
Auteur / Autrice : | Carlos Pinzón Henao |
Direction : | Catuscia Palamidessi, Frank Valencia |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et informatique |
Date : | Soutenance le 06/12/2023 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique de l'École polytechnique (Palaiseau ; 1988-....) - Laboratoire d'informatique de l'École polytechnique [Palaiseau] / LIX |
Jury : | Président / Présidente : Jean-François Couchot |
Examinateurs / Examinatrices : Catuscia Palamidessi, Frank Valencia, Jean-Michel Loubès, Rachel Cummings, Sara Bouchenak, Antoine Boutet, Ferdinando Fioretto | |
Rapporteurs / Rapporteuses : Jean-Michel Loubès, Josée Desharnais |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse présente quatre articles publiés dans le domaine de l'éthique des données qui élargissent nos connaissances sur l'équité dans l'apprentissage automatique et l'état de l'art de la confidentialité dans la collecte et la transmission des données.Ce document englobe (1) le calcul de la limite de Pareto d'égalité des chances et de précision des classificateurs d'apprentissage automatique, la preuve que ces objectifs s'opposent radicalement pour certaines distributions ; (2) la preuve empirique que lors de l’utilisation d’algorithmes de découverte causale pour l’évaluation de l’équité, différents algorithmes peuvent conduire à des conclusions très différentes ; (3) la proposition d'un protocole de collecte de données longitudinales avec des garanties inspirées de la confidentialité différentielle locale ; et (4) la dérivation de deux méthodes optimales de remplissage des données transmises pour protéger la confidentialité contre les observateurs du réseau.