Intrinsèquement inséparables : enquête sur les nouvelles pratiques de suivi et évaluation de l'empreinte carbone des publicités
Auteur / Autrice : | Naif Mehanna |
Direction : | Walter Rudametkin |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et applications |
Date : | Soutenance le 30/05/2024 |
Etablissement(s) : | Université de Lille (2022-....) |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....) |
Partenaire(s) de recherche : | Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille - Centre Inria de l'Université de Lille |
Jury : | Président / Présidente : Jérémie Dequidt |
Examinateurs / Examinatrices : Oana Goga, Benjamin Nguyen | |
Rapporteur / Rapporteuse : Sascha Fahl, Kévin Huguenin |
Mots clés
Mots clés contrôlés
Résumé
Alimentée par des méthodologies de traçage complexes et avancées, la publicité en ligne est devenue un élément majeur du Web tel que nous le connaissons aujourd'hui. L'explosion de l'usage des réseaux sociaux au milieu des années 2000 et l'adoption exponentielle des smartphones ont contribué à transformer le domaine de la publicité en ligne en une industrie valant plus de 600 milliards de dollars US. Cependant, les problématiques de vie privée sur le Web prenant de l'ampleur depuis quelques années ont poussé les acteurs principaux du Web à introduire des défenses contre le traçage en ligne. Des régulations régionales, comme le RGPD, et des défenses directement incluses dans les navigateurs poussent ainsi les publicitaires à rechercher de nouvelles méthodologies de suivi, moins connues mais maintenant une efficacité élevée. C'est notamment le cas du traçage par empreinte de navigateur, qui exploite la configuration logicielle et matérielle des appareils naviguant le Web pour les identifier. Cette course perpétuelle vers un suivi toujours plus précis n'est pas sans conséquences et amplifie la demande de l'industrie de la publicité en ligne pour une infrastructure Web toujours plus capable et toujours plus gourmande en ressources afin d'accommoder un flux de données en augmentation constante et des publicités toujours plus riches en contenu, ce qui contribue à augmenter l'impact environnemental de la publicité en ligne.À travers cette thèse, je mets en lumière différents aspects du traçage en ligne et de l'industrie de la publicité en introduisant trois contributions majeures :1. Dans un premier temps, nous introduisons DrawnApart, une technique qui exploite des propriétés uniques des GPU afin d'identifier des appareils similaires en tous points. Nous montrons ainsi que notre algorithme est capable de différencier des appareils avec la même configuration logicielle et matérielle, avec des taux de succès dépassant les 95 % en environnement contrôlé. Nous évaluons également DrawnApart sur 2 550 appareils uniques et 370 392 empreintes de navigateurs collectés sur la plateforme AmIUnique et montrons que nous sommes capables d'allonger de manière significative le temps de traçage par empreinte de navigateur de l'état de l'art, FP-Stalker.2. Les smartphones ont trouvé leur place dans les poches de la majeure partie du globe. Dans cette optique, nous avons analysé l'écosystème du suivi au sein des jeux Android. Notre analyse d'un jeu de données composé de 6 355 jeux gratuits et 396 jeux payants montre que les jeux payants ont effectivement moins de traceurs, mais ceux-ci restent malgré tout prévalents dans certains cas. Nous avons investigué le programme ''Teachers Approved'' de Google et montrons ainsi que le nombre de traceurs et de publicités est significativement réduit dans les jeux portant cette mention, soulignant l'importance de l'application des règles dans l'écosystème de la vie privée.3. Finalement, nous introduisons une méthodologie de calcul de bout en bout de l'impact carbone de l'industrie de la publicité en ligne. Nous montrons que le fait de naviguer sur le Web en autorisant les traceurs et la publicité peut être responsable d'une augmentation du coût carbone de plus de 144 %. Nos résultats montrent également que les régulations ont un impact positif au niveau environnemental : en instrumentant les bannières à cookies, nous mettons en avant que le fait de refuser tous les cookies introduit une baisse significative de l'empreinte carbone de la session Web dans la majorité des cas.