Thèse soutenue

Modélisation stochastique et analyse des données pour la diffusion d'information dans les plateformes sociales en ligne

FR  |  
EN
Auteur / Autrice : Ricardo José López Dawn
Direction : Anastasios GiovanidisNaceur Malouch
Type : Thèse de doctorat
Discipline(s) : Intelligence artificielle
Date : Soutenance le 22/03/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : LIP6 (1997-....)
Jury : Président / Présidente : Thi-Mai-Trang Nguyen
Examinateurs / Examinatrices : Yezekael Hayel, Samson Lasaulce
Rapporteurs / Rapporteuses : Francesco De Pellegrini, Marceau Coupechoux

Résumé

FR  |  
EN

Le marketing d'influenceurs est devenu une industrie florissante dont la valeur du marché mondial devrait atteindre 15 milliards de dollars d'ici 2022. Le problème publicitaire auquel ces agences sont confrontées est le suivant : compte tenu d'un budget monétaire, trouver un ensemble d'influenceurs appropriés qui peuvent créer et publier des posts de différents types (par exemple, texte, image, vidéo) pour la promotion d'un produit cible. L'objectif de la campagne est de maximiser à travers une ou plusieurs plateformes sociales en ligne une certaine mesure d'impact d'intérêt, par exemple le nombre d'impressions, les ventes (ROI), ou la portée de l'audience. Dans cette thèse, nous créons des formulations continues originales du problème du marketing d'influence budgétisé par deux cadres, un statique et un dynamique, basés sur la connaissance de l'annonceur de la métrique d'impact, et la nature des décisions de l'annonceur sur un horizon temporel. Le modèle statique est formulé comme un programme convexe, et nous proposons un algorithme itératif efficace basé sur la méthode de Frank-Wolfe, qui converge vers l'optimum global et présente une faible complexité de calcul. Nous suggérons également une règle empirique quasi-optimale plus simple, qui peut donner de bons résultats dans de nombreux scénarios pratiques. En raison de la nature du modèle dynamique, nous ne pouvons plus résoudre un problème de maximisation de l'utilité du réseau, puisque le retour sur investissement est inconnu, éventuellement bruyant, continu et coûteux à évaluer pour l'annonceur. Cette approche implique une exploration et nous cherchons donc à nous assurer qu'il n'y a pas d'exploration destructive, et que chaque décision séquentielle de l'annonceur améliore le résultat du ROI au fil du temps. Dans cette approche, nous proposons un nouvel algorithme et une nouvelle implémentation, basés sur le cadre d'optimisation bayésienne pour résoudre notre problème de marketing d'influence budgétisé sous des décisions séquentielles de l'annonceur sur un horizon temporel. En outre, nous proposons une observation empirique pour éviter la malédiction de la dimensionnalité. Nous testons notre modèle statique, l'algorithme et l'heuristique contre plusieurs alternatives de la littérature d'optimisation ainsi que des méthodes de sélection de graines standard et nous validons la performance supérieure de Frank-Wolfe en temps d'exécution et en mémoire, ainsi que sa capacité à s'adapter à des problèmes avec un très grand nombre (millions) d'utilisateurs sociaux. Enfin, nous évaluons notre modèle dynamique sur une trace réelle de données et nous concluons à la faisabilité de notre modèle et au soutien empirique de notre observation formulée.