Modèles de croyance pour l'information distribuée et la polarisation dans les réseaux sociaux.
Auteur / Autrice : | Santiago QUINTERO PABóN |
Direction : | Catuscia Palamidessi |
Type : | Projet de thèse |
Discipline(s) : | Informatique, données, IA |
Date : | Inscription en doctorat le 01/10/2018 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : LIX - Laboratoire d'informatique |
Résumé
Les systèmes computationnels distribués ont changé drastiquement au cours des dernières années, avec lavènement de technologies telles que les réseaux sociaux ou le stockage en ligne (« cloud storage »). Ce qui différencie ces nouveaux systèmes, cest limportance du flux dinformation épistémique (faits, croyances, mensonges), qui peut engendrer des difficultés pour nos sociétés et pour la démocratie. Les réseaux sociaux contribuent au discours civique parce quils catalysent léchange de faits, croyances, et opinions au sein des communautés (appelées cercles, groupes, ou amis). Cependant, compte tenu de leur nature computationnelle et de leur popularité, ces réseaux sont aussi risqués : des acteurs - des algorithmes ou des humains, peuvent diriger certaines informations vers des millions dagents ou filtrer ces informations en fonction de lhistorique des usagers sur le réseau. Même si ce nest pas leur intention initiale, de telles actions peuvent aboutir à une polarisation extrême. En effet, deux individus ayant des convictions opposées vont filtrer les nouvelles informations de manière biaisée, les faisant diverger par rapport à leur position initiale [11]. Or, un groupe avec des convictions homogènes a tendance à agir de manière plus extrême que ne le dictent les préférences des individus membres [10]. Les croyances et convictions de ces individus se radicalisent ainsi, et sisolent dans leur cercle idéologique, causant alors de dangereuses fractures sociales. Cette situation est encore plus complexe lorsque les informations en question sont des mensonges, des canulars, ou des infox (« fake news »). Les réseaux sociaux ont déjà joué un rôle clé dans le processus politique. Les référendums du Brexit ou l'accord de paix en la Colombie, ainsi que la dernière élection présidentielle aux États-Unis sont des exemples notoires de ce rôle [9]. Ils illustrent le fait que des messages diffusés dans les réseaux sociaux, contenant des éléments d'idéologie extrémiste, des mensonges, des intox, de la démagogie et de la discrimination ethnique peuvent influencer des prises de décision fondamentales. En fait, nous avons atteint un point critique où la production d'information malveillante est devenue rentable dans des pays comme la Macédoine, où des compagnies se spécialisent dans la distribution de ces informations sur les réseaux sociaux. Les violations de la vie privée sont également une préoccupation majeure concernant les réseaux sociaux et « cloud storage », car à travers de ces plateformes, les individus accèdent ou publient en continu des informations privées (croyances, convictions, géolocalisation, biographie, photos, carnets dadresse, parmi dautres). Dans de tels scénarii, un agent malveillant peut exploiter les vulnérabilités du système pour accéder à ces données. En outre, les préoccupations en matière de protection de la vie privée peuvent changer dans le temps, en fonction du comportement des agents, ou de lévolution de la sensibilité dune même information. Par exemple, la divulgation involontaire de l'orientation sexuelle de quelqu'un na plus le même impact maintenant quil y a quinze ans, grâce à lévolution des perceptions à ce sujet. Le scandale de Facebook-Cambridge Analytica, qui a dénoncé la collecte sans accord des données personnelles de plus de 87 millions d'usagers, est un exemple notoire des problèmes de protection de la vie privée et de polarisation. Il est possible que ces données aient été utilisées pour reconstituer les profils psychologiques de ces utilisateurs, des profils qui ont servi à viser finement la campagne psychographique dinfluence de lélection américaine de 2016. Même sil nest pas certain que cette campagne aurait changé les opinions dun nombre significatif délecteurs, ces méthodes de «microtargeting » peuvent renforcer les prénotions des utilisateurs. Ce renforcement contribue à la polarisation, qui radicalise les opinions du groupe au-delà des positions initiales de ses membres. Ce phénomène peut certainement avoir des conséquences importantes dans lespace public et pour la démocratie en général. Nous pouvons isoler deux aspects cruciaux des systèmes décrits ci-dessus, qui sont au cur de ce projet. À notre connaissance, ces aspects n'ont pas été suffisamment traités dans le contexte de la théorie des systèmes concurrents des réseaux sociaux. Le premier aspect est la nature intrinsèquement épistémique de ces systèmes, qui découle de la présence de comportements sociaux. Avec des millions dutilisateurs partageant en continu des faits, opinions, croyances, mensonges, ou infox, linformation épistémique est omniprésente. Sans le savoir, un utilisateur peut mettre en danger sa vie privée ou professionnelle en fonction de qui peut accéder à ses opinions ou ses croyances, et de comment on y accède. Nous souhaiterions prévoir quand un message posté (par exemple un mensonge) peut polariser, aboutir à une violation de la vie privée, ou changer une prise de décision. Modéliser ce flux épistémique dans un environnement extrêmement répartis serait donc une contribution importante pour évaluer les risques sociaux et ceux concernant la vie privée. Le deuxième aspect est la nature spatiale du calcul. Avec lavènement, parmi dautres plateformes, du « Cloud Computing » le calcul spatial est maintenant à la portée de tous et omniprésent. Les utilisateurs, les programmes et les informations sont répartis spatialement sur ces plateformes. Une compréhension solide de cette notion despace est fondamentale pour tous les modèles des systèmes contemporains parce quils sont répartis et ils communiquent entre eux. Il est donc crucial de pouvoir décrire, analyser et, en général, raisonner sur des systèmes concurrents présentant des caractéristiques épistémiques et spatiales. Ce raisonnement doit être précis et fiable. Par conséquent, il doit être fondé sur les principes mathématiques de la même manière que le raisonnement portant sur les programmes séquentiels est fondé sur la logique, la théorie des ensembles, et autres disciplines mathématiques. Dans ce projet doctoral, il est proposé de relever le défi de développer un modèle mathématique fondamentalement différent des modèles existant actuellement dans la théorie des systèmes concurrents. Ce modèle vise à une compréhension approfondie du comportement épistémique et spatial des systèmes concurrents actuels. Il sera capable de prédire de manière rigoureuse le comportement dun système concurrent en présence dun flux complexe dinformations, tels que la connaissance, les faits, les déclarations publiques et les opinions. Comme application saillant, le modèle permettra de prédire si, au sein dun réseau social, une mésinformation pourrait conduire à des situations non désirées, telles que la polarisation de groupe, la divulgation publique dinformation à caractère sensible ou dautres comportements intrusifs.