Extraction mesure et analyse de l'information en ligne

par Lise Pernet

Projet de thèse en Sciences du langage

Sous la direction de Julien Longhi.

Thèses en préparation à CY Cergy Paris Université , dans le cadre de Ecole doctorale Arts, Humanités, Sciences Sociales (Cergy-Pontoise, Val d'Oise) , en partenariat avec AGORA - Laboratoire de recherche civilisation, identités culturelles, textes et francophonies (laboratoire) depuis le 01-10-2021 .


  • Résumé

    Les fake news sont, ces dernières années, au cœur de nombreuses discussions, réflexions et études, toutefois celles-ci tendent à s'intéresser avant tout à la question du dit et de sa véracité, éludant le dire qui nous apparaît pourtant essentiel à la compréhension de ce phénomène. Nous nous attacherons ici à mobiliser des outils linguistiques et discursifs afin de caractériser ces informations que nous envisagerons comme des objets discursifs propres à une institution de sens. Nous chercherons alors à décrire la manière dont le sens se construit et évolue sur les réseaux sociaux numériques, en nous appuyant notamment sur des caractérisations automatisées (Djemili et al., 2014) et sur une topographie des communautés de sens en ligne (Saigh et al., 2017) que nous étudierons avec une approche temporelle. Celle-ci devrait également nous permettre, à terme, de repérer et même anticiper des tendances en temps réel à l'aide d'outils de web scraping. Il s'agira alors d'ajouter à ces outils des modules d'analyse inspirés, par exemple, par l'analyse de la prise en charge énonciative, de l'évolution chronologique des thématiques, de la portée du titre d'un article sur le parcours interprétatif du lecteur ou encore des mécanismes d'argumentation complotiste. Ces différentes classifications et analyses devraient nous permettre par la suite de développer des outils d'aide à la résolution de problèmes basés sur un scraping en temps réel des publications sur les réseaux sociaux numériques. S'inscrivant dans le projet EMAIL financé par la région Ile-de-France, cet outil serait notamment mobilisé au cours de Jeux Olympiques de Paris et pourrait s'appliquer à d'autres analyses relevant de l'opinion en ligne à l'égard des institutions.

  • Titre traduit

    Extraction, Measure & Online Information Analysis


  • Résumé

    In recent years, fake news has been at the heart of many discussions, reflections and studies, but these tend to focus primarily on the question of what is said and its veracity, eluding the way it is said, that seems to us to be essential to understanding this phenomenon. We shall endeavour here to mobilize linguistic and discursive tools in order to characterize this information, which we shall consider as discursive objects specific to an institution of meaning. We will then seek to describe the way in which meaning is constructed and evolves on digital social networks, relying in particular on automated characterizations (Djemili et al., 2014) and on a topography of online communities of meaning (Saigh et al., 2017) which we will study with a temporal approach. This should also allow us, in the long run, to identify and even anticipate trends in real-time using web scraping tools. It will then be a matter of adding to these tools analysis modules inspired, for example, by the analysis of enunciative support, the chronological evolution of themes, the impact of the title of an article on the reader's interpretative path, or the mechanisms of conspiracy argumentation. These different classifications and analyses should enable us to develop problem-solving tools based on real-time scraping of publications on digital social networks. As part of the EMAIL project financed by the Ile-de-France region, this tool will be used during the Paris Olympic Games and could be applied to other analyses of online opinion towards institutions.