Thèse soutenue

Les conversations des internautes. Approche pragmatique d'acquisition de connaissances à partir de conversations textuelles pour la recherche marketing

FR  |  
EN
Auteur / Autrice : Marguerite Leenhardt
Direction : André Salem
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 17/01/2017
Etablissement(s) : Sorbonne Paris Cité
Ecole(s) doctorale(s) : École doctorale Langage et langues (Paris)
Partenaire(s) de recherche : établissement de préparation : Université de la Sorbonne Nouvelle (Paris ; 1970-....)
Laboratoire : CLESTHIA (Paris)
Equipe de recherche : Centre de Lexicométrie et d'Analyse Automatique des Textes (Paris)
Jury : Président / Présidente : Bernard Dousset
Examinateurs / Examinatrices : André Salem, Bernard Dousset, Mustapha Krazem, Marianne Doury, Fabrice Issac
Rapporteurs / Rapporteuses : Bernard Dousset, Mustapha Krazem

Résumé

FR  |  
EN

Ce travail de recherche s'inscrit dans le cadre des méthodes de la linguistique de corpus et procède des besoins d'exploitation formulés dans le domaine du marketing à l'égard des conversations des internautes. Deux pistes sont poursuivies, la première relevant de leur description du point de vue de l'analyse des conversations et de la textométrie, la seconde visant des applications pratiques relatives à la fouille de textes. Une méthode de description systématique et automatisable est proposée, à partir de laquelle un procédé de mesure de l'engagement conversationnel des participants est mis en œuvre. L'étude des diagrammes d'engagement conversationnel (DEC) produits à partir de cette mesure permet d'observer des régularités typologiques dans les postures manifestées par les participants. Ce travail met également en exergue l'apport de la méthode textométrique pour l'acquisition de connaissances utiles à des fins de catégorisation automatique. Plusieurs analyses textométriques sont utilisées (spécificités, segments répétés, inventaires distributionnels) pour élaborer un modèle de connaissance dédié à la détection des intentions d'achat dans des fils de discussion issus d'un forum automobile. Les résultats obtenus, encourageants malgré la rareté des signaux exploitables au sein du corpus étudié, soulignent l'intérêt d'articuler des techniques d'analyse textométrique et de fouille de données textuelles au sein d'un même procédé d'acquisition de connaissances pour l'analyse automatique des conversations des internautes.