Thèse soutenue

Comment aborder les marqueurs discursifs : une approche prosodique, basée sur corpus, computationnelle et expérimentale

FR  |  
EN  |  
PT
Auteur / Autrice : Saulo Mendes Santos
Direction : Albert RilliardTommaso Raso
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 26/02/2024
Etablissement(s) : université Paris-Saclay en cotutelle avec Universidade Federal de Minas Gerais
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) - Laboratório de Estudos Empíricos e Experimentais da Linguagem (Belo Horizonte, Brésil ; 2008-....)
Référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Jury : Président / Présidente : Corinne Fredouille
Examinateurs / Examinatrices : Plínio Almeida Barbosa, Antonio Romano, Bruno Rocha, Alessandro Panunzi
Rapporteur / Rapporteuse : Plínio Almeida Barbosa, Antonio Romano

Résumé

FR  |  
EN  |  
PT

L'objectif principal de cette recherche est d'examiner les marqueurs discursifs (MD) dans les interactions vocales spontanées. Les MDs sont des lexèmes ou des expressions qui ont subi une pragmaticalisation. Ils ne participent pas à la construction du sens, étant orientés vers la gestion des interactions parlées. Les fonctions proposées varient beaucoup selon les objectifs et la méthode d'analyse, et la plupart des études prennent le lexique comme point de départ. Cependant, une même fonction peut être réalisée à travers plusieurs lexèmes. Cette recherche adopte une approche différente. Le critère formel est la forme prosodique, considérée comme plus stable et révélatrice au regard des fonctionnalités des MDs. L'objectif est de comprendre les facteurs qui contribuent à la transmission des MDs et comment la forme prosodique peut être utilisée pour prédire leurs fonctions respectives. Le cadre théorique utilisé est Language into Act Theory (L-AcT - Cavalcante, 2020 ; Cresti, 2000 ; Moneglia & Raso, 2014). La L-AcT considère les MDs comme un type particulier d'unité informationnelle (UI), correspondant à des unités prosodiques et soumise à des restrictions de distribution. Sur la base d'études antérieures (Cresti, 2000 ; Raso, 2014 ; Raso & Vieira, 2016 ; Raso & Ferrari, 2020), un cadre descriptif révisé des MDs est proposé avec les fonctions suivantes : Allocutive (cohésion sociale) ; Conative (indiquant une solution illocutoire) ; Expressive (surprise non illocutoire) ; Marquage (surligne); et Incipit (ouverture d'une TU ou d'un tour de parole). Des preuves statistiques et expérimentales soutenant la proposition sont présentées. Un échantillon d'UIs contenant des candidats MDs a été extrait du corpus C-ORAL-BRASIL I (Raso & Mello, 2012). Les données ont été classées selon les cinq classes fonctionnelles proposées. 30 descripteurs acoustico-prosodiques ont été estimés, incluant la forme intonative, l'allongement syllabique et l'intensité relative. Différents modèles de classification ont été entraînés et évalués en validation croisée. Le meilleur modèle de classification atteint une précision de 78 % pour cinq classes. Ces résultats montrent que, malgré la grande variabilité des contextes, des locuteurs et des styles d'énoncé, il est possible de parvenir à une classification fonctionnelle raisonnable grâce à la forme prosodique des MDs. Enfin, une évaluation perceptive étudie la capacité des participants à identifier les classes de MDs qui se produisent en position initiale, uniquement sur la base d'indices prosodiques. 25 énoncés contenant trois fonctions différentes (ALL, CNT et INP) et sept lexèmes différents ont été sélectionnés. Ces exemples ont été reproduits en chambre sourde par un locuteur expérimenté et ces originaux manipulés pour porter les formes prototypiques des fonctions cibles. Ces stimuli ont été présentés à 120 participants. Les résultats montrent que tous les facteurs contrôlés jouent un rôle significatif : le contexte original, la forme prosodique et le lexique. Cependant, seule la forme prosodique indique, de manière moins variable et moins soumise à l'interprétation des phrases, la fonction visée.