Évaluation automatique de la parole spontanée en anglais langue étrangère : le rôle des pauses et de laccent lexical dans la compréhensibilité du locuteur
Auteur / Autrice : | Sylvain Coulange |
Direction : | Monica Masperi, Tsuneo Kato |
Type : | Projet de thèse |
Discipline(s) : | Sciences du langage Spécialité Informatique et sciences du langage |
Date : | Inscription en doctorat le Soutenance le 10/04/2025 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale langues, littératures et sciences humaines |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles |
Jury : | Président / Présidente : Antonio Romano |
Examinateurs / Examinatrices : Monica Masperi, Isabelle Darcy, Nicolas Ballier, Philippe BOULA DE MAREüIL, François Pellegrino, Nadine Herry benit | |
Rapporteurs / Rapporteuses : Nicolas Ballier, Nadine Herry benit |
Mots clés
Mots clés libres
Résumé
La compétence de production orale en langue étrangère est communément évaluée à travers la capacité du locuteur à se faire comprendre. Le terme de compréhensibilité est souvent utilisé dans le domaine de lacquisition des langues pour désigner le degré deffort requis par un auditeur pour comprendre le locuteur. Celle-ci dépend de nombreux facteurs, côté locuteur comme auditeur, parmi lesquels la position des marqueurs dhésitation et le rythme de la parole sont souvent décrits comme facteurs clés dans les grilles dévaluation. En revanche, les approches automatiques reposent encore majoritairement sur des comparaisons à un modèle, souvent à partir de parole lue, sans porter une attention particulière aux phénomènes linguistiques susceptibles de perturber la compréhension. Dans cette thèse, nous proposons un outil dévaluation automatique de la production orale spontanée en anglais, ciblant spécifiquement deux phénomènes linguistiques susceptibles dimpacter la compréhensibilité du locuteur : la distribution syntaxique des pauses et laccentuation lexicale. Cet outil a été utilisé pour analyser la variation de ces phénomènes chez des locuteurs de niveau B1 et B2 francophones et japonophones (L2), ainsi que chez des locuteurs anglophones natifs (L1). Nous avons ensuite mesuré leur impact sur la perception de leffort de compréhension en temps réel chez des auditeurs anglophones natifs. Les analyses révèlent quune différence majeure entre les locuteurs B1 et B2 dune part, et entre les L1 et L2 dautre part, réside dans la fréquence des pauses de bas niveau syntaxique : plus le niveau de compétence augmente, plus les pauses tendent à se concentrer aux frontières syntaxiques de haut niveau (par exemple, entre les propositions). À partir de ces observations, nous avons défini un score de distribution syntaxique des pauses pour caractériser cette concentration. Concernant laccentuation lexicale, les mesures font ressortir une influence marquée des patterns accentuels de la langue maternelle des locuteurs. Les francophones augmentent généralement la hauteur (f0) et allongent la dernière syllabe des mots, tandis que lintensité reste stable sur lensemble des syllabes. Bien que les locuteurs B1 et B2 se chevauchent largement, une progression significative est observée entre ces deux niveaux : les locuteurs B2 accentuent plus fréquemment la syllabe attendue et produisent un contraste acoustique plus marqué en termes de f0 et dintensité. En revanche, les locuteurs japonais, dont la langue maternelle intègre un accent lexical, positionnent laccent avec davantage de précision et produisent des contrastes prosodiques plus importants que les francophones. Enfin, pour mesurer limpact des différents types de pauses et de patterns daccentuation lexicale sur la perception de la compréhensibilité, nous avons recruté 60 auditeurs afin dévaluer dynamiquement 16 extraits de paroles issus du corpus des locuteurs francophones mentionné ci-dessus. Lors de lécoute, il leur était demandé de cliquer sur un bouton dès quils ressentaient un effort pour comprendre le locuteur, quelle quen soit la raison. Lanalyse des patterns de clics, une fois normalisés, indique une augmentation significative de la difficulté perçue entre 0 et 3 secondes après une pause située à lintérieur dun syntagme, ainsi quentre 2 et 3 secondes après un mot dont la syllabe accentuée nétait pas celle attendue. À linverse, la difficulté perçue diminue significativement après une pause située entre deux propositions ou après un mot correctement accentué. Ces observations renforcent lidée que les pauses de bas niveau syntaxique et les mots accentués de manière inattendue impactent directement la perception de difficulté de compréhension. Notre expérience démontre que cet impact est direct et mesurable.