Thèse en cours

Vers une simplification automatique de la parole : application dans des conditions à faibles ressources

FR  |  
EN
Auteur / Autrice : Lucía Ormaechea grijalba
Direction : Benjamin LecouteuxPierrette BouillonDidier Schwab
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/09/2022
Etablissement(s) : Université Grenoble Alpes en cotutelle avec Université de Genève
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble
Equipe de recherche : GETALP - Groupe d'Etude en Traduction/Traitement des Langues et de la Parole (ancien labo Clips)

Résumé

FR  |  
EN

La simplification automatique de textes est une tâche liée au Traitement Automatique de la Langue et de la Parole (TALP), qui vise à réduire automatiquement la complexité linguistique des textes, sans pour autant perdre les informations et la signification originales. Elle joue un rôle important d'un point de vue sociétal, car elle vise à fournir une aide à la compréhension pour différents lecteurs (enfants, personnes ayant un faible niveau d'alphabétisation, etc.). Par ailleurs, elle s'avère être une tâche particulièrement utile du point de vue computationnel, puisqu'elle est également utilisée comme étape de pré-traitement pour d'autres applications de TALP en vue d'améliorer leur performance (comme l'extraction d'information ou le résumé automatique). Dans cette thèse, nous cherchons à contribuer à l'avancement de l'état de l'art sur cette tâche, notamment en explorant l'extension de la simplification automatique à une modalité orale, dans la mesure où la grand majorité des travaux ont été consacrés à l'exploration de la simplification linguistique sur la base de textes issus de sources écrites. Néanmoins, très peu d'études ont examiné des méthodes servant à simplifier la parole. Pour combler cette lacune, nous explorerons des approches basées sur des réseaux de neurones, inspirées de la traduction automatique, où la simplification est conçue comme étant une tâche de traduction monolingue. L'un des verrous scientifiques de cette thèse sera de pallier –ou contourner– le manque de ressources caractérisant cette tâche, où l'existence de données parallèles monolingues est très restreinte. En outre, nous aborderons l'adaptation de la simplification des phrases à une modalité orale, qui est fréquemment marqué d'un point de vue grammatical par la présence des disfluences, telles que des hésitations, des ellipses, des répétitions ou des faux départs. Avec la mise à disposition de tels modèles, nous envisageons de contribuer à PROPICTO, le projet dans lequel s'inscrit cette thèse, qui vise à créer des systèmes permettant une traduction automatique de la parole française en séquences pictographiques, et de cette manière, améliorer l'accès à la communication pour des locuteurs non-francophones ou des personnes présentant des troubles cognitifs. La traduction d'énoncés oraux en pictogrammes ne peut probablement pas être effectuée directement, d'autant que les phrases trop complexes ne contribueraient pas nécessairement à une meilleure compréhensibilité lorsqu'elles seraient converties en pictogrammes. Ceci implique la nécessité d'avoir recours à un module de simplification, permettant ainsi de réduire la complexité linguistique de la phrase en entrée afin de faciliter sa transformation ultérieure en séquences pictographiques. De cette manière, nous proposons d'étendre l'implémentation de la simplification automatique à une modalité orale, et de l'examiner plus particulièrement dans le cadre d'une langue comme le français, qui ne dispose que de très peu de ressources pour modéliser une telle opération. Par ailleurs, nous comptons fournir un module de simplification opérationnel dans le cadre des architectures de traduction envisagées par PROPICTO, servant d'étape intermédiaire dans la chaîne de conversion parole-pictogrammes.