Ecrire en deux langues : la traduction automatique au service de la rédaction en langue étrangère

par Jitao Xu

Projet de thèse en Informatique

Sous la direction de François Yvon.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication , en partenariat avec Laboratoire Interdisciplinaire des Sciences du Numérique (laboratoire) , TLP - Traitement du Langage Parlé (equipe de recherche) et de Faculté des sciences d'Orsay (référent) depuis le 01-12-2019 .


  • Résumé

    Grâce à l'avènement d'une nouvelle génération de systèmes reposant sur les technologies d'apprentissage profond, les outils de traduction automatique ont réalisé ces dernières années des progrès significatifs, qui les rend utiles à une vaste gamme d'usages. En nous appuyant sur ces technologies, l'objectif de cette thèse est d'étudier leur applicabilité dans des interfaces de rédaction multilingues, qui permettent au rédacteur de composer ses textes en mélangeant librement des fragments écrits en plusieurs langues. Cette application répond au besoin de rédaction en langue seconde, et offrira à tout moment au rédacteur la possibilité d'insérer un segment dans sa langue maternelle, qui sera alors traduit à la volée et intégré dans le flux textuel en langue seconde. En utilisant la même technologie, il sera également possible de corriger à la volée le texte produit, à la fois du point de vue de la grammaire et de l'orthographe. On souhaite finalement doter ce système d'une capacité d'adaptation (de personnalisation) aux types de textes produits par l'utilisateur. Cette étude demandera de surmonter plusieurs défis majeurs : (a) la conception et l'entraînement de réseaux profonds capables de traiter dans une architecture unique des textes en plusieurs langues, à l'instar des systèmes de traduction multilingues ; (b) l'étude de stratégies d'adaptation à court terme et à long terme, afin que le système puisse à la fois améliorer ses prédictions locales et son apprentissage à long terme; (c) le design et le développement d'un dispositif de rédaction interactif dans lequel l'utilisateur tire efficacement partie des prédictions et des corrections du système. En plus des productions scientifiques liées à la réalisation de l'étude (communications, publications dans des revues scientifiques), la thèse devra conduire à la réalisation d'un prototype, et à son évaluation par des tests utilisateur.

  • Titre traduit

    Writing in more than one language: machine translation as an assistive bilingual writing tool


  • Résumé

    With the advent of a new generation of systems based on deep learning technologies, machine translation tools have made significant progress in recent years, making them useful for a wide range of uses. Based on these technologies, the objective of this thesis is to study their applicability in multilingual writing interfaces, which allow the writer to compose his texts by freely mixing fragments written in several languages. This application meets the need for second language writing, and will offer the writer the possibility at any time to insert a segment in his or her native language, which will then be translated on the fly and integrated into the second language text flow. Using the same technology, it will also be possible to correct the text produced on the fly, both in terms of grammar and spelling. Finally, we want to provide this system with the ability to adapt (customize) to the types of texts produced by the user. This study will require overcoming several major challenges: (a) the design and training of deep networks capable of processing texts in several languages in a single architecture, such as multilingual translation systems; (b) the study of short-term and long-term adaptation strategies, so that the system can improve both local predictions and long-term learning; (c) the design and development of an interactive writing device in which the user effectively takes advantage of system predictions and corrections. In addition to the scientific productions directly related to the realization of the study (communications, publications in scientific journals), the thesis will lead to the development of a prototype, evaluated by user tests.