Thèse soutenue

Système de traduction automatique français-chinois dans le domaine de la sécurité globale

FR  |  
EN
Auteur / Autrice : Gan Jin
Direction : Sylviane Cardey-Greenfield
Type : Thèse de doctorat
Discipline(s) : Sciences du langage. Traitement automatique des langues
Date : Soutenance le 19/02/2015
Etablissement(s) : Besançon
Ecole(s) doctorale(s) : Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière (Besançon)
Jury : Président / Présidente : Dan Xu
Examinateurs / Examinatrices : Sylviane Cardey-Greenfield, Dan Xu, Bohdan Krzysztof Bogacki, Christophe Roche
Rapporteurs / Rapporteuses : Bohdan Krzysztof Bogacki, Christophe Roche

Résumé

FR  |  
EN

Dans ce mémoire, nous présentons outre les résultats de recherche en vue d’un système de traduction automatique français–chinois, les apports théoriques à partir de la théorie SyGULAC et de la théorie micro-systémique avec ses calculs ainsi que les méthodologies élaborées tendant à une application sure et fiable dans le cadre de la traduction automatique. L’application porte sur des domaines de sécurité critique tels que l’aéronautique, la médecine, la sécurité civile. Tout d’abord un état de l’art du domaine de la traduction automatique, en Chine et en France, est utile pour commencer la lecture. Les faiblesses des systèmes actuels à travers des tests que nous réalisons prouvent l’intérêt de cette recherche. Nous donnons les raisons pour lesquelles nous avons choisi la théorie micro-systémique et la théorie SyGULAC. Nous expliquons ensuite les problématiques rencontrées au cours de notre recherche. L’ambigüité, obstacle majeur pour la compréhensibilité et la traductibilité d’un texte, se situe à tous les niveaux de la langue : syntaxique, morphologique, lexical, nominal ou encore verbal. L’identification des unités d’une phrase est aussi une étape préalable à la compréhension globale, que cela soit pour un être humain ou un système de traduction. Nous dressons un état des lieux de la divergence entre la langue française et la langue chinoise en vue de réaliser un système de traduction automatique. Nous essayons d’observer la structure aux niveaux verbal, nominal et lexical, de comprendre leurs liens et leurs interactions. Egalement nous définissons les obstacles sources d’entrave à la réalisation de cette recherche, avec un point de vue théorique mais aussi en étudiant notre corpus concret. Le formalisme pour lequel nous avons opté part d’une étude approfondie de la langue utilisée dans les protocoles de sécurité. Une langue ne se prête au traitement automatique que si elle est formalisée. De ce fait, nous avons procédé à l’analyse de plusieurs corpus bilingues français/chinois mais aussi monolingues émanant d’organismes de sécurité civile. Le but est de dégager les particularités linguistiques (lexicales, syntaxiques, …) qui caractérisent la langue de la sécurité en général et de recenser toutes les structures syntaxiques qu’utilise cette langue. Après avoir présenté la formalisation de notre système, nous montrons les processus de reconnaissance, de transfert et de génération.