La détection et la traduction automatiques de l'ellipse : enjeux théoriques et pratiques
Auteur / Autrice : | Anissa Hamza |
Direction : | Maryvonne Hutchins-Boisseau, Delphine Bernhard |
Type : | Thèse de doctorat |
Discipline(s) : | Linguistique |
Date : | Soutenance le 20/09/2019 |
Etablissement(s) : | Strasbourg |
Ecole(s) doctorale(s) : | École doctorale des Humanités (Strasbourg ; 2009-....) |
Partenaire(s) de recherche : | Laboratoire : Linguistique, langues, parole (Strasbourg) |
Jury : | Président / Présidente : Thierry Grass |
Examinateurs / Examinatrices : Rudy Loock, François Yvon | |
Rapporteur / Rapporteuse : Philip H. Miller, Pierrette Bouillon |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse a pour objet le traitement automatique du phénomène elliptique. À la croisée de plusieurs disciplines – linguistique théorique, linguistique de corpus, linguistique outillée et traductologie –, elle s’inscrit dans une démarche expérimentale en poursuivant deux objectifs essentiels. Il s’agit tout d’abord de vérifier la possibilité de détecter automatiquement le phénomène elliptique en anglais pour explorer ensuite les procédures facilitant sa traduction automatique de l’anglais vers le français. La détection automatique repose sur des analyses morphosyntaxiques qui paraissent suffisantes à la détection automatique de certaines catégories d’ellipse, puisqu’en décomposant le phénomène, elles permettent de l’identifier parmi d’autres. Un corpus parallèle et multi-genres, collecté et conçu pour répondre aux hypothèses de recherche, est utilisé. Afin d’élaborer des patrons de détection et exploiter le corpus, cette recherche utilise les outils CoreNLP développés à l’université de Stanford (USA) et met en lumière leurs limites lorsqu’ils sont confrontés à l’ellipse. Les résultats obtenus s’articulent autour du lien établi entre la détection et la traduction automatiques du phénomène elliptique, facteur déterminant dans la compréhension des erreurs de traduction générées lors de son traitement automatique.