La détection et la traduction automatiques de l'ellipse : enjeux théoriques et pratiques

par Anissa Hamza

Thèse de doctorat en Linguistique

Sous la direction de Maryvonne Hutchins-Boisseau et de Delphine Bernhard.

Soutenue le 20-09-2019

à Strasbourg , dans le cadre de École doctorale Humanités (Strasbourg ; 2009-....) , en partenariat avec Linguistique, langues, parole (Strasbourg) (laboratoire) .

Le président du jury était Thierry Grass.

Le jury était composé de Rudy Loock, François Yvon.

Les rapporteurs étaient Philip H. Miller, Pierrette Bouillon.


  • Résumé

    Cette thèse a pour objet le traitement automatique du phénomène elliptique. À la croisée de plusieurs disciplines – linguistique théorique, linguistique de corpus, linguistique outillée et traductologie –, elle s’inscrit dans une démarche expérimentale en poursuivant deux objectifs essentiels. Il s’agit tout d’abord de vérifier la possibilité de détecter automatiquement le phénomène elliptique en anglais pour explorer ensuite les procédures facilitant sa traduction automatique de l’anglais vers le français. La détection automatique repose sur des analyses morphosyntaxiques qui paraissent suffisantes à la détection automatique de certaines catégories d’ellipse, puisqu’en décomposant le phénomène, elles permettent de l’identifier parmi d’autres. Un corpus parallèle et multi-genres, collecté et conçu pour répondre aux hypothèses de recherche, est utilisé. Afin d’élaborer des patrons de détection et exploiter le corpus, cette recherche utilise les outils CoreNLP développés à l’université de Stanford (USA) et met en lumière leurs limites lorsqu’ils sont confrontés à l’ellipse. Les résultats obtenus s’articulent autour du lien établi entre la détection et la traduction automatiques du phénomène elliptique, facteur déterminant dans la compréhension des erreurs de traduction générées lors de son traitement automatique.

  • Titre traduit

    The automatic detection and translation of ellipsis : a theoretical and practical study


  • Résumé

    This thesis examines the automatic processing of elliptical phenomena in English. Situated at the crossroads of various disciplines, such as theoretical linguistics, corpus linguistics, computational linguistics and translation studies, it implements an experimental approach in order to achieve two main goals. The first one consists in establishing that ellipsis can be detected automatically, and the second one in exploring procedures to facilitate its machine translation from English into French.For these purposes, this thesis resorts to morpho-syntactic analyses, which seem sufficient for the automatic detection of some types of ellipsis, since through breaking down the phenomenon into its specific features it makes it possible to identify it among others. The investigation draws on a parallel, multi-genre corpus compiled to test the research hypotheses. In order to develop detection patterns and exploit the corpus, the CoreNLP package developed at the University of Stanford (US) is used, and its limitations in the processing of ellipsis are highlighted. Findings and results emphasize the close link between the detection of ellipsis and its machine translation as a key factor in understanding translation errors caused by its automatic processing.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Strasbourg. Bibliothèque électronique du Services des bibliothèques 063.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.