Extraction d'expressions polylexicales d'un corpus bilingue parallèle et comparable dans le domaine médical (ar-fr): Aspects linguistiques et pistes didactiques
Auteur / Autrice : | Ola Sabae |
Direction : | Olivier Kraif, Salam Diab-Duranton |
Type : | Projet de thèse |
Discipline(s) : | Sciences du langage Spécialité Informatique et sciences du langage |
Date : | Inscription en doctorat le 01/09/2020 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale langues, littératures et sciences humaines (Grenoble, Isère, France ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles |
Mots clés
Résumé
Les ressources lexicographiques bilingues des expressions polylexicales (EPL) sont encore rares et elles le sont davantage pour le couple de langues français / arabe qui nous intéresse. Les recherches concernant ce couple de langues existent peu. Nous nous intéressons dans notre projet de recherche à extraire, à partir de corpus parallèle et comparable fr - ar spécialisés, des expressions polylexicales notamment à base verbale. Ces constructions, de notre point de vue, constituent un aspect pertinent à étudier dans les textes spécialisés. Le corpus constitué se rattachera au domaine médical, un domaine stratégique à l'heure actuelle où le monde entier fait face à une pandémie. Nous profiterons donc de la disponibilité des articles scientifiques vulgarisés qui abondent en ce moment. Dans notre étude nous adopterons une approche contrastive qui consiste à recenser et analyser les EPL et leurs équivalences traductionnelles, et ceci dans une approche corpus based ou basé sur corpus. Notre objectif principal est d'approfondir les recherches sur ce couple de langues encore trop peu étudié dans ce domaine, et de fournir des ressources pour les traducteurs et les apprenants de la traduction spécialisée. Il s'agira in fine d'exploiter les résultats dans le domaine de l'apprentissage de la traduction spécialisé assistée par ordinateur, en s'inspirant de l'approche d'Apprentissage guidée par les données, ou Data Driven Learning. Toutes les étapes seront réalisées en exploitant les outils TAL appropriés à chaque langue et à chaque procédure.