Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue

Emmanuel Prochasson

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue

FR |

EN

Auteur / Autrice :	Emmanuel Prochasson
Direction :	Béatrice Daille, Emmanuel Morin
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance en 2009
Etablissement(s) :	Nantes
Ecole(s) doctorale(s) :	École doctorale sciences et technologies de l'information et des matériaux (Nantes)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d’Informatique de Nantes Atlantique (UMR 6241) (Nantes)
	Autre partenaire : Université de Nantes. Faculté des sciences et des techniques
Jury :	Examinateurs / Examinatrices : Béatrice Daille, Emmanuel Morin, Kamel Smaïli
	Rapporteur / Rapporteuse : Éric Gaussier, Yves Lepage

Mots clés

FR

Mots clés contrôlés

Corpus linguistique

Langues de spécialité

Mots clés libres

Corpus comparable

Alignement multilingue

Résumé

FR |

EN

Les corpus comparables rassemblent des documents multilingues n’étant pas en relation de traduction mais partageant des traits communs. Notre travail porte sur l’extraction de lexique bilingue à partir de ces corpus, c’est-à-dire la reconnaissance et l’alignement d’un vocabulaire commun multilingue disponible dans le corpus. Nous nous concentrons sur les corpus comparables spécialisés, c’est-à-dire des corpus constitués de documents révélateurs de la terminologie utilisée dans les langues de spécialité. Nous travaillons sur des corpus médicaux, l’un deux couvre la thématique du diabète et de l’alimentation, en français, anglais et japonais ; l’autre couvre la thématique du cancer du sein, en anglais et en français. Nous proposons et évaluons différentes améliorations du processus d’alignement, en particulier dans le cas délicat de la langue japonaise. Nous prolongeons ce manuscrit par une réflexion sur la nature des corpus comparables et la notion de comparabilité

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Alignement multilingue en corpus comparables spécialisés : caractérisation terminologique multilingue

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses