Generative Probabilistic Alignment Models for Words and Subwords : a Systematic Exploration of the Limits and Potentials of Neural Parametrizations

Anh Khoa Ngo Ho

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Modèles d’alignement probabilistes génératifs pour les mots et sous-mots : une exploration systématique des limites et potentialités des paramétrisations neuronales

FR |

EN

Auteur / Autrice :	Anh Khoa Ngo Ho
Direction :	François Yvon
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 09/02/2021
Etablissement(s) :	université Paris-Saclay
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
	référent : Faculté des sciences d'Orsay
Jury :	Président / Présidente : Pierre Zweigenbaum
	Examinateurs / Examinatrices : Yves Lepage, Loïc Barrault, Nadi Tomeh
	Rapporteurs / Rapporteuses : Yves Lepage, Loïc Barrault

Mots clés

FR |

EN

Mots clés contrôlés

Réseaux neuronaux (informatique)

Traduction automatique

Traitement automatique du langage naturel

Apprentissage automatique

Mots clés libres

Traduction automatique

Alignement de mots

Réseaux de neurones artificiels

Résumé

FR |

EN

L'alignement consiste à mettre en correspondance des unités au sein de bitextes, associant un texte en langue source et sa traduction dans une langue cible. L'alignement peut se concevoir à plusieurs niveaux: entre phrases, entre groupes de mots, entre mots, voire à un niveau plus fin lorsque l'une des langues est morphologiquement complexe, ce qui implique d'aligner des fragments de mot (morphèmes). L'alignement peut être envisagé également sur des structures linguistiques plus complexes des arbres ou des graphes. Il s'agit d'une tâche complexe, sous-spécifiée, que les humains réalisent avec difficulté. Son automatisation est un problème exemplaire du traitement des langues, historiquement associé aux premiers modèles de traduction probabilistes. L'arrivée à maturité de nouveaux modèles pour le traitement automatique des langues, reposant sur des représentationts distribuées calculées par des réseaux de neurones permet de reposer la question du calcul de ces alignements. Cette recherche vise donc à concevoir des modèles neuronaux susceptibles d'être appris sans supervision pour dépasser certaines des limitations des modèles d'alignement statistique et améliorer l'état de l'art en matière de précision des alignements automatiques.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Modèles d’alignement probabilistes génératifs pour les mots et sous-mots : une exploration systématique des limites et potentialités des paramétrisations neuronales

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Modèles d’alignement probabilistes génératifs pour les mots et sous-mots : une exploration systématique des limites et potentialités des paramétrisations neuronales

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses