Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu en 2021. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Max Raphael Sobroza marques
Direction : Claude Berrou
Type : Projet de thèse
Discipline(s) : Informatique
Date : Soutenance en 2021
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : Mathématiques et STIC
Jury : Président / Présidente : Eric Laporte
Examinateurs / Examinatrices : Claude Berrou, Franck Ganier, Deok-Hee Kim-dufor
Rapporteurs / Rapporteuses : Mathieu Lafourcade, Laurence Likforman-sulem

Résumé

FR  |  
EN

Dans ce travail de thèse, une approche transversale combinant les principes du codage distribué et ceux d'algorithmes neuro-inspirés a été adoptée pour des applications dans le domaine du Traitement Automatique du Langage Naturel (TALN). Des modèles récents de mémoire associative à long terme ont émergé dans le domaine de l'informatique neuro-inspirée. Ces modèles ont des propriétés intéressantes de correction d'erreurs, de robustesse, de capacité de stockage et de remémoration. Dans ce contexte, nous avons revisité le connexionnisme et les approches des réseaux de neurones en introduisant des modèles originaux de mémoires associatives et des principes multimodaux pour traiter des problèmes spécifiques du TALN. Nous introduisons également une méthode capable de construire des codes binaires et parcimonieux de mots à partir de vecteurs de plongements (embeddings). Ces codes sont plus robustes dans l'interprétation du texte pour plusieurs tâches sémantiques (désambiguïsation, synonymie/antinomie,…) tout en offrant des taux de compression élevés. Une dernière étape du travail a consisté à concevoir un nouveau système de recommandation d'articles appliqué aux textes juridiques en utilisant notamment la méthode des plongements de mots compressés que nous avons élaborée.