Thèse soutenue

Systèmes de questions-réponses interactifs à grande échelle
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Oralie Cattan
Direction : Sophie RossetChristophe Servan
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/12/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Emmanuel Morin
Examinateurs / Examinatrices : Catherine Berrut, Philippe Muller, Olivier Ferret, Laure Soulier
Rapporteurs / Rapporteuses : Catherine Berrut, Philippe Muller

Résumé

FR  |  
EN

La recherche informationnelle a évolué avec notre besoin d'instantanéité et d'intuitivité en une forme d'interrogation en langue naturelle, non plus uniquement axée sur l'utilisation de mots clés pertinents. L'étude de ces interactions soulève des problématiques majeures relevant du champ de la compréhension en ce qui concerne la contextualisation des questions. En effet, les questions sont rarement posées isolément. Regroupées, elles forment un dialogue qui se construit et se structure au fil de l'échange. Dans la série de questions suivantes : « Quel est le prix d'une chambre d'hôtel à Montréal ? », « Comment préparer un gâteau basque », « Que faut-il savoir sur les abeilles noires ? », « Dorment-elles ? », l'interprétation de certaines questions dépend des questions et réponses précédemment posées. Dans ce contexte, concevoir un système de réponse aux questions interactif capable de soutenir une conversation qui ne se résume pas à une simple succession de questions-réponses sporadiques constitue un défi en matière de modélisation et de calcul haute performance. L'évolution des techniques et solutions de calculs intensifs, la disponibilité de grands volumes de données brutes (dans le cas de l'apprentissage non supervisé) ou enrichies avec des informations linguistiques ou sémantiques (dans le cas de l'apprentissage supervisé) ont permis aux méthodes d'apprentissage automatique de connaître des développement important, avec des applications considérables dans le milieu industriel. Malgré leurs succès, ces modèles, de domaine et de langue, appris à partir d'une quantité de données massive avec un nombre de paramètres important font émerger des questions d'utilisabilité et apparaissent aujourd'hui peu optimaux, compte tenu des nouveaux enjeux de sobriété numérique. Dans une entreprise réelle où les systèmes sont développés rapidement et devraient fonctionner de manière robuste pour une variété croissante de domaines, de tâches et de langues, un apprentissage rapide et efficace à partir d'un nombre limité d'exemples est indispensable. Dans cette cette thèse nous approfondissons chacune des problématiques susmentionnées et proposons des approches fondées sur le transfert de connaissances issues de représentations latentes et contextuelles pour optimiser les performances et faciliter le déploiement à grande échelle.