Adaptation de domaines et de langages dans les PLM, application à la recherche d'information conversationelle
Auteur / Autrice : | Victor Morand |
Direction : | Benjamin Piwowarski, Josiane Mothe |
Type : | Projet de thèse |
Discipline(s) : | Sciences et technologies de l'information et de la communication |
Date : | Inscription en doctorat le 01/11/2024 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris |
Partenaire(s) de recherche : | Laboratoire : Institut des Systèmes Intelligents et de Robotique |
Mots clés
Résumé
Ce projet s'inscrit dans le contexte des grands modèles de langage (LLM) et des systèmes conversationnels (par exemple ChatGPT, WebGPT), qui ont connu des progrès pratiques considérables au cours des derniers mois. Le projet GUIDANCE vise à mener des recherches sur l'accès à l'information numérique assisté par un dialogue général, en particulier sur la manière de permettre aux utilisateurs d'accéder à l'information numérique, dans le but de surmonter plusieurs limites des LLM actuels : Les LLM n'ont pas été conçus pour la recherche d'information - que ce soit au niveau du pré-entraînement ou des tâches de fine-tuning. Les LLM ont des capacités de généralisation limitées à de nouveaux domaines et/ou langues ; La véracité et la sincérité des résultats sont discutables. Les modèles LLM potentiellement les plus avancés ne sont pas en libre accès et la méthodologie scientifique ainsi que l'évaluation appropriée sont à peine décrites dans la littérature scientifique. Du point de vue de la création d'une communauté, le projet GUIDANCE vise à fédérer le projet de la Communauté française de recherche d'information (RI), en rassemblant des experts du domaine pour faire avancer le développement de modèles d'accès à l'information basés sur le dialogue (DbIA) exploitant les LLMs.