Thèse en cours

Inférence en langue naturelle pour essais cliniques

FR  |  
EN
Auteur / Autrice : Mathilde Aguiar
Direction : Pierre Zweigenbaum
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/10/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
Equipe de recherche : SEME
Référent : Faculté des sciences d'Orsay

Résumé

FR  |  
EN

Le but global de la thèse est de concevoir un modèle d'inférence en langue naturelle appliqué aux essais cliniques. La tâche de raisonnement sur le domaine clinique est complexe et des connaissances a priori peuvent être utilisées pour améliorer la performance de l'inférence. Cette thèse fait l'hypothèse que des connaissances du domaine provenant de ressources externes peuvent être incorporées dans des modèles de langue pour mieux prédire les incohérences dans la publication de résultats d'essais cliniques randomisés (par exemple, dans la déclaration des critères d'inclusion et d'exclusion). Cette thèse a les objectifs suivants : - Apprentissage par transfert en utilisant des jeux de données disponibles tels que SNLI et MedNLI. Compte tenu de l'existence de jeux de données du domaine général et de domaines proches, cette thèse explorera des méthodes qui peuvent tirer parti de données générales et spécifiques au domaine pour obtenir de meilleures performances. - Incorporer des connaissances du domaine à partir de bases de connaissances. Le traitement des textes cliniques nécessite des connaissances spécifiques au domaine, cette thèse explorera différentes approches d'intégration de ces connaissances dans les modèles.