Inférence en langue naturelle pour essais cliniques
Auteur / Autrice : | Mathilde Aguiar |
Direction : | Pierre Zweigenbaum |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) |
Equipe de recherche : SEME | |
Référent : Faculté des sciences d'Orsay |
Résumé
Le but global de la thèse est de concevoir un modèle d'inférence en langue naturelle appliqué aux essais cliniques. La tâche de raisonnement sur le domaine clinique est complexe et des connaissances a priori peuvent être utilisées pour améliorer la performance de l'inférence. Cette thèse fait l'hypothèse que des connaissances du domaine provenant de ressources externes peuvent être incorporées dans des modèles de langue pour mieux prédire les incohérences dans la publication de résultats d'essais cliniques randomisés (par exemple, dans la déclaration des critères d'inclusion et d'exclusion). Cette thèse a les objectifs suivants : - Apprentissage par transfert en utilisant des jeux de données disponibles tels que SNLI et MedNLI. Compte tenu de l'existence de jeux de données du domaine général et de domaines proches, cette thèse explorera des méthodes qui peuvent tirer parti de données générales et spécifiques au domaine pour obtenir de meilleures performances. - Incorporer des connaissances du domaine à partir de bases de connaissances. Le traitement des textes cliniques nécessite des connaissances spécifiques au domaine, cette thèse explorera différentes approches d'intégration de ces connaissances dans les modèles.