Thèse soutenue

Fouille d’arguments à partir des essais cliniques

FR  |  
EN
Auteur / Autrice : Tobias Mayer
Direction : Serena VillataCéline Poudat
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 16/12/2020
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Sophia Antipolis, Alpes-Maritimes)
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Web-Instrumented Man-Machine Interactions, Communities and Semantics - Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes) - Scalable and Pervasive softwARe and Knowledge Systems
Jury : Président / Présidente : Michel Riveill
Examinateurs / Examinatrices : Serena Villata, Céline Poudat, Michel Riveill, Iryna Gurevych, Smaranda Muresan, Anthony Hunter
Rapporteurs / Rapporteuses : Iryna Gurevych, Smaranda Muresan

Résumé

FR  |  
EN

Ces dernières années, le domaine de la e-santé a vu un intérêt croissant pour la définition de systèmes intelligents ayant le but d'accompagner les cliniciens dans leurs tâches et leurs activités quotidiennes. D’ailleurs, cela inclut de nouveaux systèmes pour le domaine de la médecine basée sur les preuves. Ce dernier repose sur le principe de l'évaluation critique des preuves médicales et de la combinaison de ces preuves de haute qualité avec l'expérience clinique individuelle du praticien par rapport à la situation d'un patient pour obtenir le meilleur résultat possible. La plupart des systèmes intelligents proposés visent soit à extraire des informations sur la qualité des preuves issues des essais cliniques, de directives cliniques ou des dossiers de santé électroniques, soit à aider dans les processus de prise de décision, sur la base de cadres de raisonnement. Le travail de cette thèse va au-delà de l'état de l'art des systèmes d'extraction d'informations actuellement proposés dans ce contexte. Il utilise des méthodes d'analyse d'arguments pour extraire et classifier les composants d’argumentation (c'est-à-dire les preuves et les conclusions d'un essai clinique) et leurs relations (c'est-à-dire le support et l'attaque). Un cadre de fouille d’arguments (Argument Mining) est proposé et amélioré pour intégrer des informations supplémentaires inspirées par les cadres biomédicaux courants pour l'analyse des essais cliniques. Ces extensions comprennent la détection des éléments PICO et un module d'analyse des résultats pour identifier et classer les effets (c'est-à-dire améliorés, augmentés, diminués, pas de différence, pas d'occurrence) d'une intervention sur le résultat de l'essai. Dans ce contexte, un jeu de données, composé de 660 résumés d'essais cliniques dans la base de données MEDLINE, a été annoté, en résultant dans le construction d’un jeu de données étiquetées qui inclut 4198 composants d’argumentation, 2601 relations d'argumentation et 3351 résultats d’intervention sur cinq maladies différentes (néoplasme, glaucome, hépatite, diabète, hypertension). Diverses approches d'apprentissage automatique et profond allant des SVM aux architectures récentes basées sur les réseaux de neurones ont été expérimentées, obtenant un F1 macro de 0,87 pour la détection de composants d'argumentation et de 0,68 pour la prédiction des relation d’argumentation, surpassant les résultats obtenus pas les systèmes de detection d'arguments dans l’état de l’art. De plus, une demo d’un système, appelé ACTA, a été développée pour démontrer l'utilisation pratique de l'approche basée sur les arguments développée pour analyser les essais cliniques. Ce système de démonstration a été intégré dans le contexte du projet Covid-on-the-Web pour créer des données liées riches et exploitables sur le Covid-19.