Du dossier médical à l'utilisation des données. Élaboration de procédés basés sur l'intelligence artificielle pour extraire, structurer et analyser les données en pathologie thyroïdienne
Auteur / Autrice : | Dorian Culié |
Direction : | Alexandre Bozec, Emmanuel Chamorey |
Type : | Thèse de doctorat |
Discipline(s) : | Recherche clinique et thérapeutique |
Date : | Soutenance le 20/12/2024 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences de la vie et de la santé (Nice ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Recherche Translationnelle en Oncologie (Nice) (2022-) |
établissement de préparation : Université Côte d’Azur (2020-....) | |
Jury : | Président / Présidente : Pascal Staccini |
Examinateurs / Examinatrices : Pascal Staccini, Sylvain Morinière, Xavier Paoletti, Bertrand Baujat | |
Rapporteurs / Rapporteuses : Sylvain Morinière, Xavier Paoletti |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse vise à développer des méthodes d'intelligence artificielle (IA) pour extraire, structurer et analyser les données non structurées des dossiers médicaux électroniques (EHR) en pathologie thyroïdienne. Ces entrepôts de données de santé sont cruciaux tant pour la recherche que pour la prise en charge clinique, facilitant ainsi la gestion des informations issues de comptes rendus médicaux complexes.Dans une première phase, un algorithme de réseau de neurones convolutifs (CNN) a été entraîné sur un ensemble de 6 000 patients afin d'identifier ceux présentant des pathologies thyroïdiennes. Les performances ont été évaluées avec des métriques d'exactitude (0,95), rappel (0,83), précision (0,85), spécificité (0,97) et score F1 (0,84), montrant une robustesse élevée pour l'identification des patients concernés.La deuxième phase a consisté en l'automatisation de l'extraction des données issues de divers comptes rendus médicaux (consultations, échographies, anesthésies, chirurgies, et histopathologies). Un modèle IA a été testé sur une cohorte de 1 500 patients pour extraire 42 variables cliniques. La précision globale moyenne était de 90,89 %. Comparé aux experts humains (97,95 %) et aux non-experts (95,45 %), l'algorithme a montré des performances similaires pour la majorité des variables. Cependant, les performances étaient moins bonnes pour certaines variables plus complexes, nécessitant un jugement clinique, ce qui justifie une supervision humaine pour les tâches les plus délicates.En parallèle, un outil d'analyse statistique interactif, StatiCAL, a été développé pour permettre des analyses descriptives, univariées et multivariées en temps réel sur cette base de données. Accessible via l'intranet du Centre Antoine Lacassagne, cet outil facilite l'exploitation des données sans nécessiter de compétences en programmation, rendant ainsi l'analyse accessible à un plus grand nombre d'utilisateurs.Une étude rétrospective a également été menée sur 3 334 patients pour évaluer les facteurs prédictifs de la perte de signal de neuromonitoring (LOS) pendant la chirurgie thyroïdienne et leur impact sur la paralysie du nerf laryngé récurrent (RLNP). Les résultats ont révélé que le sexe masculin (OR = 2,64) et la thyroïdectomie totale (OR = 1,76) étaient des facteurs de risque indépendants de perte de signal. Cependant, ces facteurs n'avaient pas d'incidence significative sur la survenue d'une RLNP, puisque seulement 41 % des patients ayant présenté une perte de signal ont développé une paralysie du nerf laryngé.En conclusion, cette thèse démontre que l'IA peut grandement améliorer l'extraction et l'exploitation des données médicales, optimisant ainsi les bases de données pour la recherche clinique et la pratique médicale.