Caractérisation phénotypique, diagnostique et pronostique des patients atteints d’amylose cardiaque : élaboration de typologies et modèles prédictifs par méthodes d’apprentissage automatique - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Phenotypic, diagnostic and prognostic characterization of patients with cardiac amyloidosis : typologies and predictive modeling by machine learning approaches

Caractérisation phénotypique, diagnostique et pronostique des patients atteints d’amylose cardiaque : élaboration de typologies et modèles prédictifs par méthodes d’apprentissage automatique

Résumé

BACKGROUND: Cardiac amyloidosis (CA) is related to the infiltration of the myocardium by amyloid fibrils. The absence of early diagnosis tools, the heterogeneity of expression (multisystemic diseases) and the lack of knowledge of the modalities of its management by health professionals, lead to delays in diagnosis and a worsening of the prognosis of these diseases, which would also be particularly under-diagnosed. There is therefore a strong current need to better characterise these diseases. In this context, machine learning approaches, still little exploited in the biomedical field and especially in amyloidosis, could present interesting advantages for the analysis of these heterogeneous data and the optimisation of prediction capacities.OBJECTIVES:The objectives of this research were [1] to identify homogeneous profiles of patients characterised by their clinical, biological and cardiac phenotypes, [2] to develop new diagnostic models based on characteristics that can be easily examined in the clinic, [3] to develop new prognostic models in order to identify patients most at risk. MATERIALS AND METHODS :The thesis work was based on the analysis of data from N=1000+ patients from the National Reference Centre for Cardiac Amyloidosis, Henri Mondor Hospital with suspected or established diagnosis of CA. Machine learning data analysis methods were exploited to achieve the different objectives of the thesis, including :- [1] unsupervised clustering techniques based on the production of self-organizing maps.- [2,3] supervised techniques such as multivariate regression models, simple decision trees, random forests or extreme gradient boosting models.MAIN RESULTS :[1]7 distinct phenotypic profiles of patients were identified. Within the profiles, significant heterogeneity of CA types was very often observed, proving again the complexity of CA expression.3 distinct phenotypic profiles of predominantly ATTRwt patients were revealed (distinguished in particular by differentiated biological levels and CV risk factors). Their prognosis also shows significant disparities. These results could therefore suggest a differentiated management of ATTRwt according to the severity of their cardiac damage.[2]The clinical symptoms known to be clinical warning signs in CA (mucocutaneous involvement, infiltration of the integuments, peripheral neuropathy, deafness), revealed their eminently predictive nature on the diagnosis whatever the supervised approach employed.A random forest model capable of predicting the diagnosis (AL or ATTRv or ATTRwt or without AC) with an accuracy of 71.1% (internal validation) on the basis of features that can be easily examined in the clinic has been suggested, and could therefore constitute a reliable tool to help in the rapid referral of patients to diagnostic validation tests.[3]The analysis revealed that there is an interest in suggesting global prognostic models in CA (valid regardless of CA subtype).hs-cTnT, NT-proBNP, PAS and GGT are the biomarkers that have shown the greatest predictive importance on patients' prognosis.A global multivariate Cox regression model with a concordance of 72.7% (external validation) on 3-year prognosis was suggested and implemented in a web application for healthcare professionals as a prognostic assessment tool.CONCLUSIONS:The present thesis proposes keys to phenotypic understanding and tools to assist in the diagnostic and prognostic prediction of CA for healthcare professionals, based on machine learning approaches
CONTEXTE: Les amyloses cardiaques (AC) sont liées à l’infiltration du myocarde par des fibrilles amyloïdes. L’absence d’outils de diagnostic précoce, l’hétérogénéité de l’expression (maladies multisystémiques) et la méconnaissance des modalités de sa prise en charge par les professionnels de santé, entraînent des retards au diagnostic et une aggravation du pronostic de ces maladies qui seraient de plus, particulièrement sous-diagnostiquées. Il existe donc un besoin actuel fort de mieux caractériser ces maladies. Dans ce cadre, l’utilisation d'approches en apprentissage automatique, encore peu exploitées dans le domaine biomédical et plus particulièrement dans l'amylose, pourrait présenter des avantages intéressants pour l’analyse de ces données hétérogènes et l’optimisation des capacités de prédiction. OBJECTIFS : Les objectifs de cette recherche étaient [1] d’identifier des profils homogènes de patients caractérisés par leurs phénotypes clinique, biologique et cardiaque, [2] de développer de nouveaux modèles diagnostiques sur la base de caractéristiques pouvant être facilement examinables en clinique, [3] de développer de nouveaux modèles pronostiques afin d'identifier les patients les plus à risque. MATÉRIEL ET MÉTHODES : Le travail de thèse s’est appuyé sur l’analyse des données de N=1000+ patients du Centre de Référence National des Amyloses Cardiaques, Hôpital Henri Mondor avec suspicion ou diagnostic établi d'AC. Des méthodes d’analyse de données en apprentissage automatique ont été exploitées pour réaliser les différents objectifs de la thèse, incluant :- [1] des techniques non supervisées de type clustering s’appuyant sur la production de cartes auto-organisatrices.- [2,3] des techniques supervisées de type modèles de régression multivariés, arbres décisionnels simples et modèles ensemblistes de type random forests ou extreme gradient boosting.RÉSULTATS PRINCIPAUX :[1]7 profils phénotypiques distincts de patients ont été identifiés. Au sein des profils, une hétérogénéité importante des types d'AC a très souvent été observée, prouvant de nouveau la complexité d'expression des AC.3 profils phénotypiques distincts de patients principalement ATTRwt ont été révélés (distingués notamment par des niveaux biologiques et de facteurs de risques CV différenciés). Leurs pronostics présentent de plus des disparités importantes. Ces résultats pourraient donc suggérer une prise en charge différenciée des ATTRwt selon la gravité de leur atteinte cardiaque.[2] Les symptômes cliniques connus comme étant d'alerte en AC (atteinte cutanéo-muqueuse, infiltration des téguments, neuropathie périphérique, surdité), ont révélé un caractère éminemment prédictif sur le diagnostic quelque soit l'approche supervisée employée. Un modèle en random forest capable de prédire le diagnostic (AL ou ATTRv ou ATTRwt ou sans AC) avec une précision de 71,1% (validation interne) sur la base de caractéristiques examinables facilement en clinique a été proposé, et pourrait donc constituer un outil fiable d'aide à l'orientation rapide des patients vers les examens de validation du diagnostic.[3] L'analyse a révélé qu'il y a un intérêt à proposer des modèles pronostiques globaux en AC (valides quelque soit le sous-type d'AC). La hs-cTnT, NT-proBNP, PAS et les GGT sont les biomarqueurs qui se sont révélés de plus grande importance prédictive sur le pronostic. Un modèle global de régression multivariée de Cox, concordant à 72,7% (validation externe) sur le pronostic à 3 ans, a été proposé et été implémenté dans une application web à destination des professionnels de santé comme outil d'aide à l'évaluation pronostique.CONCLUSIONS :La présente thèse propose des clés de compréhension phénotypique et des outils d'aide à la prédiction diagnostique et pronostique des AC à destination des professionnels de santé, basées sur des approches en apprentissage automatique
Fichier principal
Vignette du fichier
97334_BONNEFOUS_2021_archivage.pdf (9.84 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03477823 , version 1 (13-12-2021)

Identifiants

  • HAL Id : tel-03477823 , version 1

Citer

Louis Bonnefous. Caractérisation phénotypique, diagnostique et pronostique des patients atteints d’amylose cardiaque : élaboration de typologies et modèles prédictifs par méthodes d’apprentissage automatique. Médecine humaine et pathologie. Université Paris-Est, 2021. Français. ⟨NNT : 2021PESC2028⟩. ⟨tel-03477823⟩
182 Consultations
150 Téléchargements

Partager

Gmail Facebook X LinkedIn More