Développements des réseaux de neurones pour données censurées: prédiction de survie après untraitement adjuvant dans le cancer du sein

par Elvire Roblin

Projet de thèse en Recherche clinique, innovation technologique, santé publique

Sous la direction de Stefan Michiels et de Paul-Henry Cournède.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Cancérologie, Biologie, Médecine, Santé , en partenariat avec Centre de Recherche en épidémiologie et Santé des populations (laboratoire) et de Faculté de médecine (référent) depuis le 07-10-2019 .


  • Résumé

    En oncologie, l'analyse des données de survie a des applications multiples : analyse de la survie d'un groupe de patients, comparaison des effets de différents traitements, etc. Les données de survie présentent la caractéristique de ne pas être observées complètement, l'événement d'intérêt n'étant pas nécessairement survenu pour tous les patients à la fin de la période d'observation : les données sont dites censurées. Dans les modèles pronostiques, on utilise traditionnellement un modèle à risques proportionnels de Cox pour analyser les données de survie. Ce modèle repose sur des hypothèses restrictives qui ne permettent pas de prendre en compte facilement l'analyse d'un nombre toujours croissant de facteurs pronostiques et prédictifs, ni d'inclure toutes leurs interactions ou leurs effets non linéaires. De nouveaux modèles s'appuyant sur les réseaux de neurones artificiels peuvent être employés pour faire face à ces limites. L'objectif de cette thèse sera d'utiliser ces modèles et de les adapter au contexte des données censurées. Cette approche permettra d'évaluer le risque de rechute chez une patiente atteinte d'un cancer du sein, traitée de manière conventionnelle en fonction de sa signature moléculaire, avec pour objectif à long terme d'identifier et de définir le traitement le plus adapté à chaque patiente. Nous verrons dans un premier temps comment mettre en place un modèle de réseaux de neurones en incluant des pseudo observations. Celles ci sont construites sur le principe du ré échantillonnage et permettent de répondre à la question de la censure. Dans un second temps, nous établirons une mesure de l'incertitude des prédictions réalisées en se plaçant dans un cadre bayésien et en s'appuyant sur la technique du dropout. Celle ci correspond au fait de retirer des neurones de façon aléatoire dans un réseau de neurones. Enfin, nous mettrons en place des recommandations de traitement individualisées.

  • Titre traduit

    Survival Prediction after an Adjuvant Treatment in Breast Cancer using Artificial Neural Networks on Censored Data


  • Résumé

    In oncology, analyzing survival data is of primary importance in epidemiological studies and clinical research. The most commonly used approach to deal with the censored observations present in these type of studies is the Cox proportional hazards model. The model is based on particular assumptions which may be hard to assume for a high number of candidate covariates to evaluate (proportional hazards, linearity of effects, interactions between covariates). Recently a new family of models, Artificial Neural Networks, has been proposed to model complex patterns and prediction problems, and may be used in the context of survival outcome. They have been widely used in different areas of sciences. This PhD aims at providing new methods of survival analysis using neural networ ks. It will enable us to identify patients with breast cancer with a high risk of relapse after standard chemotherapy based regimens. To reduce the risk of relapse, treatment recommendations that are based on biomarker scores will be provided. The objective of the first part of the PhD project will be to implement a neural network using pseudo observations as a solution to the problem of censored data. The second part will focus on dropout in deep neural networks to model the uncertainty of our pred ictions using a Bayesian framework. Finally, a neural network will be optimized for a treatment recommendation rule will be set up in order to provide treatment recommendations based on the patient prognostic features.