Prédiction du parcours de soins et du développement des enfants vulnérables

par Lucas Anzelin

Projet de thèse en Santé publique - biostatistiques

Sous la direction de Anne Thiebaut et de Matthieu Hanf.

Thèses en préparation à université Paris-Saclay , dans le cadre de École doctorale Santé Publique , en partenariat avec Centre de recherche en Epidemiologie et Santé des Populations (laboratoire) , Biostatistique en grande dimension (equipe de recherche) et de Faculté de médecine (référent) depuis le 30-09-2019 .


  • Résumé

    Les nourrissons vulnérables (nouveau-nés prématurés, avec un faible poids de naissance, ou une anomalie néonatale) sont particulièrement à risque de déficiences. En raison de la complexité de leur prise en charge médicale, la nécessité de les intégrer dans des réseaux de suivi spécialisés et multidisciplinaires a été soulignée. De tels réseaux sont en effet justifiés pour 1) détecter le plus précocement possible des anomalies du développement, et 2) minimiser leurs impacts en proposant des soins et une prise en charge adaptée. La question de la prise en charge de ces enfants vulnérables se pose du fait qu'ils nécessitent une attention particulière face à différents aspects de leur santé. Ces enfants ont en effet un risque plus important de développer des événements délétères pouvant impacter leur devenir à long terme. Après leur hospitalisation initiale, ils sont également ré-hospitalisés plus souvent comparativement aux autres enfants. Ils présentent un risque accru d'apparition durant l'enfance de déficiences de types moteurs, cognitifs ou sensoriels, des difficultés d'apprentissage et scolaires, ainsi que des problèmes comportementaux. Leur croissance diffère de celle des autres enfants et est potentiellement liée à l'apparition à l'âge adulte de problèmes métaboliques, respiratoires ou cardiovasculaires. Parce que la réalisation d'un suivi régulier sur le long terme représente un défi majeur pour une part non négligeable d'enfants vulnérables, il est traditionnellement observé un nombre élevé de perdus de vue dans cette population. Du point de vue médical, ces enfants représentent autant d'occasions manquées pour détecter et gérer au plus tôt les séquelles induites par leur vulnérabilité. Plus généralement, un constat similaire peut être fait concernant l'optimalité de l'ensemble du parcours et des consommations de soins des enfants vulnérables. Dans ce contexte, l'identification de marqueurs précoces qui prédisent le devenir et le parcours de soins des enfants vulnérables à court, moyen et long termes est primordiale pour personnaliser le plus précocement possible leur suivi et leur prise en charge. Compte tenu de ces enjeux, de nombreux chercheurs se sont intéressés à identifier des marqueurs précoces pour prédire les risques d'anomalies du développement ainsi que le parcours de soins des enfants vulnérables. La complexité de cette tâche est multiple. Elle réside dans l'hétérogénéité des anomalies et événements de santé à surveiller (anomalies motrices, cognitives, sensorielles, comportementales, croissance, maladies cardiovasculaires…) entrainant ainsi des difficultés de prédiction. La nature longitudinale des données rend également plus difficile le travail de modélisation. En partie pour contourner ce problème, les modèles réalisés jusqu'à maintenant pour prédire les anomalies de développement ou le parcours de soins des enfants vulnérables ont pour horizon un unique âge. Aucune approche prédictive globale restant valide aux différents âges de l'enfant n'a été pour l'instant développée. Une troisième source de complexité se trouve enfin dans l'hétérogénéité de la population des enfants prématurés dont le pronostic dépend non seulement de l'âge gestationnel et du poids à la naissance, mais aussi de beaucoup d'autres facteurs pré, péri et postnatals. Malheureusement, la qualité des études réalisées jusqu'à maintenant sur la prédiction du devenir des enfants vulnérables pourrait être améliorée (diversité des événements de santé étudiés et de leur période de survenue, études rétrospectives basées sur du déclaratif, critères d'inclusion hétérogènes, taille d'échantillon souvent petite, utilisation d'un nombre restreint de prédicteurs…). Pour répondre aux enjeux de santé publique associés au suivi des enfants vulnérables, SESAN, un organisme indépendant de droit privé à but non lucratif, a développé en 2005 sous l'impulsion de l'Agence Régionale de Santé d'Ile-de-France (ARS-IdF) et des réseaux de périnatalité d'IdF un dossier informatique régional partagé de suivi des enfants vulnérables : HYGIE SEV. SESAN s'étant également doté depuis 2018 d'un département spécialisé dans le traitement de données, il s'est vu confié récemment par l'ARS-IdF la gestion opérationnelle et la valorisation des données du Système d'information périnatalité en IdF se basant entre autres sur les données de la solution HYGIE SEV. Comme tous les domaines, les soins de santé et l'industrie médicale dans son ensemble sont peu à peu bouleversés par les données massives et les méthodes d'apprentissage automatique. Grâce à la collecte et à l'analyse de données volumineuses et hétérogènes, les techniques de prévention, de traitement, de diagnostic et de suivi des patients évoluent rapidement. Aujourd'hui, de très nombreuses données de santé sont collectées. Un nouvel objectif pour les professionnels de santé est donc d'utiliser ces données et méthodes pour dresser un portrait complet et compréhensible de chaque patient afin de lui offrir des soins sur mesure et une prise en charge personnalisée. En outre, des programmes comme IBM Watson sont maintenant utilisés pour la reconnaissance de motifs dans le cadre de diagnostics et s'avèrent même plus efficaces que les humains pour localiser et diagnostiquer de nombreuses pathologies. Cependant l'utilisation en routine de tels algorithmes est encore peu fréquente dans de nombreux domaines de la médecine. Ce constat est particulièrement vrai en pédiatrie/néonatologie, où le nombre d'applications de méthodes avancées d'apprentissage automatique et/ou de statistique inférentielle pour construire des scores pronostiques reste encore limité. Le potentiel de l'intelligence artificielle (IA) est pourtant immense concernant les enfants vulnérables, et pourrait permettre de repérer des anomalies du développement plus tôt et d'optimiser au mieux leur traitement et prise en charge. Une des conditions indispensables à la concrétisation de ce potentiel est la définition et création d'interfaces dynamiques intelligentes à destination des professionnels de santé pour leur permettre de synthétiser ces analyses et les aider à définir, évaluer et adapter en temps réel la prise en charge des enfants vulnérables. A ce jour, aucune interface de ce type n'a été développée et mise en production aussi bien en France qu'à l'international pour aider l'ensemble des professionnels de santé à mieux prendre en charge les enfants vulnérables. De même aucune interface de ce type n'est également disponible pour aider les familles des enfants à mieux comprendre les risques liés à la vulnérabilité des enfants et les aider à organiser au mieux leur parcours de soins. HYGIE SEV fait partie de ces rares systèmes d'information qui collectent de manière standardisée des données longitudinales sur un grand nombre d'enfants vulnérables d'IdF entre la naissance et l'âge de 7 ans. La diversité et la quantité des données collectées permettent de caractériser et de suivre précisément le développement des enfants dans des domaines tels que la croissance, la motricité globale et fine, la coordination oculo-manuelle, le langage, les interactions sociales, le sommeil et la nutrition. La maturité d'HYGIE SEV permet maintenant d'envisager la création d'une interface intelligente s'appuyant sur des méthodes d'analyse avancées pour aider les professionnels de santé/famille à identifier le plus précocement possible les enfants vulnérables à risque d'anomalie du développement et personnaliser au mieux leur prise en charge. Face à ces constats, l'objectif est donc d'utiliser les données d'HYGIE SEV pour 1) prédire à l'aide d'algorithmes avancés dit d'intelligence artificielle leurs problèmes de santé et leurs parcours de soins et 2) développer une/des interface(s) web dynamique permettant aux professionnels de santé de comprendre les implications de ces prédictions pour personnaliser au mieux la prise en charge des enfants vulnérables d'IdF. Cette thèse est destinée à amorcer ce projet d'envergure en se focalisant dans un premier temps sur l'étude et la prédiction des ruptures du parcours de soin (perdus de vue) des enfants vulnérables. Une généralisation de la méthodologie mise en place (nettoyage et mise en forme des données, choix des modèles, procédure de validation, mise en production et actualisation des modèles) sera effectuée dans un deuxième temps pour prédire la croissance staturo-pondérale et le devenir psychomoteur des enfants vulnérables. En fin de thèse, un prototype d'interface dynamique permettant de consulter et comprendre facilement les implications des prédictions/pronostics obtenus sera également construit.

  • Titre traduit

    Predicting the care trajectory and development of vulnerable children


  • Résumé

    The objective of this thesis project is to exploit HYGIE SEV data to 1) predict health issues and care trajectories of vulnerable children (preterm birth, low birth weight or neonatal defect) using artificial intelligence algorithms, and 2) develop a dynamic web interface allowing health professionals to understand the implications of these predictions to best customize the care of vulnerable children in Paris region.