Thèse soutenue

AIDY : application de l'Intelligence Artificielle à la Dysmorphologie

FR  |  
EN
Auteur / Autrice : Quentin Hennocq
Direction : Roman Hossein Khonsari
Type : Thèse de doctorat
Discipline(s) : Technologies d'application médicale, diagnostiques, thérapies et santé publique
Date : Soutenance le 13/12/2023
Etablissement(s) : Université Paris Cité
Ecole(s) doctorale(s) : École doctorale Frontières de l'innovation en recherche et éducation (Paris ; 2006-....)
Partenaire(s) de recherche : Laboratoire : Institut des Maladies Génétiques (Paris)
Jury : Président / Présidente : Arnaud Picard
Examinateurs / Examinatrices : Chloé Bertolus, Stanislas Lyonnet, Marjolaine Willems, Michael Suttie
Rapporteurs / Rapporteuses : Peter Claes, Patrick Edery

Résumé

FR  |  
EN

Contexte. Trente à quarante pourcents des 7000 maladies rares entraînent des anomalies crânio-faciales et certaines nécessitent l'œil expert d'un dysmorphologiste. Le diagnostic, dans cette discipline, est basé avant tout sur l'expérience du praticien. Pour cette raison, les publications scientifiques décrivant des méthodes de diagnostic automatique de ces maladies rares à partir de photographies 2D de visages se multiplient. Ces méthodes peuvent être regroupées sous le terme de Phénotypage Nouvelle Génération (PNG). Ce travail de thèse a pour objectif de décrire de décrire les performances d'un nouvel outil de PNG basé sur des photographies 2D de visages d'enfants, entraîné sur une base non publiée, de grande échelle, et d'une grande diversité d'âges, de genres et d'ethnies. Méthodes. Nous avons inclus les données photographiques des services de chirurgie maxillo-faciale et de génétique clinique de l'hôpital Necker Enfants Malades (Paris, France). Cette base comprend 594 000 photographies correspondant à 22 000 patients, suivis depuis 1981. L'écriture de ce travail repose sur la publication successive des différentes étapes de construction de ce nouvel outil. Tout d'abord, nous décrivons la première étape d'analyse des photographies, consistant 1) à détecter automatiquement nos régions d'intérêt, c'est-à-dire les visages de face, de profil et les oreilles externes ; et 2) à placer automatiquement une série de landmarks, ou points anatomiques repères sur ces régions. Puis, nous utilisons la combinaison de méthodes d'analyse de formes ou morphométrie géométrique, et une analyse de textures sur des zones clés du visage. Enfin, ces paramètres géométriques et texturaux permettent d'entraîner des modèles de machine learning basés sur le classificateur XGboost. Ces modèles ont alors été validés sur des données indépendantes du set d'entraînement, d'autres centres hospitaliers nationaux (Nantes, Lille, Montpellier) et internationaux (Londres, Bangkok). Trois grands types de résultats ont pu être obtenus à travers les différentes publications au cours de cette thèse de doctorat : 1) des performances diagnostiques concernant un ou plusieurs syndromes génétiques, 2) des corrélations phénotype - génotypes pour certains syndromes pour lesquels il existe plusieurs variations génétiques et 3) une analyse des effets d'un traitement chirurgical ou médicamenteux sur la morphologie faciale. Résultats. Notre méthode a permis l'obtention de différents résultats de performances croissantes après incorporation des différentes étapes. La détection de régions d'intérêt a été optimisée par un algorithme de type Faster R-Convolutional Neural Network (CNN). Le meilleur modèle de landmarking était le patch-based Active Appearance Model (AAM), permettant une détection de patients atteints du syndrome de Treacher Collins parmi des enfants contrôles non-syndromiques (p < 0.001). Nous avons ensuite pu entrainer un modèle de détection du syndrome de Guion Almeida (Mandibulofacial Dysostosis with Microcephaly, MFDM), basé sur une analyse par morphométrie géométrique de l'oreille externe, avec une précision de 0.969 [0.838 - 0.999] (p < 0.001) parmi des contrôles, et de 0.813 [0.544 - 0.960] (p = 0.003) parmi 3 diagnostics différentiels de cette affection. Ensuite, l'incorporation de l'analyse du visage de face et de profil, ainsi que l'analyse des textures, a permis le diagnostic des syndromes d'Apert, de Crouzon et de Pfeiffer avec des précisions respectives de 0.879 [0.718 - 0.966] (p < 0.001), 0.932 [0.813 - 0.986] (p < 0.001) et 1.000 [0.815 - 1.000] (p < 0.001). Conclusion. Nous avons pu construire un outil robuste de NGP, permettant une analyse automatisée du phénotype facial sur des photographies 2D d'enfants atteints de syndromes génétiques. Nous devons désormais étendre cet algorithme à la méthodologie aboutie et validée, à l'analyse du grand nombre de syndromes présents dans notre base de données.