Thèse soutenue

Détection précoce de la maladie de Parkinson par l'analyse de la voix et corrélations avec la neuroimagerie
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Laetitia Jeancolas
Direction : Badr-Eddine BenkelfatHabib BenaliDijana Petrovska-Delacrétaz
Type : Thèse de doctorat
Discipline(s) : Traitement du signal et des images
Date : Soutenance le 04/12/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Télécom SudParis (France) - ARMEDIA / ARMEDIA-SAMOVAR - Département Electronique et Physique / EPH
établissement de préparation de la thèse : Institut national des télécommunications (Evry ; 1979-2009)
Jury : Président / Présidente : Laurence Devillers
Examinateurs / Examinatrices : Dijana Petrovska-Delacrétaz, Björn Schuller, Chafic Mokbel, Serge Pinto, Stéphane Lehéricy
Rapporteurs / Rapporteuses : Björn Schuller, Chafic Mokbel

Résumé

FR  |  
EN

Les modifications de la voix, prenant la forme de dysarthrie hypokinétique, sont un des premiers symptômes à apparaître dans la maladie de Parkinson (MP). Un grand nombre de publications existent sur la détection de MP par l'analyse de la voix, mais peu se sont intéressées spécifiquement au stade débutant. D'autre part, à notre connaissance, aucune étude n'avait été publiée sur la détection de MP via des enregistrements issus du réseau téléphonique. L'objectif de cette thèse a été d'étudier les modifications de la voix aux stades débutant et préclinique de la maladie de Parkinson, et de développer des modèles de détection précoce automatique et de suivi de cette maladie. Le but à long terme étant de pouvoir construire un outil de diagnostic précoce et de suivi, peu couteux, utilisable par les médecins en cabinet, et de manière encore plus intéressante, à partir de n'importe quel téléphone. La première étape a été de constituer une grande base de données voix de plus de 200 locuteurs français, comprenant des sujets MP débutants, des sujets sains et des sujets atteints de trouble idiopathique du comportement en sommeil paradoxal (iRBD), pouvant être considérés comme au stade préclinique de la maladie de Parkinson. Les participants ont effectué différentes tâches vocales enregistrées avec un microphone professionnel et avec le microphone interne d'un ordinateur. De plus, une fois par mois, ils ont également effectué ces tâches en appelant un servant vocal interactif à partir de leur propre téléphone. Nous avons étudié les effets de la qualité des microphones, du type de tâches, du genre, et de la méthode de classification. Nous avons analysé ces enregistrements vocaux par le biais de trois méthodes d'analyses différentes, couvrant différentes échelles de temps. Nous avons commencé avec des coefficients cepstraux et des modèles de mélange gaussien (GMM). Ensuite nous avons adapté la méthodologie des x-vecteurs (qui n'avait jamais été utilisée pour la détection de MP), puis nous avons extrait des paramètres globaux que nous avons classés avec des machines à vecteurs de support (SVM). Nous avons constaté des perturbations vocales aux stades débutant et préclinique de MP dans plusieurs domaines phonétiques, tels que l'articulation, la prosodie, la fluence verbale et les capacités rythmiques. Avec les enregistrements du microphone professionnel, nous sommes parvenus à détecter les hommes MP débutants avec une précision (Acc) de 89%, à partir de 6min de lecture, monologue et répétitions rapides et lentes de syllabes. Concernant les femmes, nous avons atteint Acc=70% à partir d'1min de monologue. Avec les enregistrements téléphoniques, nous avons obtenu des performances de classification de 75% pour les hommes, à partir de 5min de répétitions rapides de syllabes, et de 67% pour les femmes, à partir de 5min de monologue. Ces résultats constituent un premier pas important vers un télédiagnostic précoce de la maladie de Parkinson. Enfin nous avons aussi étudié les corrélations avec les données de neuroimagerie. Nous avons pu prédire linéairement, de manière significative, les données de DatScan et d'imagerie par résonance magnétique (IRM) sensible à la neuromélanine, à partir de paramètres vocaux. Ce résultat est prometteur au vu d'une possible utilisation future de la voix pour le suivi de l'évolution des premiers stades de MP.