Thèse soutenue

Traitement du signal et analyse des données PTR-TOF-MS de l'air expiré pour la découverte de biomarqueurs

FR  |  
EN
Auteur / Autrice : Camille Roquencourt
Direction : Stanislas Grassin-DelyleEtienne Thévenot
Type : Thèse de doctorat
Discipline(s) : Mathématiques et Informatique
Date : Soutenance le 25/03/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Laboratoire : Laboratoire d'intégration des systèmes et des technologies (Gif-sur-Yvette, Essonne ; 2001-....)
Jury : Président / Présidente : Karine Bennis-Zeitouni
Examinateurs / Examinatrices : Thomas Burger, Frédéric Bertrand, Wolfram Miekisch
Rapporteurs / Rapporteuses : Thomas Burger, Frédéric Bertrand

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'analyse des composés organiques volatils (COVs) dans l'air expiré est une méthode non invasive prometteuse en médecine pour le diagnostic précoce, le phénotypage, le suivi de la maladie et du traitement et le dépistage à grande échelle. La spectrométrie de masse à temps de vol par réaction de transfert de protons (PTR-TOF-MS) présente un intérêt majeur pour l'analyse en temps réel des COVs et la découverte de nouveaux biomarqueurs. Le manque de méthodes et d'outils logiciels pour le traitement des données PTR-TOF-MS provenant de cohortes représente actuellement un verrou pour le développement de ces approches.Nous avons ainsi développé une suite d'algorithmes permettant le traitement des données brutes jusqu’au tableau des intensités des molécules détectées, grâce à la détection des expirations et des pics dans les spectres de masse, la quantification dans la dimension temporelle, l'alignement entre les échantillons et l'imputation des valeurs manquantes. Nous avons notamment mis au point un modèle innovant de déconvolution des pics en 2 dimensions reposant sur une régression du signal par splines pénalisées, ainsi qu'une méthode permettant de sélectionner spécifiquement les COVs dans l'air expiré. L'ensemble du processus est implémenté dans le paquet R/Bioconductor ptairMS, disponible en ligne. Nous avons validé notre approche à la fois sur des données expérimentales (mélange de COVs à des concentrations standardisées) et par simulation. Les résultats montrent que l'identification des COVs provenant de l’air expiré à partir du modèle proposé atteint une sensibilité de 99 `%. Une interface graphique a également été développée pour faciliter l'analyse des données et l'interprétation des résultats par les expérimentateurs (les cliniciens notamment). Nous avons appliqué notre méthodologie à la caractérisation de l'air expiré d'adultes sous ventilation mécanique atteints de l’infection COVID-19. Les analyses de l'air expiré de 40 patients atteints d’un syndrome de détresse respiratoire aiguë (SDRA) ont été effectuées quotidiennement, de l'entrée à la sortie de l'hôpital. Nous avons d'abord réalisé un modèle de classification pour prédire le statut de l'infection, en utilisant l'acquisition disponible la plus proche de l’admission à l'hôpital.Ce modèle permet de prédire le statut de l'infection avec une précision de 93%. Ensuite, nous avons utilisé toutes les données disponibles pour une analyse longitudinale de l'évolution des COVs en fonction de la durée de l'hospitalisation, en utilisant un modèle à effets mixtes. Après sélection de variables, quatre biomarqueurs de l'infection par le COVID-19 ont pu être identifiés. Ces résultats soulignent la valeur des données PTR-TOF-MS et du logiciel ptairMS pour la découverte de biomarqueurs dans l'air expiré.