Tests à noyaux, et leurs applications aux données de séquençage en cellule unique
Auteur / Autrice : | Anthony Ozier-Lafontaine |
Direction : | Bertrand Michel, Franck Picard |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et leurs interactions |
Date : | Soutenance le 24/11/2023 |
Etablissement(s) : | Ecole centrale de Nantes |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et Sciences et Technologies du numérique, de l’Information et de la Communication (Nantes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Mathématiques Jean Leray (Nantes) |
Jury : | Président / Présidente : Stéphane Minvielle |
Examinateurs / Examinatrices : Jean-Philippe Vert, Céline Vallot | |
Rapporteurs / Rapporteuses : Nathalie Villa-Vialaneix, Zoltán Szabó |
Mots clés
Résumé
Les technologies de sequençage en cellule unique mesurent des informations à l’échelle de chaque cellule d’une population. Les données issues de ces technologies présentent de nombreux défis : beaucoup d’observations en grande dimension et souvent parcimonieuses. De nombreuses expériences de biologie consistent à comparer des conditions.L’objet de la thèse est de développer un ensemble d’outils qui compare des échantillons de données issues des technologies de séquençage en cellule unique afin de détecter et décrire les différences qui existent. Pour cela, nous proposons d’appliquer les tests de comparaison de deux échantillons basés sur les méthodes à noyaux existants. Nous proposons de généraliser ces tests à noyaux pour les designs expérimentaux quelconques, ce test s’inspire du test de la trace de Hotelling- Lawley. Nous implémentons pour la première fois ces tests à noyaux dans un packageR et Python nommé ktest, et nos applications sur données simulées et issues d’expériences démontrent leurs performances. L’application de ces méthodes à des données expérimentales permet d’identifier les observations qui expliquent les différences détectées. Enfin, nous proposons une implémentation efficace de ces tests basée sur des factorisations matricielles de type Nyström, ainsi qu’un ensemble d’outils de diagnostic et d’interprétation des résultats pour rendre ces méthodes accessibles et compréhensibles par des nonspécialistes