Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C
Auteur / Autrice : | Nathanael Randriamihamison |
Direction : | Nathalie Villa-Vialaneix, Marie Chavent, Pierre Neuvial, Sylvain Foissac |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 27/10/2021 |
Etablissement(s) : | Toulouse 3 |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Laboratoire : Unité de Mathématiques et Informatique Appliquées (Toulouse) |
Jury : | Président / Présidente : Franck Picard |
Examinateurs / Examinatrices : Nathalie Villa-Vialaneix, Marie Chavent, Pierre Neuvial, Sylvain Foissac, Guillemette Marot-Briend, Cathy Maugis, David Causeur | |
Rapporteurs / Rapporteuses : Avner Bar-Hen |
Mots clés
Résumé
L'organisation spatiale du génome à l'intérieur du noyau des cellules a un impact majeur sur la régulation de l'expression des gènes, avec notamment des implications importantes dans le développement fœtal, la différentiation cellulaire ou le développement de maladies. Ceci constitue la motivation initiale de ce travail dont l'objet est l'étude de la structure tri-dimensionnelle du matériel génétique et de ses variations à partir de données Hi-C. Tout d'abord, on se penche sur la modélisation de la structure hiérarchique du génome à partir de données Hi-C. On étudie les extensions d'un outil statistique naturel pour l'examen de structures hiérarchiques, la Classification Ascendante Hiérarchique (CAH), pour justifier son application au Hi-C. Cela permet de justifier la modélisation des structures par des arbres binaires (issues de la CAH). On développe ensuite une méthode de comparaison de deux échantillons d'arbres pour être capable d'identifier des différences significatives.