Thèse soutenue

Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C

FR  |  
EN
Auteur / Autrice : Nathanael Randriamihamison
Direction : Nathalie Villa-VialaneixMarie ChaventPierre NeuvialSylvain Foissac
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 27/10/2021
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Unité de Mathématiques et Informatique Appliquées (Toulouse)
Jury : Président / Présidente : Franck Picard
Examinateurs / Examinatrices : Nathalie Villa-Vialaneix, Marie Chavent, Pierre Neuvial, Sylvain Foissac, Guillemette Marot-Briend, Cathy Maugis, David Causeur
Rapporteurs / Rapporteuses : Avner Bar-Hen

Résumé

FR  |  
EN

L'organisation spatiale du génome à l'intérieur du noyau des cellules a un impact majeur sur la régulation de l'expression des gènes, avec notamment des implications importantes dans le développement fœtal, la différentiation cellulaire ou le développement de maladies. Ceci constitue la motivation initiale de ce travail dont l'objet est l'étude de la structure tri-dimensionnelle du matériel génétique et de ses variations à partir de données Hi-C. Tout d'abord, on se penche sur la modélisation de la structure hiérarchique du génome à partir de données Hi-C. On étudie les extensions d'un outil statistique naturel pour l'examen de structures hiérarchiques, la Classification Ascendante Hiérarchique (CAH), pour justifier son application au Hi-C. Cela permet de justifier la modélisation des structures par des arbres binaires (issues de la CAH). On développe ensuite une méthode de comparaison de deux échantillons d'arbres pour être capable d'identifier des différences significatives.