Abstraction spatiale intégrée de molécules génétiques
Auteur / Autrice : | Sarkis Halladjian |
Direction : | Tobias Isenberg, Ivan Viola |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 14/12/2020 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de recherche en informatique (Orsay, Essonne ; 1998-2020) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Saclay, Ile-de-France) |
Référent : Faculté des sciences d'Orsay | |
Equipe de recherche : Analyse et visualisation (équipe de recherche ; Orsay) | |
Jury : | Président / Présidente : Alain Denise |
Examinateurs / Examinatrices : Marc Baaden, Michael Krone, Barbora Kozlíková | |
Rapporteur / Rapporteuse : Marc Baaden, Michael Krone |
Mots clés
Résumé
Le génome humain est principalement constitué d'ADN, une macromolécule constituée d'une longue séquence linéaire de bases, étroitement serrée pour s'insérer dans le noyau relativement petit. L'empaquetage donne lieu à de multiples niveaux hiérarchiques d'organisation. Des recherches récentes ont montré que, parallèlement à la séquence linéaire, l'agencement spatial du génome joue un rôle important dans la fonction et l'activité du génome. La visualisation des aspects li-né-aires et spatiaux des données du génome est donc nécessaire. Dans cette thèse, nous nous concentrons sur le concept d'abstraction visuelle continue pour les données multi-échelles, appliqué à la visualisation du génome humain. L'abstraction visuelle est un concept inspiré par des illustrations qui simplifie le travail de traitement visuel, en guidant l'attention du spectateur vers les aspects importants.Nous commençons par extraire les caractéristiques des données multi-échelles et faisons une comparaison parallèle entre le génome et les données astronomiques. Les différences existantes créent le besoin d'approches différentes. Un point commun cependant est la nécessité de transitions continues qui aident les spectateurs à saisir les relations et les différences de taille relative entre les échelles. Pour satisfaire aux conditions posées par les deux aspects des données génomiques multi-échelles, nous présentons deux cadres conceptuels, basés sur les mêmes données. Le premier cadre, ScaleTrotter, représente la structure spatiale du génome, à tous les niveaux disponibles. Il donne à l'utilisateur la liberté de voyager du noyau d'une cellule aux atomes des bases, en passant par les différents niveaux d'organisation du génome. Pour rendre possible l'exploration de la structure de tous les niveaux, des transitions temporelles fluides sont utilisées. Même si toutes les échelles ne sont pas visibles simultanément, la transition temporelle utilisée superpose deux représentations d'un même élément à des échelles consécutives, ce qui met en évidence leur relation. Pour garantir la compréhensibilité et l'interactivité des données, les parties inutiles des données sont extraites à l'aide d'une caméra dépendante de l'échelle. Le deuxième cadre, Multiscale Unfolding, se concentre sur des aspects qui ne sont pas visibles dans ScaleTrotter : la séquence linéaire et une vue d'ensemble simultanée de tous les niveaux organisationnels. Les données sont redressées pour déplier l’empaquetage qui se produit à plusieurs niveaux de manière à conserver la connectivité entre les éléments. Pour représenter tous les niveaux disponibles, nous utilisons des transitions spatiales douces entre les niveaux. Ces transitions spatiales sont basées sur le même concept que les transitions temporelles du cadre précédent, en superposant les échelles et en mettant l'accent sur leur relation et leur différence de taille. Nous introduisons une technique d'interaction appelée Multiscale Zliding qui permet l'exploration des données et met davantage l'accent sur les différences de taille entre les niveaux. Dans chaque cadre conceptuel, l'un des deux aspects linéaire ou spatial des données sur le génome est sacrifié pour mettre l'accent sur l'autre. La thèse se termine par une discussion sur la possibilité de combiner les deux cadres, en minimisant les sacrifices pour explorer les deux aspects du génome qui sont d'égale importance. Dans cette thèse, nous faisons un pas de plus vers la compréhension complète de l'activité du génome.