Thèse soutenue

Visualisation interactive, soutenue par l'apprentissage automatique, de données hybrides 3D et 2D ; l'exemple de la spécification du lignage cellulaire en biologie végétale

FR  |  
EN
Auteur / Autrice : Jiayi Hong
Direction : Tobias IsenbergAlain Trubuil
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/02/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) - Institut national de recherche en informatique et en automatique (France). Workshop (1984 ; Sophia-Antipolis, France)
référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Caroline Appert
Examinateurs / Examinatrices : Miriah Meyer, Barbora Kozlíková, Anastasia Bezerianos, Johanna Beyer
Rapporteurs / Rapporteuses : Miriah Meyer, Barbora Kozlíková

Résumé

FR  |  
EN

Avec le développement des technologies d’infographie, les données spatiales peuvent être mieux visualisées dans leur environnement 3D afin que les spectateurs puissent observer clairement les formes et les positions 3D. Parallèlement, les visualisations abstraites en 2D peuvent présenter des informations résumées, visualiser des données supplémentaires et contrôler la vue 3D. La combinaison de ces deux représentations en une seule interface peut aider les utilisateurs à entreprendre des tâches complexes, en particulier dans les domaines scientifiques, bien qu’il y ait un manque de directives générales de conception pour l’interaction. En général, les experts doivent analyser de volumineuses données scientifiques pour mener à bien des tâches difficiles. Par exemple, dans le domaine biologique, les biologistes doivent construire l’arbre de lignage cellulaire d’un embryon contenant plus de 200 cellules. Dans ce cas, le travail manuel peut être long et fastidieux, et les algorithmes d’apprentissage automatique ont le potentiel d’alléger certains des processus manuels fastidieux en fournissant des annotations ou prédictions initiales aux experts. Dans le cas du lignage cellulaire, ces prédictions contiennent toutefois des informations hiérarchiques et multicouches, et il est essentiel de les visualiser de manière séquentielle ou progressive. De plus, les représentations 3D et 2D, ainsi que les prédictions d’apprentissage automatique, doivent être connectées visuellement et interactivement dans le système.Dans cette thèse, le problème du lignage cellulaire des embryons de plantes a été le leitmotiv pour concevoir et étudier un système de visualisation qui utilise des combinaisons de représentations 3D et 2D ainsi que des visualisations pour l’apprentissage automatique. Nous avons d’abord étudié les techniques d’interaction pour la sélection 3D au sein d’un embryon de plante. Les cellules d’un embryon de plante sont jointives et constituent un ensemble d’objets 3D dense dans toutes les dimensions spatiales. Nous avons mené une étude pour évaluer trois techniques de sélection différentes, et nous avons montré que la combinaison de la technique de Sélection par Explosion et de la technique de Sélection par Liste fonctionne bien pour désigner et observer les cellules d’un embryon. Ces techniques peuvent égale- ment être étendues à d’autres données 3D denses et similaires. Deuxièmement, nous avons conçu un système de visualisations et d’interaction combiné afin que les biologistes puissent examiner les cellules de l’embryon et enregistrer l’histoire du développement dans l’arbre de lignage hiérarchique. Nous prenons en charge la construction de la hiérarchie dans deux directions, à la fois en construisant l’historique de haut en bas de l’arbre en utilisant la sélection lasso dans l’environnement 3D et de bas en haut selon le flux de travail traditionnel pour construire un arbre de lignage cellulaire hiérarchique. Nous avons également ajouté un modèle de réseau neuronal pour fournir aux biologistes des prédictions initiales sur les filiations. Nous avons réalisé une évaluation avec des biologistes ; celle- ci a montré que les représentations 3D et 2D facilitent les prises de décisions et que l’outil peut enrichir leur vision des embryons. Cependant, la performance du modèle d’apprentissage automatique n’était pas idéale. Aussi, pour faciliter le processus et améliorer les performances du modèle, dans une version plus aboutie de notre système, nous avons entraîné cinq modèles de classification différents, visualisé les prédictions et leurs incertitudes associées. Nous avons réalisé une évaluation auprès des utilisateurs ; les résultats ont indiqué que les représentations des classifieurs que nous avons conçues sont faciles à comprendre, et que le nouvel outil peut améliorer significativement les prises de décision pour la validation du lignage cellulaire.