Intégration et analyse de données biologiques hétérogènes par exploitation de graphes multicouches pour mieux comprendre les variations d’efficience alimentaire chez le porc
Auteur / Autrice : | Camille Juigné |
Direction : | Florence Gondret, Emmanuelle Becker |
Type : | Thèse de doctorat |
Discipline(s) : | Génétique, génomique et bio-informatique |
Date : | Soutenance le 01/12/2023 |
Etablissement(s) : | Rennes, Agrocampus Ouest |
Ecole(s) doctorale(s) : | École doctorale Écologie, Géosciences, Agronomie, Alimentation (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage |
Jury : | Président / Présidente : Mathieu Emily |
Examinateurs / Examinatrices : Emmanuelle Becker, Michel Dumontier | |
Rapporteur / Rapporteuse : Andrea Rau, Fabien Jourdan |
Mots clés
Résumé
Les progrès technologiques d’étude du vivant ont conduit à une explosion de données multimodales et multicentriques. Ce phénomène soulève de nombreuses questions liées au stockage, à la standardisation et à l’analyse de ces données massives. Ainsi, ce travail de thèse porte sur le développement d’une méthode intégrative d’analyse de données biologiques, pour en extraire de la connaissance. Pour prendre en compte leur forte interdépendance, cette approche consiste à intégrer différents types d’entités biologiques (ARNm, protéines, métabolites, caractères observables) qui sont habituellement étudiés indépendamment les uns des autres. La solution informatique élaborée permet d’intégrer ces données hétérogènes dans un graphe multicouche, avec une couche par type d’entités.L’originalité est de relier les éléments d’une couche ou de couches différentes par des propriétés extraites des bases de données et de connaissances publiques à l’aide de technologies du Web Sémantique. A partir de ce graphe, le but est de caractériser les relations entre un groupe de molécules d’intérêt grâce à des métriques de la théorie des graphes. La méthode développée a été appliquée à des jeux de données expérimentaux (transcriptomique, métabolomique et phénotypes animaux) pour décrire et comprendre les relations entre les molécules et leur importance dans la variation d’efficience alimentaire de porcs. L’efficience alimentaire est un phénotype clé pour contribuer à un élevage durable, mais complexe. Ce travail a permis de mettre à disposition des méthodes d'analyse novatrices, à différentes échelles de l’organisation du vivant, favorisant une meilleure compréhension des processus biologiques.