Identification de biomarqueurs de la qualité de la semence, modélisation statistique et validation biologique.

par Valentin Costes

Projet de thèse en Sciences agronomiques, biotechnologiques agro-alimentaires

Sous la direction de Florence Jaffrezic et de Hélène Kiefer.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) , en partenariat avec BDR - Biologie du Développement et Reproduction - UR 1198 INRA/ENVA (laboratoire) et de AgroParisTech (France) (établissement de préparation de la thèse) depuis le 22-05-2019 .


  • Résumé

    Le projet de thèse se propose d'optimiser les modèles de prédiction de la fertilité des taureaux d'insémination animale à partir de biomarqueurs identifiés dans la semence, et d'améliorer la compréhension des mécanismes moléculaires sous-jacents. Ce projet s'inscrit dans la continuité du LabCom SeQuaMol (partenariat INRA/ALLICE financé par l'ANR et Apis-Gene), dont le but est d'identifier de nouveaux biomarqueurs de fertilité mâle en caractérisant la semence d'un point de vue moléculaire (petits ARN, méthylation de l'ADN, ratio histones/protamines et modifications post-traductionelles, protéome, lipidome, glycome ; à combiner aux génotypes des taureaux et aux paramètres fonctionnels de la semence qui sont déjà utilisés en routine pour la sélection des taureaux d'insémination artificielle). L'objectif in fine est d'améliorer le contrôle qualité de la semence et d'éviter la mise sur le marché de lots défectueux ou issus de taureaux subfertiles pouvant avoir un impact négatif sur l'élevage. La thèse s'appuiera sur les données omiques déjà acquises sur une cohorte de 94 taureaux, et se déroulera en 3 phases. La première phase de la thèse contribuera, à l'acquisition de données sur une cohorte de validation plus large (n=240 taureaux de races Holstein et Montéliarde, soigneusement sélectionnés à partir de leur fertilité sur le terrain et de leur âge) en bénéficiant de l'expertise développée au sein de BDR et d'ALLICE. En particulier, la thèse s'intéressera à l'analyse bioinformatique des 240 séquences de type « reduced representation bisulfite sequencing déjà obtenues (RRBS, permettant d'analyser environ 1,5 millions de sites de méthylation de l'ADN sur le génome), à l'analyse des données de spermogramme, et si nécessaire à l'acquisition de données complémentaires. La phase suivante aura pour objectif de sélectionner et combiner les biomarqueurs nécessaires et suffisants pour prédire la fertilité. La thèse nécessitera alors l'adaptation de méthodes statistiques existantes ou en développement au sein de GABI pour intégrer les données (analyse factorielle multiple ou analyse de co-inertie multiple) et identifier un set minimal de biomarqueurs prédictifs parmi un grand nombre de biomarqueurs hétérogènes (approches de type IPF-Lasso et inférence de réseaux). Enfin, au cours de la 3ème phase, les données produites et les approches statistiques mises en œuvre permettront d'élaborer des hypothèses biologiques quant aux mécanismes génétiques et épigénétiques impactant la fonctionnalité de la semence bovine. Une de ces hypothèses sera ciblée pour faire l'objet d'une démonstration expérimentale.

  • Titre traduit

    Identification of biomarkers for semen quality, statistical modelling and biological validation


  • Résumé

    The aim of this PhD project is to optimize the prediction of male fertility using different categories of biomarkers identified in the semen of artificial insemination bulls, and to improve the understanding of the molecular mechanisms involved. This project is downstream to the LabCom SeQuaMol (partnership INRA/ALLICE funded by ANR and Apis-Gene), which consists in identifying molecular biomarkers of male fertility (small RNAs, DNA methylation, histone/protamine ratio, post-translational modifications, proteome, lipidome, glycome, to be combined with genotypes and functional parameters of semen, which are already used in routine for the selection of artificial insemination bulls). The final goal is to improve semen quality control procedures and avoid the commercialization of subfertile bulls or semen batches having a negative impact on the breeding sector. The PhD will use already available omic data obtained on 94 bulls and will comprise 3 phases. The first phase will contribute to data acquisition on an extended cohort of bulls (n = 240 bulls of Holstein and Montbéliarde breeds, carefully selected according to field fertility and age) using the tools developed by BDR research unit and ALLICE. In particular, the PhD project will focus on bioinformatics analysis of reduced representation bisulfite sequencing data already obtained from the 240 bulls (RRBS, interrogating DNA methylation at 1.5 million sites of the genome), analysis of semen functional parameters, and complementary experiments if required. The aim of the next phase is the selection and combination of biomarkers that are necessary and sufficient for a good prediction of male fertility. To achieve this goal, statistical methods existing or in development in GABI research unit will be adapted to our heterogeneous datasets to integrate data (multiple factor analysis or multiple co-inertia analysis) and identify a minimal set of predictive biomarkers among a huge number of variables (Lasso method and network inference). Finally, during the third phase, biological hypotheses about genetic and epigenetic processes affecting semen quality and bull fertility will be proposed from this statistical analysis. One of these hypotheses will be subjected to an experimental demonstration.