Use of deep learning algorithms for genomic prediction and guidance for breeding goals
Auteur / Autrice : | Fatima Shokor |
Direction : | Pascal Croiseau |
Type : | Projet de thèse |
Discipline(s) : | Génétique animale |
Date : | Inscription en doctorat le 03/10/2022 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Agriculture, alimentation, biologie, environnement, santé (Paris ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : GABI - Génétique animale et Biologie intégrative |
Equipe de recherche : Génétique et Génomique Bovine (G2B) | |
Référent : AgroParisTech |
Mots clés
Résumé
La prédiction génomique (PG) utilise l'association linéaire entre les marqueurs génomiques, comme polymorphismes nucléotidiques simples (SNP) et les phénotypes observés pour prédire valeurs génomiques d'élevage (Genomic Breeding Value ou GBV) des animaux. Bien qu'il n'y ait aucun doute sur le succès de méthodes statistiques, les individus qui diffèrent substantiellement de la majorité de la population en ce qui concerne leur génétique présenteront une plus grande erreur dans leur GBV. De plus, on pense qu'une bonne partie de la perte de précision de la prédiction est due à l'absence d'effets génétiques non additifs dans les modèles PG. Basé sur le fait que les techniques d'apprentissage automatique (Machine Learning ou ML) sont puissantes dans la modélisation des relations non linéaires (telles que les effets génétiques non additifs), ML est devenu le centre d'un certain nombre d'études en prédiction génomique, dans l'espoir qu'une telle méthode pourrait encore améliorer la précision de la prédiction des GBV. En fait, des études antérieures ont montré que les techniques d'apprentissage en profondeur (Deep Learning ou DL) - un sous-ensemble de ML - peuvent atteindre une précision PG équivalente à celles obtenues en utilisant les méthodes traditionnelles. Les applications DL aux PG, cependant, ne doivent pas se limiter à l'obtention de GBV et peuvent être appliquées de manière innovante pour améliorer les programmes de sélection. Ces préoccupations sont importantes dans les programmes d'élevage qui utilisent une stratégie de croisement, qui peut combiner les forces des races pures tout en compensant leurs faiblesses. Ce projet propose d'appliquer les techniques DL à la PG de manière innovante. 1. En appliquant le DL pour optimiser l'indice de sélection basé sur deux caractères ou plus, pour améliorer spécifiquement la sélection simultanée de caractères négativement corrélés ; 2. En utilisant le DL combiné avec des indices de sélection pour concevoir des schémas d'accouplement optimaux ; 3. En adaptant les deux premiers objectifs aux systèmes de croisement continu.