Thèse soutenue

Etude de quelques problèmes liés à la mise en oeuvre du REML en génétique quantitative

FR  |  
EN
Auteur / Autrice : Christèle Robert
Direction : J.-R. MATHIEU
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance en 1996
Etablissement(s) : Toulouse 3

Mots clés

FR

Mots clés contrôlés

Résumé

FR

La theorie de la genetique quantitative animale est basee sur le modele lineaire mixte gaussien. Ce dernier permet de dissocier les effets genetiques et les effets de milieu intervenant dans des performances zootechniques controlees dans les elevages. Il s'agit alors, pour le geneticien implique dans les programmes d'amelioration genetique, d'estimer l'ensemble des effets fixes lies a l'environnement, de predire les valeurs genetiques des animaux candidats a la selection et d'estimer les composantes de la variance. La methode qui prevaut actuellement est celle du maximum de vraisemblance restreinte. Cette methode a des proprietes interessantes, notamment en presence de donnees selectionnees mais son application peut etre tres couteuse en temps de calcul et en besoins informatiques lorsque le nombre de donnees a analyser est important. La difficulte vient de la necessite d'inverser de facon repetee des matrices symetriques creuses et de tres grande taille. Dans la premiere partie de la these, une methode basee sur le calcul des valeurs propres de telles matrices a partir de la methode de lanczos est presentee. Elle a l'avantage de pouvoir etre appliquee avec des temps de calculs et des besoins en memoire convenables. Nous proposons quelques amenagements de cette methode afin de l'appliquer au contexte de la genetique quantitative (determination des valeurs propres multiples et de leurs multiplicites, organisation pratique des calculs sur matrices creuses). Cette methode est appliquee a un fichier de donnees de grande taille (matrice de dimension superieure a 21000). Dans le cadre d'une evaluation genetique, les composantes de la variance (genetiques et residuelles) estimees par la methode du maximum de vraisemblance restreinte sont supposees homogenes. Or, cette hypothese est peu realiste. La deuxieme partie de la these presente et discute l'estimation des composantes de (co)variance entre milieux en situation d'heteroscedasticite et les tests d'homogeneite de certains parametres (correlations genetiques entre milieux, heritabilites) interessant les geneticiens. Deux modelisations de l'heteroscedasticite en modele lineaire mixte gaussien sont presentees. Un algorithme iteratif d'esperance-maximisation (em) est propose pour calculer les estimees du maximum de vraisemblance restreinte (reml) des composantes residuelles et genetiques de variance-covariance. Les procedures de test reposent sur le rapport des vraisemblances restreintes maximisees sous le modele reduit (fonction de l'hypothese d'homogeneite consideree) et le modele sature. Une application de ces methodes a ete effectuee dans le domaine de la genetique quantitative sur des donnees de pointage morphologique en race bovine montbeliarde. Differentes sources d'heterogeneite des variances genetiques et residuelles ont ete mises en evidence, notamment celle imputable au technicien realisant le pointage