Thèse soutenue

Méthodes d’analyse des données fonctionnelles appliquées aux dynamiques de croissance et de lactation chez les bovins laitiers

FR  |  
EN
Auteur / Autrice : Cécile Sauder
Direction : Catherine Disenhaus
Type : Thèse de doctorat
Discipline(s) : Biologie et agronomie
Date : Soutenance en 2014
Etablissement(s) : Rennes, Agrocampus Ouest
Ecole(s) doctorale(s) : École doctorale Vie-Agro-Santé (Rennes)

Mots clés

FR

Mots clés contrôlés

Résumé

FR

L’essor des technologies d’investigation à haut débit a pour conséquence principale une augmentation très importante de la quantité d’information disponible par animal, et ce, de manière quasi-continue. Se posent alors le problème de la mobilisation et de la pertinence des méthodes permettant d’analyser ces données. Dans ce travail de doctorat, des méthodologies statistiques exploratoires dédiées au traitement des données fonctionnelles dans le contexte zootechnique des bovins laitiers sont étudiées. Les données fonctionnelles représentent des courbes (ou trajectoires) décrivant l’évolution de la croissance, de la production laitière ou de la qualité du lait par exemple. L’information contenue dans leur évolution est peu ou pas exploitée à ce jour. L’hypothèse retenue pour ce travail de thèse était que cette prise en compte permettrait d’améliorer la prédiction des performances zootechniques ultérieures. Le travail visait à savoir si les méthodes d’analyse des données fonctionnelles appliquées à ces dynamiques biologiques permettaient de mieux d´écrire les profils biologiques et d’améliorer leur prédiction des performances. Pour cela, les dynamiques de croissance et/ou de production individuelle ont et déterminées via la mobilisation de méthodes d’analyse de données fonctionnelles et d’estimation non-paramétriques, puis classés. Les effets des groupes obtenus ont ensuite été testées sur les performances (variables d’intérêts, discrètes et/ou continues). Les méthodes d´enveloppes ont permis au final de prendre en compte l’intégrité des courbes sur différents intervalles de temps. La modélisation des courbes est basée sur l’utilisation de splines, qui nécessitent de réaliser des choix quant au nombre de nœuds et de leur position, au paramètre de lissage ou encore, au choix du nombre de groupes de la classification. Différentes méthodes ont été testées et discutées. Il ressort surtout de ce travail que l’apport des outils de la statistique issue de l’analyse des données fonctionnelles permet de mettre en place de nouvelles approches d’analyses de bases de données complexes, mais permettant de prendre en compte les phénomènes biologiques d’un point de vue dynamique. Le couplage de plusieurs bases de données fonctionnelles est ainsi possible, mais reste à effectuer. Quoique prometteuses, notamment par rapport à l’évolution technique et l’émergence des problèmatiques autour de la gestion et l’exploitation des “Sensor Data” et/ou “Big Data”, ces approches doivent encore s’affiner pour une utilisation pertinente et efficace en élevages.