Thèse soutenue

Méthodes d'apprentissage statistique pour la classification automatique des cultures et la prévision de rendements à grande échelle

FR  |  
EN
Auteur / Autrice : Walid Hammache
Direction : Paul-Henry CournèdeThéophile Lohier
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 09/12/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale INTERFACES : approches interdisciplinaires, fondements, applications et innovation
Partenaire(s) de recherche : Laboratoire : Mathématiques et informatique pour la complexité et les systèmes (Gif-sur-Yvette, Essonne ; 2006-....)
référent : CentraleSupélec (2015-....)
graduate school : Université Paris-Saclay. Graduate School Sciences de l'ingénierie et des systèmes (2020-....)
Entreprise : CybeleTech
Jury : Président / Présidente : Céline Hudelot
Examinateurs / Examinatrices : Xiaopeng Zhang, Adel Hafiane
Rapporteurs / Rapporteuses : Xiaopeng Zhang, Adel Hafiane

Résumé

FR  |  
EN

La principale thématique étudiée dans ce travail concerne l'identification des types de cultures par imagerie satellite radar avec des modèles d'apprentissage statistique. L'identification des cultures permet le suivi automatique de la couverture du sol et l'estimation des surfaces plantées ainsi que l'amélioration de la prévision des rendements agricoles, c'est l'autre sujet traité dans ce travail. Pour ces travaux, nous avons pu compter sur un allié majeur, l'imagerie satellitaire qui fournit des images multi-temporelles à haute résolution offrant une réelle opportunité de suivre l'évolution des propriétés réflectives des plantes durant leur croissance, en fonction des variations liées à la phénologie et au pédoclimat. Nous utilisons l'imagerie radar Sentinel-1 assurant une indépendance vis-à-vis des conditions climatiques. Notre approche pour la reconnaissance des cultures est basée sur l'utilisation de la dynamique de croissance des plantes pouvant être capturée par l'imagerie satellite pour discriminer les cultures. Il s'agit d'une approche par pixels pour laquelle nous avons choisi d'utiliser deux modèles supervisés d'apprentissage statistique, les réseaux de neurones récurrents LSTM et les réseaux de convolution CNN. Notre approche est conçue de telle sorte que le modèle puisse produire une évaluation du couvert végétal sans avoir à labelliser des parcelles en début de campagne, opération complexe à réaliser. Nous avons donc cherché à calibrer les modèles en utilisant les données des campagnes précédentes. Nous proposons une méthode dans laquelle le développement phénologique de la plante est considéré pour l'identifier en utilisant le concept du temps thermique. Cela permet de compenser la variabilité inter-annuelle, qu'elle soit pédo-climatique, liée aux caractéristiques de la culture comme la résistance aux épisodes de gel, ou due aux pratiques culturales. L'identification des cultures peut servir l'amélioration des prévisions de rendement résultant d'une meilleure connaissance des surfaces plantées. C'est une autre thématique de recherche de notre thèse. La reconnaissance des cultures peut constituer un élément essentiel dans le processus visant à obtenir des prévisions de rendements les plus précis possible. En identifiant le type de culture dans le champ, nous connaissons les caractéristiques phénotypiques de cette culture pour pouvoir estimer les paramètres biophysiques, ce qui, couplé aux données pédoclimatiques et aux pratiques culturales, nous permet d'aller vers une prévision précise des rendements agricoles en utilisant les modèles de croissance des plantes, les méthodes de calibration et d'assimilation de données. Cette méthodologie pour la prévision des rendements à l'échelle de la parcelle ou de la région est également étudiée dans cette thèse. En effet, la connaissance anticipée des rendements agricoles est un enjeu majeur en agriculture: dans un bassin de production, pour le chef de silo afin de prévoir la logistique de culture et de stockage des grains ou à plus grande échelle, pour anticiper les crises agricoles. Dans ce contexte, nous avons commencé par évaluer le potentiel de l'imagerie radar pour le développement de modèles statistiques permettant l'estimation des variables biophysiques des plantes telles que la biomasse. Nous avons également proposé un outil permettant de conseiller le positionnement des points de mesure dans les parcelles agricole en fonction des hétérogénéités intra-parcellaires et en utilisant un clustering non supervisé de type K-means de la dynamique de la réponse radar de chaque pixel. Ensuite, nous présentons une mise en œuvre des méthodes d'assimilation de données pour montrer comment elles peuvent être utilisées pour améliorer les pouvoirs prédictifs des modèles de croissance des plantes. Nous utilisons un algorithme d'assimilation de données basé sur le filtre particulaire par convolution appliqué à un modèle mécaniste de croissance du blé dérivé du modèle STICS.