Thèse soutenue

Clustering et apprentissage profond sous contraintes pour l'analyse de séries temporelles : application à l'analyse temporelle incrémentale en télédétection

FR  |  
EN
Auteur / Autrice : Baptiste Lafabregue
Direction : Germain ForestierPierre Gançarski
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 20/09/2021
Etablissement(s) : Mulhouse
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences de l'information et de l'ingénieur (Strasbourg ; 1997-....)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique, Mathématiques, Automatique et Signal (Mulhouse) - Institut de Recherche en Informatique Mathématiques Automatique Signal - IRIMAS - UR 7499 / IRIMAS

Résumé

FR  |  
EN

Depuis quelques années, les satellites réalisent des captures d'images de la Terre avec une haute fréquence de revisite et une haute disponibilité, qu'on peut représenter sous forme de séries temporelles. Cela permet d'effectuer une observation continue de la Terre avec des applications dans le suivi agricole, la gestion de catastrophes naturelles, etc. Cependant, ce phénomène ne se limite pas au domaine de la télédétection. On peut en effet observer une croissance similaire dans de nombreux domaines, tel que la médecine ou la finance. Or, dans tous ces domaines, l'analyse de ces données fait face aux mêmes problématiques.Une grande quantité de données n'est pas toujours accompagnée d'un étiquetage suffisant, ce qui empêche généralement une bonne application des méthodes supervisées. En effet, l'étiquetage reste une tâche très chronophage et complexe, car nécessitant une expertise sur les données analysées. A l'opposé, les méthodes non supervisées ne nécessitent pas de connaissances de l'expert mais donnent parfois des résultats médiocres.Dans ce contexte, le clustering sous contraintes est une alternative qui offre un bon compromis en termes d'investissement pour l'expert. Toutefois, les méthodes de clustering sous contraintes sont sujettes à des limitations importantes. Nous montrons dans cette thèse que deux facteurs limites fortement l'impact des contraintes, la consistance, qui est la quantité d'information dans l'ensemble des contraintes que l'algorithme peut déterminer par ses propres biais, et la cohérence, qui est le degré d'accord entre les contraintes elles-mêmes.Afin de répondre au problème de consistance, nous proposons une nouvelle méthode, I-SAMARAH, basée sur le clustering collaboratif et l'intégration des contraintes de manière incrémentale. Cependant, nous montrons également que le problème de cohérence reste important que nous proposons d'aborder de manière plus prospective avec des méthodes basées sur l'apprentissage profond.