Localisation temporelle et suivi de l'action dans les vidéos de sport amateur
Auteur / Autrice : | Axel Baldanza |
Direction : | Jean-François Aujol, Yann Traonmilin |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées et calcul scientifique |
Date : | Soutenance le 04/10/2023 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de mathématiques de Bordeaux |
Jury : | Président / Présidente : Nelly Pustelnik |
Examinateurs / Examinatrices : Nicolas Papadakis | |
Rapporteur / Rapporteuse : Yann Gousseau, Loïc Denis |
Mots clés
Mots clés contrôlés
Résumé
L'analyse des vidéos sportives est un domaine qui a récemment connu un attrait particulier en vision par ordinateur. Les objectifs sont multiples : améliorer les performances des athlètes, améliorer l'expérience visuelle des spectateurs, analyser les parties, faciliter l'acquisition ...Cependant, la majorité des travaux du domaine concernent le sport professionnel. Le sport amateur, qui concentre beaucoup moins de moyens, est largement moins étudié. Pourtant, ce contexte suscite de nombreuses nouvelles problématiques. Dans cette thèse, nous nous concentrons sur l'analyse de vidéos sportives capturées dans le contexte amateur. Plus précisément, nous traitons dans ce manuscrit deux problématiques précises : la localisation temporelle de l'action pour la découpe automatique des vidéos et le suivi vidéo pour la conception de caméras autonomes. Ainsi, la première partie de la thèse traite de la problématique de la localisation temporelle de l'action, aussi appelée proposition temporelle d'actions. Cette partie présente une méthode qui vise à la conception d'un algorithme de découpage automatique des vidéos en fonction de leur contenu. Ainsi, chaque vidéo traitée ne contient plus que l'action de jeu. Pour cela, nous traitons la problématique de proposition temporelle d'actions en proposant une méthode basée sur l'utilisation d'un réseau de neurones convolutif, qui permet de réduire le nombre de faux négatifs afin de limiter la possibilité d'endommager une séquence qui contient l'action de jeu. Dans les deux parties suivantes, nous traitons de la problématique de suivi vidéo. Il s'agit là de présenter une méthode qui vise à être embarquée dans une solution d'acquisition autonome et qui permet, à partir de l'image capturée par une caméra, de calculer ses déplacements nécessaires afin qu'elle suive l'action de jeu pour pouvoir la capter de manière autonome. Le contexte amateur suscitant des complexités spécifiques, nous présentons dans ces parties une nouvelle approche basée sur l'apprentissage automatique et l'apprentissage profond pour calculer ce suivi.