Analyse non intrusive du geste sportif dans des vidéos par apprentissage automatique
Auteur / Autrice : | Jordan Calandre |
Direction : | Laurent Mascarilla, Renaud Péteri |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, image et signal |
Date : | Soutenance le 29/09/2022 |
Etablissement(s) : | La Rochelle |
Ecole(s) doctorale(s) : | École doctorale Euclide (La Rochelle ; 2018-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Mathématiques, Image et Applications (La Rochelle) |
Jury : | Président / Présidente : Chaabane Djeraba |
Examinateurs / Examinatrices : Laurent Mascarilla, Renaud Péteri, Chaabane Djeraba, Philippe Carré, Catherine Choquet, Jenny Benois Pineau | |
Rapporteurs / Rapporteuses : Chaabane Djeraba, Philippe Carré |
Mots clés
Mots clés contrôlés
Résumé
Dans cette thèse, nous nous intéressons à la caractérisation et à l’analyse fine de gestes sportifs dans des vidéos, et plus particulièrement à l’analyse non-intrusive 3D en vision mono caméra. Notre cas d’étude est le tennis de table. Nous proposons une méthode de reconstruction des positions 3D des balles en utilisant une caméra rapide (240 fps) calibrée. Pour cela, nous définissons et entraînons un réseau convolutif qui permet d’extraire des images le diamètre apparent de la balle. La connaissance du diamètre réel de la balle permet de calculer la distance caméra/balle puis de positionner cette dernière dans un repère 3D lié à la table. Ensuite, nous utilisons un modèle physique, prenant en compte l’effet Magnus, pour estimer les paramètres cinématiques de la balle à partir de ses positions 3D successives. La méthode proposée segmente les trajectoires à partir des impacts de la balle sur la table ou la raquette, ce qui permet, en utilisant un modèle physique de rebond, d’affiner les estimations des paramètres cinématiques de la balle puis de calculer la vitesse et l’angle de la raquette lors de la frappe et d’en déduire des indicateurs de performance pertinents. Deux bases de données ont été construites : la première est constituée d’acquisitions de séquences réelles de jeu et la seconde, synthétique, reproduit les conditions d'acquisition de la première et permet de valider nos méthodes, les paramètres physiques utilisés pour la générer étant connus. Enfin, nous présentons notre participation à la tâche Sport\&Vision du challenge MediaEval sur la classification d'actions humaines, par des approches basées sur l'analyse et la représentation du mouvement.