Thèse soutenue

Segmentation des lèvres par un modèle déformable analytique

FR  |  
EN
Auteur / Autrice : Nicolas Eveno
Direction : Pierre-Yves Coulon
Type : Thèse de doctorat
Discipline(s) : Signal, image, parole, télécoms
Date : Soutenance en 2003
Etablissement(s) : Grenoble INPG
Partenaire(s) de recherche : Laboratoire : Laboratoire des images et des signaux (Grenoble1998-2007)

Résumé

FR

La segmentation des lèvres est une étape essentielle pour de nombreux systèmes multi-média tels que la vidéoconférence, la lecture labiale ou les systèmes de communication bas débit. Au cours de cette thèse, nous avons développé un algorithme quasi automatique, précis et robuste de segmentation de lèvres dans des séquences vidéo. Dans un premier temps, le contour supérieur de la bouche ainsi que plusieurs points caractéristiques sont détectés dans l'image initiale en utilisant un nouveau type de contour actif nommé "jumping snake". Contrairement aux snakes classiques, le jumping snake est peu sensible à l'initialisation et la détermination de ses paramètres est simple et intuitive. Pour la segmentation proprement dite, nous introduisons un modèle analytique très flexible composé de quelques cubiques. L'intérêt de ce modèle réside avant tout dans sa grande flexibilité qui permet de rendre compte de manière réaliste des diverses formes possibles pour la bouche. Dans les images suivantes, la segmentation est réalisée en utilisant un suivi temporel des points caractéristiques et des paramètres du modèle. De plus, nous proposons un algorithme de recalage permettant de compenser efficacement les erreurs de suivi. Finalement, nous montrons que notre algorithme permet de suivre les points caractéristiques avec une précision comparable à celle d'une saisie manuelle.