Une approche generative neuro-markovienne du traitement de sequences d'images : application a la reconnaissance statique et dynamique des gestes de la main
Auteur / Autrice : | Sébastien Marcel |
Direction : | Christian Roux |
Type : | Thèse de doctorat |
Discipline(s) : | Traitement du signal et télécommunications |
Date : | Soutenance en 2000 |
Etablissement(s) : | Rennes 1 |
Résumé
La detection et l'analyse des personnes est un probleme fondamental en vision par ordinateur et plus specifiquement dans la conception des interfaces gestuelles. Les interfaces gestuelles basees sur l'image constituent la voie la plus naturelle pour la construction d'interfaces homme-machine evoluees. Ainsi, les machines seraient plus faciles a utiliser en associant la commande gestuelle a la commande vocale. Cette these a pour ambition de presenter des techniques d'apprentissage statistique pour la reconnaissance des gestes de la main, et plus generalement pour le traitement d'images fixes et de sequences d'images animees. En effet, il est necessaire de distinguer deux aspects des gestes de la main : ̱l'aspect statique est caracterise par une posture de la main dans une image, ̱l'aspect dynamique est defini soit par la trajectoire de la main, soit par l'enchainement de postures de la main dans une sequence d'images. Les techniques d'apprentissage proposees se basent sur une approche generative des reseaux de neurones artificiels (rn) et des chaines de markov cachees (hmm). L'approche generative se fonde sur la modelisation de la distribution de probabilite des exemples. L'evaluation de la distance entre une observation inconnue et cette distribution, permet de decider si cette observation est un exemple ou n'en est pas un. D'un cote, les rn sont tres efficaces pour des taches de reconnaissance de formes, mais sont mal adaptes a la reconnaissance de donnees de nature temporelle. Nous montrons l'utilisation d'un modele generatif de rn pour la reconnaissance statique des postures de la main dans des images. D'un autre cote, les hmm sont bien adaptees a la modelisation des sequences de donnees temporelles, mais ne permettent