Spatial information and end-to-end learning for visual recognition

Mingyuan Jiu

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Informations spatiales et apprentissage bout-en-bout pour la reconnaissance visuelle

FR |

EN

Auteur / Autrice :	Mingyuan Jiu
Direction :	Atilla Baskurt, Christian Wolf
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 03/04/2014
Etablissement(s) :	Lyon, INSA
Ecole(s) doctorale(s) :	École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'InfoRmatique en Images et Systèmes d'information (Ecully, Rhône ; 2003-....) - Laboratoire d'InfoRmatique en Images et Systèmes d'Information / LIRIS
Jury :	Président / Présidente : Alain Trémeau
	Examinateurs / Examinatrices : Atilla Baskurt, Christian Wolf, Alain Trémeau, Matthieu Cord, Mcihèle Rombaut, Cordelia Schmidt, Graham Taylor
	Rapporteur / Rapporteuse : Matthieu Cord, Mcihèle Rombaut

Mots clés

FR |

EN

Mots clés contrôlés

Réseaux neuronaux (informatique)

Apprentissage automatique

Mots clés libres

Informatique

Intelligence artificielle

Apprentissage automatique

Apprentissage spatial

Apprentissage de bout en bout

Réseaux de neurones à convolution

Reconnaissance d'actions humaines

Segmentation du corps humain

Résumé

FR |

EN

Dans cette thèse nous étudions les algorithmes d'apprentissage automatique pour la reconnaissance visuelle. Un accent particulier est mis sur l'apprentissage automatique de représentations, c.à.d. l'apprentissage automatique d'extracteurs de caractéristiques; nous insistons également sur l'apprentissage conjoint de ces dernières avec le modèle de prédiction des problèmes traités, tels que la reconnaissance d'objets, la reconnaissance d'activités humaines, ou la segmentation d'objets. Dans ce contexte, nous proposons plusieurs contributions : Une première contribution concerne les modèles de type bags of words (BoW), où le dictionnaire est classiquement appris de manière non supervisée et de manière autonome. Nous proposons d'apprendre le dictionnaire de manière supervisée, c.à.d. en intégrant les étiquettes de classes issues de la base d'apprentissage. Pour cela, l'extraction de caractéristiques et la prédiction de la classe sont formulées en un seul modèle global de type réseau de neurones (end-to-end training). Deux algorithmes d'apprentissage différents sont proposés pour ce modèle : le premier est basé sur la retro-propagation du gradient de l'erreur, et le second procède par des mises à jour dans le diagramme de Voronoi calculé dans l'espace des caractéristiques. Une deuxième contribution concerne l'intégration d'informations géométriques dans l'apprentissage supervisé et non-supervisé. Elle se place dans le cadre d'applications nécessitant une segmentation d'un objet en un ensemble de régions avec des relations de voisinage définies a priori. Un exemple est la segmentation du corps humain en parties ou la segmentation d'objets spécifiques. Nous proposons une nouvelle approche intégrant les relations spatiales dans l'algorithme d'apprentissage du modèle de prédication. Contrairement aux méthodes existantes, les relations spatiales sont uniquement utilisées lors de la phase d'apprentissage. Les algorithmes de classification restent inchangés, ce qui permet d'obtenir une amélioration du taux de classification sans augmentation de la complexité de calcul lors de la phase de test. Nous proposons trois algorithmes différents intégrant ce principe dans trois modèles : - l'apprentissage du modèle de prédiction des forêts aléatoires, - l'apprentissage du modèle de prédiction des réseaux de neurones (et de la régression logistique), - l'apprentissage faiblement supervisé de caractéristiques visuelles à l'aide de réseaux de neurones convolutionnels.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Informations spatiales et apprentissage bout-en-bout pour la reconnaissance visuelle

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Informations spatiales et apprentissage bout-en-bout pour la reconnaissance visuelle

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses