Méthodes pour l'interprétation automatique d'images en milieu urbain
Auteur / Autrice : | Nicolas Hascoët |
Direction : | Titus Bogdan Zaharia |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et télécommunications |
Date : | Soutenance le 27/06/2017 |
Etablissement(s) : | Evry, Institut national des télécommunications |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Université : Université Pierre et Marie Curie (Paris ; 1971-2017) |
Laboratoire : Services répartis- Architectures- MOdélisation- Validation- Administration des Réseaux / SAMOVAR - Département Advanced Research And Techniques For Multidimensional Imaging Systems / ARTEMIS | |
Jury : | Président / Présidente : Catherine Achard |
Examinateurs / Examinatrices : Catherine Achard, Mohamed Daoudi, Mihai Ciuc, Alain Vaucelle | |
Rapporteur / Rapporteuse : Mohamed Daoudi, Mihai Ciuc |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse présente une étude pour l'interprétation automatique d'images en milieu urbain. Nous proposons une application permettant de reconnaître différents monuments au sein d'images représentant des scènes complexes. La problématique principale est ici de différencier l'information locale extraite des points d'intérêt du bâtiment recherché parmi tous les points extraits de l'image. En effet, la particularité d'une image en milieu urbain vient de la nature publique de la scène. L'objet que l'on cherche à identifier est au milieu de divers autres objets pouvant interférer avec ce dernier. Nous présentons dans une première partie un état de l'art des méthodes de reconnaissance d’images en se concentrant sur l'utilisation de points d'intérêts locaux ainsi que des bases de données pouvant être employées lors des phases d'expérimentation. Nous retenons au final le modèle de sac de mots (BOW) appliqué aux descripteurs locaux SIFT (Scale-Invariant Feature Transform). Dans un second temps nous proposons une approche de classification des données locales faisant intervenir le modèle de machine à vecteurs de support (SVM). L'intérêt présenté dans cette approche proposée est le faible nombre de données requises lors de la phase d'entraînement des modèles. Différentes stratégies d'entraînement et de classification sont exposées ici. Une troisième partie suggère l'ajout d'une correction géométrique de la classification obtenue précédemment. Nous obtenons ainsi une classification non seulement de l'information locale mais aussi visuelle permettant ainsi une cohérence géométrique de la distribution des points d'intérêt. Enfin, un dernier chapitre présente les résultats expérimentaux obtenus, notamment sur des bâtiments de Paris et d'Oxford