Conception en vue d'une réalisation d'un système de vision tridimensionnel
Auteur / Autrice : | Mahmoud Meribout |
Direction : | Kun-Mean Hou |
Type : | Thèse de doctorat |
Discipline(s) : | Contrôle des systèmes |
Date : | Soutenance en 1995 |
Etablissement(s) : | Compiègne |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Compiègne) |
Résumé
Le développement de la technologie VLSIi a considérablement amélioré la puissance de calcul des machines inintelligentes, permettant le traitement des applications complexes avec un faible coût. Néanmoins, malgré les grands succès connus dans beaucoup de domaines, les problèmes de vision sont souvent mal définis, mal posés ou consomment un temps de calcul non négligeable. Ceci a pour effet de contraindre les concepteurs de limiter le domaine d'application : solution pouvant être inefficace dans le cas ou de nouveaux algorithmes plus performants apparaissent. Le but des travaux présentés dans le cadre de cette thèse consiste à étudier et à mettre en oeuvre un système de perception réalisant plusieurs algorithmes de vision, tels que la détection des contours et l'estimation de mouvements en temps réel, compression-décompression rapide des images, etc. La robustesse de notre système de vision réside en sa flexibilité, sa reconfigurabilité, son extensibilité, et sa modularité. Le principe de conception de notre architecture est basé selon les besoins en termes de communication, de puissance de calcul, de flux de données d'entrées et de stockage pour chacun des trois niveaux de traitement. A cet effet, un bus image matériel a été mis au point reliant toutes les sources possibles d'images que sont : - Un module d'acquisition et de compression-décompression vidéo en norme JPEG, - Un module de traitement bas niveau temps réel, reconfigurable dynamiquement et réalisant des opérateurs de traitement d'images câblés, en téléchargeant les programmes compilés en VHDL sur le composant FPGA, - Un module de traitement haut niveau et niveau intermédiaire base sur le TMS320c40. L'avantage de notre architecture est sa reconfigurabilité pour les trois niveaux de traitement : un module à base de composants FPGA pour le traitement bas niveau, et un réseau d'interconnexion dynamiquement reconfigurable pour le traitement haut niveau et niveau intermédiaire. Ceci nous permet de considérer notre système de vision comme une plate forme pour tester les performances de nouveaux algorithmes de traitement d'image. Comme exemple d'application, un algorithme de reconstruction 3D des objets polyédriques, basé sur la méthode géométrique a été implémenté. Les résultats obtenus montrent la puissance de l'architecture proposée.