Thèse soutenue

Identification automatique des scripteurs à partir de l'écriture manuscrite par apprentissage machine et analyse d'images

FR  |  
EN
Auteur / Autrice : Abderrazak Chahi
Direction : Yassine RuichekRaja Touahni
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 08/07/2021
Etablissement(s) : Bourgogne Franche-Comté en cotutelle avec Université Ibn Tofail. Faculté des sciences de Kénitra
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Connaissance et Intelligence Artificielle Distribuées (CIAD) (Dijon) - Connaissance et Intelligence Artificielle Distribuées [Dijon] / CIAD
Etablissement de préparation : Université de Franche-Comté (1971-....)
Jury : Président / Présidente : Mohamed Sbihi
Examinateurs / Examinatrices : Yassine Ruichek, Raja Touahni, Mohammed El Hassouni, Denis Hamad, Jean-Christophe Burie
Rapporteurs / Rapporteuses : Mohammed El Hassouni, Denis Hamad

Résumé

FR  |  
EN

L’identification des scripteurs à partir de l’écriture manuscrite constitue un domaine de recherche en pleine expansion. Elle est devenue une thématique de recherche importante avec de nombreux verrous scientifiques/techniques et challenges/potentiels applicatifs, avec un besoin croissant de développement de systèmes biométriques destinés à de nombreuses applications sécuritaires. Les systèmes d'identification automatique des scripteurs (hors ligne) reposent sur des informations statiques. Les représentations numériques se présentent généralement sous la forme d'une image d'écriture manuscrite contenant des motifs récurrents à analyser et à caractériser. L’objectif ici est de développer des approches efficaces et robustes pour l'identification des scripteurs en tirant profit des avancées théoriques et techniques de l'analyse d'images et de l'intelligence artificielle. Cette thèse de doctorat aborde toutes les étapes essentielles d'un processus automatique de l’identification des scripteurs, y comprisla phase de prétraitement, normalisation et segmentation, l’extraction des primitives, et l’étape de classification des scripteurs.Notre première contribution étudie l'identification des scripteurs en fonction des caractéristiques de texture. Nous proposons quatre approches basées sur la texture pour améliorer l’identification des documents de test : (1) le premier système proposé est basé sur la méthode Block Wise Local Binary Count (BWLBC). Il s'agit d'un descripteur d'image local pour caractériser la variabilité du style d'écriture en petits blocs en capturant la distribution des pixels correspondant à l'écriture dans des composantes connexes binaires ; (2) dans la seconde approche, les descripteurs de texture Local Binary Patterns (LBP), Local Ternary Patterns (LTP), and Local Phase Quantization (LPQ) sont appliqués sur des petites régions d'intérêt de l'écriture appelées zones, pour extraire les caractéristiques de texture associées. Les trois descripteurs sont utilisés efficacement dans un nouveau processus d'identification des scripteurs ; (3) la tâche de la caractérisation de l'écriture est améliorée par une approche basée sur le descripteur Cross multi-scale Locally encoded Gradient Patterns (CLGP). La méthode CLGP proposée caractérise les structures locales saillantes des composantes connexes de l'écriture. Elle encode la transformation de texture obtenue à plusieurs échelles en utilisant l'opérateur Histograms of Oriented Gradients (HOG) ; (4) la quatrième approche utilise la méthode LSTP (Local gradient full-scale Transform Patterns) pour calculer des histogrammes locaux de l'orientation du gradient sur des blocs non superposés de l'écriture. Cette caractéristique permet d'obtenir de meilleures performances en capturant des informations plus pertinentes sur la variabilité du style d'écriture. Les réseaux de neurones convolutifs (CNN) sont également étudiés pour améliorer l'identification des scripteurs. Deux approches efficaces basées sur les CNNs, appelées DeepWINet et WriterINet, sont proposées. Des expériences approfondies sont menées sur 10 bases de données manuscrites dans différentes langues (Anglais, Arabe, Français, Allemand, Chinois, Néerlandais, Grec et hybride). Toutes les approches proposées atteignent des performances compétitives ou supérieures à celles de la littérature pour les benchmarks étudiés. Nous avons également participé au concours ICFHR2020 pour récompenser la meilleure approche de « la récupération des fragments manuscrits historiques sur la base de l'identification des scripteurs ». Nous avons proposé une approche basée sur l'apprentissage profond en utilisant des multi-flux CNN entrainés avec différentes données d'entrée. L'approche globale a obtenu d'excellents résultats et a remporté la première place dans l'une des deux catégories de la compétition.