Ce travail de thèse se situe à la croisée de trois thématiques de recherche : la mise en place de représentations structurelles pour décrire le contenu d’images de documents, la reconnaissance structurelle des formes et graphiques complexes et la localisation des symboles dans les images de documents. Pour répondre aux problématiques de l’analyse d’images de documents, nous avons choisi d’utiliser les graphes comme outils de représentation des contenus des images. La nouvelle représentation obtenue exploite un graphe multi-primitive et multi-attribut améliorant à la fois la tâche de localisation mais aussi la tâche de reconnaissance de formes graphiques contenues dans les documents. Une nouvelle approche générique et automatique est également présentée pour la localisation des symboles graphiques dans les images de documents. Notre approche de localisation des symboles nécessite un minimum de connaissances a priori sur les domaines ou sur le type de symboles présents dans les images. Concernant l’étape de reconnaissance, nous présentons trois stratégies originales pour la mise en correspondance de graphes, combinant les approches structurelle et statistique. Elles aident à la résolution du problème de complexité et évitent un temps de calcul exponentiel intolérable. Les nouvelles techniques d’appariement de graphes que nous proposons sont basées sur des fonctions de similarité qui tilisent aussi bien des valeurs numériques que symboliques pour produire un score. Ces mesures de similarité ont de nombreuses propriétés intéressantes comme un fort pouvoir discriminant, une invariance aux transformations affines et une faible sensibilité au bruit. / This thesis presents our contributions related to three major research areas in the field of document image analysis i.e., structural representation of documents images, spotting symbols in graphical documents and symbols recognition. We proposed to represent the contents of the document images using multi-attributed graphs, which not only improves the task of symbols spotting, but also the task of symbols recognition. We present a new generic and automatic approach for the purpose of spotting symbols in graphical documents. Our approach to locate symbols requires minimum priori knowledge about the type of document or the type of symbols found in these documents. Concerning symbol recognition we present three new strategies combining structural and statistical approaches. The proposed approaches helped to solve the problem of time and space complexity and offers robustness against noise and distortion present in images. The new graph matching techniques that we are proposing are based on similarity function that uses both numerical and symbolic values of the nodes and edges attributes of the graphs to produce a score of similarity between two graphs. These similarity measures have many interesting properties such as a strong discriminating power, nvariance to affine transformations, and low sensitivity to noise.
Identifer | oai:union.ndltd.org:theses.fr/2008TOUR4001 |
Date | 04 March 2008 |
Creators | Qureshi, Rashid Jalal |
Contributors | Tours, Cardot, Hubert, Ramel, Jean-Yves |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0021 seconds