Spelling suggestions: "subject:"reconnaissance dess forma"" "subject:"reconnaissance dess forms""
1 |
Reconnaissance de forme dans cybersécuritéVashaee, Ali January 2014 (has links)
Résumé : L’expansion des images sur le Web a provoqué le besoin de mettre en œuvre des méthodes de classement d’images précises pour plusieurs applications notamment la cybersécurité. L’extraction des caractéristiques est une étape primordiale dans la procédure du classement des images vu son impact direct sur la performance de la catégorisation finale des images et de leur classement. L’objectif de cette étude est d’analyser l’état de l’art des différents espaces de caractéristiques pour évaluer leur
efficacité dans le contexte de la reconnaissance de forme pour les applications de
cybersécurité. Les expériences ont montré que les descripteurs de caractéristiques
HOG et GIST ont une performance élevée. Par contre, cette dernière se dégrade
face aux transformations géométriques des objets dans les images. Afin d’obtenir
des systèmes de classement d’image plus fiables basés sur ces descripteurs, nous proposons deux méthodes. Dans la première méthode (PrMI) nous nous concentrons
sur l’amélioration de la propriété d’invariance du système de classement par tout
en maintenant la performance du classement. Dans cette méthode, un descripteur
invariant par rapport à la rotation dérivé de HOG est utilisé (RIHOG) dans une technique de recherche "top-down" pour le classement des images. La méthode (PrMI)
proposée donne non seulement une robustesse face aux transformations géométriques des objets, mais aussi une performance élevée similaire à celle de HOG. Elle est aussi efficace en terme de coût de calcul avec une complexité de l’ordre de O(n). Dans la deuxième méthode proposée (PrMII), nous nous focalisons sur la performance du classement en maintenant la propriété d’invariance du système de classement. Les objets sont localisés d’une façon invariante aux changement d’échelle dans l’espace de caractéristiques de covariance par région. Ensuite elles sont décrites avec les descripteurs HOG et GIST. Cette méthode procure une performance de classement meilleure en comparaison avec les méthodes implémentées dans l’étude et quelques méthodes CBIR expérimentées sur les données Caltech-256 dans les travaux antérieurs. // Abstract : The tremendous growth of accessible online images (Web images), provokes the need to perform accurate image ranking for applications like cyber-security. Feature extraction is an important step in image ranking procedures due to its direct impact on final categorization and ranking performance. The goal of this study is to analyse the state of the art feature spaces in order to evaluate their efficiency in the abject recognition context and image ranking framework for cyber-security applications. Experiments show that HOG and GIST feature descriptors exhibit high ranking performance. Whereas, these features are not rotation and scale invariant. In order to obtain more reliable image ranking systems based on these feature spaces, we proposed two methods. In the first method (PrMI) we focused on improving the invariance property of the ranking system while maintaining the ranking performance. In this method, a rotation invariant feature descriptor is derived from HOC (RIHOC). This descriptor is used in a top-down searching technique to caver the scale variation of the abjects in the images. The proposed method (PrMI) not only pro vides robustness against geometrical transformations of objects but also provides high ranking performance close to HOC performance. It is also computationally efficient with complexity around O(n). In the second proposed method (PrMII) we focused on the ranking performance while maintaining the invariance property of the ranking system. Objects are localized in a scale invariant fashion under a Region Covariance feature space, then they are described using HOC and CIST features. Finally to ob tain better evaluation over the performance of proposed method we compare it with existing research in the similar domain(CBIR) on Caltech-256. Proposed methods provide highest ranking performance in comparison with implemented methods in this study, and some of the CBIR methods on Caltech-256 dataset in previous works.
|
2 |
Diagnostic des systèmes à changement de régime de fonctionnementDomlan, Elom Ayih 06 October 2006 (has links) (PDF)
Les systèmes à commutation représentent une classe particulière de systèmes hybrides. Ils sont décrits par plusieurs modèles de fonctionnement et chaque modèle, définissant un mode du système, est actif sous certaines conditions opératoires particulières. Lorsque la loi de commutation régissant le passage d'un modèle de fonctionnement à l'autre est parfaitement connue, il est aisé de manipuler de tels systèmes car le mode actif peut être connu à chaque instant. Par contre, dans la situation où aucune information n'est disponible sur l'évolution de la loi de commutation, il est plus ardu de procéder au diagnostic ou encore de synthétiser une loi de commande sur ces systèmes. Il est abordé ici le problème de la reconnaissance du mode actif sur la base d'observations de l'entrée et de la sortie du système. L'identification des paramètres de la loi de commutation est ensuite étudiée sous l'hypothèse de la connaissance de la structure de la loi de commutation.
|
3 |
Contrainte des modèles génétiques de réservoirs par une approche de reconnaissance statistique de formeChugunova, Tatiana 07 April 2008 (has links) (PDF)
L'objet de cette thèse est la modélisation de l'hétérogénéité souterraine. Pour ce faire, nous avons adapté l'approche de simulation multipoints (MP) qui reproduit et conditionne des formes géométriques complexes fournies par des modèles génétiques non conditionnels. Initialement, l'approche MP n'était applicable que moyennant l'hypothèse d'une certaine stationnarité spatiale de l'hétérogénéité. Pour étendre l'approche MP au cas non stationnaire, deux algorithmes ont paru dans la littérature : le modèle Tau et l'algorithme de classement. Les deux révèlent des artefacts géométriques sans pour autant restituer les contraintes non stationnaires. Dans ce travail, nous avons proposé un nouvel algorithme de simulation MP non stationnaire. Il évite des inconvénients des algorithmes existants et intègre des contraintes spatiales continues. Les résultats expérimentaux montrent aussi que notre algorithme a un domaine d'applicabilité bien plus vaste que ceux existants.
|
4 |
Reconnaissance de forme dans cybersécuritéVashaee, Ali January 2014 (has links)
Résumé : L’expansion des images sur le Web a provoqué le besoin de mettre en œuvre des méthodes de classement d’images précises pour plusieurs applications notamment la cybersécurité. L’extraction des caractéristiques est une étape primordiale dans la procédure du classement des images vu son impact direct sur la performance de la catégorisation finale des images et de leur classement. L’objectif de cette étude est d’analyser l’état de l’art des différents espaces de caractéristiques pour évaluer leur
efficacité dans le contexte de la reconnaissance de forme pour les applications de
cybersécurité. Les expériences ont montré que les descripteurs de caractéristiques
HOG et GIST ont une performance élevée. Par contre, cette dernière se dégrade
face aux transformations géométriques des objets dans les images. Afin d’obtenir
des systèmes de classement d’image plus fiables basés sur ces descripteurs, nous proposons deux méthodes. Dans la première méthode (PrMI) nous nous concentrons
sur l’amélioration de la propriété d’invariance du système de classement par tout
en maintenant la performance du classement. Dans cette méthode, un descripteur
invariant par rapport à la rotation dérivé de HOG est utilisé (RIHOG) dans une technique de recherche "top-down" pour le classement des images. La méthode (PrMI)
proposée donne non seulement une robustesse face aux transformations géométriques des objets, mais aussi une performance élevée similaire à celle de HOG. Elle est aussi efficace en terme de coût de calcul avec une complexité de l’ordre de O(n). Dans la deuxième méthode proposée (PrMII), nous nous focalisons sur la performance du classement en maintenant la propriété d’invariance du système de classement. Les objets sont localisés d’une façon invariante aux changement d’échelle dans l’espace de caractéristiques de covariance par région. Ensuite elles sont décrites avec les descripteurs HOG et GIST. Cette méthode procure une performance de classement meilleure en comparaison avec les méthodes implémentées dans l’étude et quelques méthodes CBIR expérimentées sur les données Caltech-256 dans les travaux antérieurs. // Abstract : The tremendous growth of accessible online images (Web images), provokes the need to perform accurate image ranking for applications like cyber-security. Feature extraction is an important step in image ranking procedures due to its direct impact on final categorization and ranking performance. The goal of this study is to analyse the state of the art feature spaces in order to evaluate their efficiency in the abject recognition context and image ranking framework for cyber-security applications. Experiments show that HOG and GIST feature descriptors exhibit high ranking performance. Whereas, these features are not rotation and scale invariant. In order to obtain more reliable image ranking systems based on these feature spaces, we proposed two methods. In the first method (PrMI) we focused on improving the invariance property of the ranking system while maintaining the ranking performance. In this method, a rotation invariant feature descriptor is derived from HOC (RIHOC). This descriptor is used in a top-down searching technique to caver the scale variation of the abjects in the images. The proposed method (PrMI) not only pro vides robustness against geometrical transformations of objects but also provides high ranking performance close to HOC performance. It is also computationally efficient with complexity around O(n). In the second proposed method (PrMII) we focused on the ranking performance while maintaining the invariance property of the ranking system. Objects are localized in a scale invariant fashion under a Region Covariance feature space, then they are described using HOC and CIST features. Finally to ob tain better evaluation over the performance of proposed method we compare it with existing research in the similar domain(CBIR) on Caltech-256. Proposed methods provide highest ranking performance in comparison with implemented methods in this study, and some of the CBIR methods on Caltech-256 dataset in previous works.
|
5 |
Outils et méthodes pour l'analyse automatique multi-niveaux de tracés manuscrits à caractère géométrique acquis en ligne / Tools and methods for multi level automatic analysis of online handdrawn sketchesRenau-Ferrer, Ney 17 January 2011 (has links)
Cette thèse traite de la problématique de l'analyse automatique de tracés manuscrits réalisés à mains levée, à caractère géométrique et acquis en ligne. Lorsque l'on analyse un tracé en ligne, on peut le faire selon plusieurs angles. Comme pour les tracés hors ligne, on peu s'atteler à reconnaitre la forme produite. Mais le caractère en ligne de l'acquisition permet également d'autres niveaux d'analyse, comme l'analyse de la procédure utilisée par le dessinateur lors de la production de son dessin. Nous avons dans le cadre de ce travail élaboré des outils permettant de telles analyses de la production de tracé. Dans une première partie nous traitons des pré traitements à effectuer sur le tracé afin de pouvoir procéder aux analyses spatio-graphique et procédurale. Ces pré traitements sont le filtrage, la segmentation mixte à base d'arcs de cercles et de segments de droite, la sélection des points d'intérêt ainsi que l'identification de la nature de ces points. La seconde partie concerne l'analyse visuo-spatiale. Nous abordons alors deux aspects: la question de la reconnaissance des formes et celle de l'évaluation automatique de leur qualité. Notre contribution consiste en une méthode de reconnaissance basée sur l'apparence utilisant des descripteurs locaux. La dernière partie traite de l'analyse procédurale. Nous proposons une méthode d'extraction et de modélisation de la procédure mise en œuvre lors du dessin d'une forme. Nous montrons comment en utilisant cette modélisation, nous pouvons non seulement déterminer la procédure favorite d'un utilisateur mais également reconnaitre un dessinateur par l'analyse de sa procédure. / This thesis handles the problem of the automatic analysis of online hand drawn geometric sketches. An online sketch can be analysed according to several points of view. As for offline sketching, we can try to recognize the produced shape. However, online sketching allows other levels of analysis. For example the analysis of the behavior of the drawer during the production of the sketch. In this thesis, we have tried to develop tools allowing a multi level analysis, including both shape and behavior analysis. The first part of our work deals with the pre treatments that must be performed on the sketch in order to allow upper level analysis. Those pre treatments are filtering, mixed segmentation and feature points detection and labelisation. In the second part, we approach shape analysis in two aspects: shape recognition and evaluation. We have developed a appearance based method which use local descriptors to allows both recognition and evaluation of the quality of a produced shape compared to the model . in the last part we propose a method for drawer's behavior extraction and modeling. Then we show how we can not only determine the favorite procedure of a drawer but also recognize the drawer by analyzing his behavior.
|
6 |
L’impact de la stéréoscopie dans la reconnaissance, la perception et la constance de forme 3DAubin, Mercédès 04 1900 (has links)
Les buts des recherches présentées dans cette thèse étaient d’évaluer le rôle de la stéréoscopie dans la reconnaissance de forme, dans la perception du relief et dans la constance de forme.
La première étude a examiné le rôle de la stéréoscopie dans la perception des formes visuelles en utilisant une tâche de reconnaissance de formes. Les stimuli pouvaient être présentés en 2D, avec disparité normale (3D) ou avec disparité inversée. La performance de reconnaissance était meilleure avec les modes de présentation 2D et 3D qu’avec la 3D inversée. Cela indique que la stéréoscopie contribue à la reconnaissance de forme.
La deuxième étude s’est intéressée à la contribution conjointe de l’ombrage et de la stéréoscopie dans la perception du relief des formes. Les stimuli étaient des images d’une forme 3D convexe synthétique présentée sous un point de vue menant à une ambigüité quant à sa convexité. L’illumination pouvait provenir du haut ou du bas et de la gauche ou de la droite, et les stimuli étaient présentés dichoptiquement avec soit de la disparité binoculaire normale, de la disparité inversée ou sans disparité entre les vues. Les participants ont répondu que les formes étaient convexes plus souvent lorsque la lumière provenait du haut que du bas, plus souvent avec la disparité normale qu’en 2D, et plus souvent avec absence de disparité qu’avec disparité inversée. Les effets de direction d’illumination et du mode de présentation étaient additifs, c’est-à-dire qu’ils n’interagissaient pas. Cela indique que l’ombrage et la stéréoscopie contribuent indépendamment à la perception du relief des formes.
La troisième étude a évalué la contribution de la stéréoscopie à la constance de forme, et son interaction avec l’expertise perceptuelle. Elle a utilisé trois tâches de discrimination séquentielle de trombones tordus ayant subi des rotations en profondeur. Les stimuli pouvaient être présentés sans stéréoscopie, avec stéréoscopie normale ou avec stéréoscopie inversée. Dans la première moitié de l’Exp. 1, dans laquelle les variations du mode de présentation étaient intra-sujets, les performances étaient meilleures en 3D qu’en 2D et qu’en 3D inversée. Ces effets ont été renversés dans la seconde moitié de l’expérience, et les coûts de rotation sont devenus plus faibles pour la 2D et la 3D inversée que pour la 3D. Dans les Exps. 2 (variations intra-sujets du mode de présentation, avec un changement de stimuli au milieu de l’expérience) et 3 (variations inter-sujets du mode de présentation), les effets de rotation étaient en tout temps plus faibles avec stéréoscopie qu’avec stéréoscopie inversée et qu’en 2D, et plus faibles avec stéréoscopie inversée que sans stéréoscopie. Ces résultats indiquent que la stéréoscopie contribue à la constance de forme. Toutefois, cela demande qu’elle soit valide avec un niveau minimal de consistance, sinon elle devient stratégiquement ignorée.
En bref, les trois études présentées dans cette thèse ont permis de montrer que la stéréoscopie contribue à la reconnaissance de forme, à la perception du relief et à la constance de forme. De plus, l’ombrage et la stéréoscopie sont intégrés linéairement. / The goals of the researches presented in this thesis were to evaluate the role of stereopsis in shape recognition, in relief perception, and in shape constancy.
The first study examined the role of stereopsis in visual shape perception using a recognition task. The stimuli were presented with null binocular disparity (i.e. 2D), normal binocular disparity (3D) or reversed disparity. Recognition performance was better with 2D and 3D displays than with reversed 3D. This indicates that stereopsis contributes to shape recognition.
The second study examined the joint contribution of shading and stereopsis to the relief perception of shape. The stimuli were the images of a synthetic convex 3D shape seen from viewpoints leading to ambiguity as to its convexity. Illumination either came from above, or below and from the right or the left, and stimuli were presented dichoptically with either normal binocular disparity, reversed disparity, or no disparity between the views presented at each eye. Participants responded “convex” more often when the lighting came from above than from below. Also, participants responded that the shape was convex more often with normal than with zero disparity, and more often with 2D than with reversed stereopsis. The effects of lighting direction and display mode were additive; i.e. they did not interact. This indicates that shading and stereopsis contribute independently to shape perception.
The third study assessed the contribution of stereopsis to shape constancy and how it interacts with perceptual expertise using three sequential matching tasks with bent paperclips rotated in depth. Stimuli were presented without stereopsis, or with normal or reversed stereopsis. In the first half of Exp. 1, where display mode variations were within-subject, the performances were better with stereoscopic displays than with 2D or reversed stereoscopic presentations. In the second half of the experiment, the rotation costs became weaker for the 2D and reversed 3D display modes than for the 3D one. In Exps. 2 (display mode within-subject, with stimuli switched halfway into the experiment) and 3, (display mode between-subjects) the rotation effect was consistently weaker with normal stereo than with either 2D or reversed stereoscopic displays. These experiments also demonstrate an advantage of reversed stereo over 2D presentations. This indicates that stereo may contribute to shape constancy. This, however, requires stereoscopic information to be valid with a minimal degree of consistency. Otherwise, stereo may become strategically ignored.
In a nutshell, the three studies presented in this thesis showed that stereo contributes to shape recognition, relief perception and shape constancy. Furthermore stereopsis and shading are integrated independently.
|
7 |
Contribution à l'interprétation d'images et vérification de la consistance d'un graphe / Contribution to image interpretation and graph consistencyHodé, Yann 12 November 2018 (has links)
Dans cette thèse nous montrons que le raisonnement symbolique associé à la vérification de la consistance d'arc avec propagation de contraintes est un outil efficace pour interpréter les images. Nous montrons dans un premier temps que ce cadre théorique permet de vérifier l'organisation spatiale de différentes composantes d'un objet complexe dans une image. Nous proposons ensuite d'étendre l'utilisation de celui-ci à la reconnaissance sélective des formes décrites par des équations mathématiques, grâce à la notion de consistance d'hyper-arc à deux niveaux de contraintes. La pertinence et la faisabilité de cette approche ont été validées par de multiples tests. En outre, les résultats obtenus sur des images sur-segmentées montrent que la méthode proposée est résistante au bruit, même dans des conditions où les humains (dans certains cas d'agnosie visuelle) peuvent échouer. Ces résultats soutiennent l'intérêt du raisonnement symbolique dans la compréhension de l'image. / In this thesis we show that symbolic reasoning associated with arc consistency checking is an efficient tool for images interpretation. We first show that this theoretical framework makes it possible to verify the spatial organization of different components of a complex object in an image. We then propose to extend the use of this framework to the selective recognition of shapes described by mathematical equations, thanks to the notion of hyper-arc consistency with bi-levels constraint. The relevance and feasibility of this approach have been validated by multiple tests. In addition, the results obtained on over-segmented images show that the proposed method is noise-resistant, even under conditions where humans (in some cases visual agnosia) may fail. These results support the interest of symbolic reasoning in image understanding.
|
8 |
Modèles et Heuristiques pour le traitement spatio-temporel de l'information environnementaleBatton-Hubert, Mireille 04 December 2006 (has links) (PDF)
Ce mémoire a pour objectif de faire le bilan qualitatif et quantitatif de mes activités de recherche depuis ma nomination à l'Ecole nationale supérieure des mines de Saint-Étienne en 1996. La première partie sera consacrée à la pertinence scientifique du concept de la connaissance d'un phénomène continu simultanément dans l'espace et dans le temps dans un Environnement physique et anthropique. Cette problématique de recherche est centrée sur un domaine d'application, l'optimisation et la simulation d'impacts environnementaux. Volontairement elle ne se scinde pas entre le réalisé et le futur. Car les travaux de recherche se déroulent dans un continuum temporel du point de vue des problématiques d'application ou au niveau des avancées historiques. Ce qui impliquerait que les travaux passés sont exhaustifs, et sans amélioration possible. Ce travail est une réflexion approfondie d'une préoccupation commune se déclinant au travers de 2 grands axes de recherche (volet 1 et volet 2) qui débouchent sur une proposition de thématiques de recherche pour les années à venir (volet 3). Les 3 volets sont :<br>- volet 1 : Structuration et Modélisation de l'information spatialisée environnementale - aide à la décision en hydrodynamique et Ressources en eaux<br>- volet 2 : Analyse espace - temps de l'information environnementale<br>- volet 3 : Justification d'heuristique de la composante espace - temps de l'information environnementale Un rapport annexe contient le syllabus:<br>- des activités d'enseignement et de responsabilités diverses assurées,<br>- des thématiques de recherche abordées avec leurs principaux résultats issues :<br> - des activités d'encadrement doctoral<br> - de la réalisation de projets de recherche ( académique et appliquée )<br> - des publications réalisées à ce jour. <br>Ce document est établi en vue de l'obtention de l'Habilitation à Diriger des Recherches.
|
9 |
Apprentissage actif en-ligne d'un classifieur évolutif, application à la reconnaissance de commandes gestuelles / Online active learning of an evolving classifier, application to gesture command recognitionBouillon, Manuel 18 March 2016 (has links)
L'utilisation de commandes gestuelles est une nouvelle méthode d'interaction sur interface tactile. Une bonne méthode pour faciliter la mémorisation de ces commandes gestuelles est de laisser l'utilisateur les personnaliser. Ce contexte applicatif induit une situation d'apprentissage croisé, où l'utilisateur doit mémoriser le jeu de symboles elle système doit apprendre à reconnaître les différents symboles. Cela implique un certain nombre de contraintes, à la fois sur le système de reconnaissance de symboles ct sur le système de supervision de son apprentissage. Il faut par exemple que le classifieur puisse apprendre à partir de peu de données, continuer à apprendre pendant son utilisation et suivre toute évolution des données indéfiniment. Le superviseur doit quant à lui optimiser la coopération entre l'utilisateur et le système de reconnaissance pour minimiser les interactions tout en maximisant l'apprentissage. Cette thèse présente d'une part, le système d'apprentissage évolutif Evolve oo, capable d'apprendre rapidement il partir de peu de données et de suivre les changements de concepts. D'autre part, elle introduit le superviseur actif en-ligne lntuiSup qui permet d'optimiser la coopération entre le système et l'utilisateur, lors de l'utilisation de commandes gestuelles personnalisées notamment Evolve oo est un système d'inférence floue, capable d'apprendre rapidement grâce aux capacités génératrices des prémisses des règles, tout en permettant d'obtenir une précision élevée grâce aux capacités discriminantes des conclusions d'ordre un. L'intégration d'oubli dans le processus d'apprentissage permet de maintenir le gain de l'apprentissage indéfiniment, permettant ainsi l'ajout de classes à n'importe quel moment de l'utilisation du système ct garantissant son évolutivité « à vie». Le superviseur actif en-ligne lntuiSup permet d'optimiser les interactions avec l'utilisateur pour entraîner un système d'apprentissage lorsque l'utilisateur est dans la boucle. Il permet de faire évoluer la proportion de données que l'utilisateur doit étiqueter en fonction de la difficulté du problème et de l'évolution de l'environnement (changements de concepts). L'utilisation d'une méthode de« dopage» de l'apprentissage permet d'optimiser la répartition de ces interactions avec l'utilisateur pour maximiser leur impact sur l'apprentissage. / Using gesture commands is a new way of interacting with touch sensitive interfaces. In order to facilitate user memorization of several commands, it is essential to let the user customize the gestures. This applicative context gives rise to a crosslearning situation, where the user has to memorize the set of commands and the system has to learn and recognize the different gestures. This situation implies several requirements, from the recognizer and from the system that supervizes its learning process. For instance, the recognizer has to be able to learn from few data samples, to keep learning during its use and to follow indefinitely any change of the data now. The supervisor has to optimize the cooperation between the recognizer and the system to minimize user interactions while maximizing recognizer learning. This thesis presents on the one hand the evolving recognition system Evolve oo, that is capable of fast teaming from few data samples, and that follows concept drifts. On the other hand, this thesis also presents the on line active supervisor lntuiSup, that optimizes user-system cooperation when the user is in the training loop, as during customized gesture command use for instance. The evolving classifier Evolve oo is a fuzzy inference system that is fast learning thanks to the generative capacity of rule premises, and at the same time giving high precision thanks to the discriminative capacity of first order rule conclusion. The use of forgetting in the learning process allows to maintain the learning gain indefinitely, enabling class adding at any stage of system learning, and guaranteeing lifelong evolving capacity. The on line active supervisor IntuiSup optimizes user interactions to train a classifier when the user is in the training loop. The proportion of data that is labeled by the user evolves to adapt to problem difficulty and to follow environment evolution (concept drift s). The use of a boosting method optimizes the timing of user interactions to maximize their impact on classifier learning process.
|
10 |
Contributions to a fast and robust object recognition in images / Contributions à une reconnaissance d'objet rapide et robuste en imagesRevaud, Jérôme 27 May 2011 (has links)
Dans cette thèse, nous présentons tout d'abord une contribution visant à pallier ce problème de robustesse pour la reconnaissance d'instances, puis une extension directe de cette contribution à la reconnaissance et la localisation de classes d'objets. Dans un premier temps, nous avons développé une méthode inspiré de l'appariement de graphe (i.e. graph matching) afin de traiter le problème de la reconnaissance rapide d'instances d'objets spécifiques dans des conditions bruitées. Cette méthode permet de rajouter facilement un nombre quelconque d’autres types de caractéristiques locales (e.g. contours, textures…) moins affectées par le bruit tout en contournant le problème de la normalisation et sans pénaliser la vitesse de détection. Nos expériences sur plusieurs bases de test ont montré la pertinence de notre approche. Notre approche est globalement légèrement moins robuste à l'occultation que les approches existantes, mais elle produit des performances supérieures aux approches standard en conditions bruitées. Dans un second temps, nous avons développé une approche pour la détection de classes d'objets dans le même esprit que celui du sac de mots visuels. Pour cela, nous utilisons nos cascades de micro-classifieurs pour reconnaître des mots visuels plus distinctifs que les mots basés simplement sur des points d'intérêts. L'apprentissage se divise en deux parties: dans un premier temps, nous générons des cascades de micro-classifieurs servant à reconnaître des parties locales des images modèles ; puis dans un second temps, nous utilisons un classifieur afin de modéliser la frontière de décision entre les images de classe et celles de non-classe. Nous montrons que l'association de mots classiques (à partir de points d'intérêts) et de nos mots plus distincts produit une amélioration significative des performances pour un temps de calcul assez faible. / In this thesis, we first present a contribution to overcome this problem of robustness for the recognition of object instances, then we straightly extend this contribution to the detection and localization of classes of objects. In a first step, we have developed a method inspired by graph matching to address the problem of fast recognition of instances of specific objects in noisy conditions. This method allows to easily combine any types of local features (eg contours, textures ...) less affected by noise than keypoints, while bypassing the normalization problem and without penalizing too much the detection speed. Unlike other methods based on a global rigid transformation, our approach is robust to complex deformations such as those due to perspective or those non-rigid inherent to the model itself (e.g. a face, a flexible magazine). Our experiments on several datasets have showed the relevance of our approach. It is overall slightly less robust to occlusion than existing approaches, but it produces better performances in noisy conditions. In a second step, we have developed an approach for detecting classes of objects in the same spirit as the bag-of-visual-words model. For this we use our cascaded micro-classifiers to recognize visual words more distinctive than the classical words simply based on visual dictionaries. Training is divided into two parts: First, we generate cascades of micro-classifiers for recognizing local parts of the model pictures and then in a second step, we use a classifier to model the decision boundary between images of class and those of non-class. We show that the association of classical visual words (from keypoints patches) and our disctinctive words results in a significant improvement. The computation time is generally quite low, given the structure of the cascades that minimizes the detection time and the form of the classifier is extremely fast to evaluate.
|
Page generated in 0.0795 seconds