Spelling suggestions: "subject:"anda reconnaissance"" "subject:"anda meconnaissance""
451 |
Learning to Recognize Actions with Weak Supervision / Reconnaissance d'actions de manière faiblement superviséeChesneau, Nicolas 23 February 2018 (has links)
L'accroissement rapide des données numériques vidéographiques fait de la compréhension automatiquedes vidéos un enjeu de plus en plus important. Comprendre de manière automatique une vidéo recouvrede nombreuses applications, parmi lesquelles l'analyse du contenu vidéo sur le web, les véhicules autonomes,les interfaces homme-machine. Cette thèse présente des contributions dans deux problèmes majeurs pourla compréhension automatique des vidéos : la détection d'actions supervisée par des données web, et la localisation d'actions humaines.La détection d'actions supervisées par des données web a pour objectif d'apprendre à reconnaître des actions dans des contenus vidéos sur Internet, sans aucune autre supervision. Nous proposons une approche originaledans ce contexte, qui s'appuie sur la synergie entre les données visuelles (les vidéos) et leur description textuelle associée, et ce dans le but d'apprendre des classifieurs pour les événements sans aucune supervision. Plus précisément, nous télechargeons dans un premier temps une base de données vidéos à partir de requêtes construites automatiquement en s'appuyant sur la description textuelle des événéments, puis nous enlevons les vidéos téléchargées pour un événement, et dans laquelle celui-ci n'apparaït pas. Enfin, un classifieur est appris pour chaque événement. Nous montrons l'importance des deux étapes principales, c'est-à-dire la créations des requêtes et l'étape de suppression des vidéos, par des résutatsquantitatifs. Notre approche est évaluée dans des conditions difficiles, où aucune annotation manuelle n'est disponible, dénotées EK0 dans les challenges TrecVid. Nous obtenons l'état de l'art sur les bases de donnéesMED 2011 et 2013.Dans la seconde partie de notre thèse, nous nous concentrons sur la localisation des actions humaines, ce qui implique de reconnaïtre à la fois les actions se déroulant dans la vidéo, comme par exemple "boire" ou "téléphoner", et leur étendues spatio-temporelles. Nous proposons une nouvelle méthode centrée sur la personne, traquant celle-ci dans les vidéos pour en extraire des tubes encadrant le corps entier, même en cas d'occultations ou dissimulations partielles. Deux raisons motivent notre approche. La première est qu'elle permet de gérer les occultations et les changements de points de vue de la caméra durant l'étape de localisation des personnes, car celle-ci estime la position du corps entier à chaque frame. La seconde est que notre approche fournit une meilleure grille de référence que les tubes humains standards (c'est-à-dire les tubes qui n'encadrent que les parties visibles) pour extraire de l'information sur l'action. Le coeur de notre méthode est un réseau de neurones convolutionnel qui apprend à générer des propositions de parties du corps humain. Notre algorithme de tracking connecte les détections temporellement pour extraire des tubes encadrant le corps entier. Nous évaluons notre nouvelle méthode d'extraction de tubes sur une base de données difficile, DALY, et atteignons l'état de l'art. / With the rapid growth of digital video content, automaticvideo understanding has become an increasingly important task. Video understanding spansseveral applications such as web-video content analysis, autonomous vehicles, human-machine interfaces (eg, Kinect). This thesismakes contributions addressing two major problems in video understanding:webly-supervised action detection and human action localization.Webly-supervised action recognition aims to learn actions from video content on the internet, with no additional supervision. We propose a novel approach in this context, which leverages thesynergy between visual video data and the associated textual metadata, to learnevent classifiers with no manual annotations. Specifically, we first collect avideo dataset with queries constructed automatically from textual descriptionof events, prune irrelevant videos with text and video data, and then learn thecorresponding event classifiers. We show the importance of both the main steps of our method, ie,query generation and data pruning, with quantitative results. We evaluate this approach in the challengingsetting where no manually annotated training set is available, i.e., EK0 in theTrecVid challenge, and show state-of-the-art results on MED 2011 and 2013datasets.In the second part of the thesis, we focus on human action localization, which involves recognizing actions that occur in a video, such as ``drinking'' or ``phoning'', as well as their spatial andtemporal extent. We propose a new person-centric framework for action localization that trackspeople in videos and extracts full-body human tubes, i.e., spatio-temporalregions localizing actions, even in the case of occlusions or truncations.The motivation is two-fold. First, it allows us to handle occlusions and camera viewpoint changes when localizing people, as it infers full-body localization. Second, it provides a better reference grid for extracting action information than standard human tubes, ie, tubes which frame visible parts only.This is achieved by training a novel human part detector that scores visibleparts while regressing full-body bounding boxes, even when they lie outside the frame. The core of our method is aconvolutional neural network which learns part proposals specific to certainbody parts. These are then combined to detect people robustly in each frame.Our tracking algorithm connects the image detections temporally to extractfull-body human tubes. We evaluate our new tube extraction method on a recentchallenging dataset, DALY, showing state-of-the-art results.
|
452 |
L’impact du lien réciproque responsable d’équipe-joueurs dans les pratiques sportives estudiantines de compétition de niveau académique en Lorraine : une illustration par le volley-ball / The Impact of the reciprocal link between the person in charge of a team and players in the students’ sports practice of Academic championship in Lorraine : an example with volley ballBart, Marion 27 November 2014 (has links)
Quelles particularités les liens entre un responsable d’équipe et ses joueurs ont-ils ? Mais d’abord, peut-on définir précisément les rôles du responsable d’équipe ? Tout étudiant peut-il prétendre à ce statut ? Que sait-on des attentes de ces joueuses et joueurs qui intègrent une équipe FF Sport U ? Telles sont les questions à partir desquelles j’ai entrepris ce travail de thèse.C’est au croisement de multiples sources gravitant autour de la thématique du sport et de l’équipe sportive que j’ai cherché des réponses. Entre les Sciences de l’Éducation et la Sociologie, parfois au cœur de l’Histoire, la Psychologie n’étant jamais bien loin, j’ai choisi un corpus que j’ai voulu interdisciplinaire car le sujet est éminemment transdisciplinaire.L’étude s’intéresse au pouvoir, à l’impact du lien entre le responsable d’équipe et ses joueurs, d’un point de vue individuel comme collectif sur les pratiques estudiantines de compétition à l’Université, au niveau Régional. Qu’est-ce qui se joue dans cette relation ? Quels sont potentiellement les autres leviers d’influence de ce lien ? Comment comprendre l’environnement et les enjeux à le maîtriser ? Quand devient-on légitime dans un rôle de leader ?Pour répondre à ces questions, j’ai multiplié les éclairages sur les concepts et les notions évidentes et sous-jacentes que sous-entendent ces questions, en essayant de mettre en avant les enjeux sociaux liés à chacune des échelles d’analyse. Mais cela toujours en regard de l’environnement étudié : la pratique sportive universitaire de compétition car, de cet environnement spécifique, découle une organisation, un fonctionnement particulier, différent des autres modes de pratique.Ainsi, cette recherche présente en premier lieu les caractéristiques spécifiques de cet environnement (rôles et missions des institutions présentes en Lorraine, des organismes, des entités etc.). Pour revenir sur la dimension autobiographique de mon investissement dans ce travail de thèse. En effet, cette réflexion poursuivie année après année a généré une immersion progressive et stratifiée de mes engagements et responsabilités dans le domaine en question. Cette position de praticienne-réflexive a évidemment eu une influence sur les orientations de mes questionnements et donc sur la direction qu’a prise cette recherche.Ensuite, après avoir défini ce que j’entends par « pratique sportive » et recherché les multiples caractéristiques propres à l’individu ayant le statut d’étudiant, j’aborde la dimension historique de la question du lien entre Sport et Éducation. J’ai ensuite défini les principales notions et concepts utilisés pour cette étude. Je poursuis avec la dimension méthodologique de la recherche, suivie des résultats qui ont émergé durant ce premier travail. Pour finir, je formule différentes propositions de définitions, de projets, d’actions qui, pour moi, sont pertinents au regard de l’étude réalisée. En effet, qu’est-ce qu’un responsable d’équipe finalement ? À quelles attentes est-il confronté ? Quelle est sa place dans l’environnement sportif estudiantin ? Comment peut-il évoluer ? Quelles sont ses compétences spécifiques ? Comment l’accompagner ? Voilà un ensemble de questions pour lesquelles j’ai tenté de formuler des réponses, notamment en créant un weekend de formation, testé en Septembre 2013. J’apporte, avant de conclure sur ce travail de thèse, des suggestions de partenariats pour développer l’accompagnement des responsables d’équipe avec les acteurs du sport en Lorraine et, au niveau national, avec la FF Sport U / What characterizes the links between a person in charge of team and his/her players? First of all, can one precisely define the roles of the person in charge of a team? Can any student claim this status? What does one know about these players’ expectations when they integrate a “French Federation of University Sport” team? Such are the questions from which I undertook this work of thesis.I sought answers to these questions among various sources related to the themes of sports and sports team. Between Education, Sociology, sometimes History, or even Psychology not being never well far, I chose an interdisciplinary corpus because the subject is eminently transdisciplinary.The study focuses on the power and the impact of the link between the person in charge of a team and his/her players, on the students’ practice in university sport championship, at a regional level from an individual or a collective point of view. What is at stake in this relation? What are the other potential levers of influence of this link? How to understand the environment and the challenges to control it? When does one become legitimate in a role of leader?To answer these questions, I shed light on the concepts and the basic and subjacent notions which these questions imply, while trying to underline the social challenges related to each scale of analysis. That is nonetheless always compared to the studied environment - the Sport academic competition – because this specific environment, requires an organization and a particular operation that is different from the other patterns of practice.Thus, this research initially shows the specific characteristics of this environment (the roles and missions of the institutions of Lorraine, the organizations, entities etc). Then, I reconsider the autobiographical dimension of my investment in this work of thesis. Indeed, this reflection over the years generated a progressive and laminated immersion of my commitments and responsibilities in this field. This position of expert-reflective obviously had an influence on the orientations of my questionings and thus on my research.Then, after having defined what I mean by “sporting practice” and searched the multiple characteristics specific to the person having the student status I approach the historical dimension of the link between Sport and Education. I then defined the principal concepts used for this study. I continue with the methodological dimension of the research - The following part of my work mentions collected data analyses and it is followed by the results which emerged during this first work. After the presentation of these crucial factors of research, I formulate different definitions, projects and actions which, for me, are relevant in regard to the study carried out. Indeed, what is a person in charge of team? With which expectations is he confronted? What is its place in the student's sporting environment? How can he/she evolve? Which are his/her specific skills? How to help him/her? Here are a set of questions for which I tried to formulate answers, in particular by creating a training session over a weekend, tested in September 2013. Before concluding on this work, I bring some suggestions of partnerships to develop the accompaniment of the people in charge of teams with the actors of Sport in Lorraine and, at the national level, with the French Federation of University Sport.This field study that I intended accessible, objective and reliable is reinforced by my precise knowledge of its context (eight years of associative experiments of which the responsibility for a female team of volley ball), which allowed a precise comprehension of the challenges in various scales. Daily observations, “off” conversations, combined with the analysis of problems encountered over the years in the performance of my duty of person in charge of a team, generated this motivation to theorize, to understand, then to act on this environment
|
453 |
Cultural Parameters for "Man On the Loop" Paradigm in the context of Intelligence, Surveillance, and ReconnaissanceTuli, Gaurav Yash Pal 01 January 2008 (has links)
Social reasoning and norms of a group of individuals that share a set of cultural traits are largely fashioned by those traits. We explored a few predominant sociological, cultural traits and developed a methodology for parametrically adjusting them. This exploratory study shows promise toward a capability to deliberately tune cultural group traits in order to produce desired group behavior. In order to validate our methodology, we implemented a prototypical agent based simulated intelligence, surveillance, and reconnaissance scenario. In this simulation, a group of simulated agents traverse a hostile territory while a user adjusts cultural group trait values. The group and individual utilities are dynamically observed against values of selected cultural traits. Uncertainty avoidance index and individualism are the cultural traits we explored in depth. Upon user's training of the correspondence between cultural values and system utilities, the user is able to deliberately produce desired system utilities by issuing changes to trait values. Appropriateness of specific cultural values is not universal but determined by the domain and scenarios. This work heralds a path for control of large systems via parametric cultural adjustments.
|
454 |
Le petit monde du développement porté par les migrants : une sociologie de la reconnaissance des « associations de migrants » dans les arènes françaises de la coopération au développement (1981-2014) / The small world of migrant-led development : a sociology of "migrant associations" recognition process in the french cooperation for development arenas (1981–2014)Vincent, Claire 03 July 2018 (has links)
En croisant analyses d’archives, entretiens et observations ethnographiques, cette thèse fait le récit du processus de reconnaissance des associations de développement auto ou hétéro-désignées comme « de migrants » depuis 1981. Elle retrace dans un premier temps les étapes de l’élaboration, de l’expression, puis de l’audition d’une demande de reconnaissance et de participation aux arènes de la coopération française. Elle examine ensuite les conditions de la prise en main par une alliance institutionnelle et militante d’un nouveau problème public. Un cadre nouveau, celui du « développement porté par les migrants » prend place dans les arènes de la coopération dès 2002. Il se traduit par la fixation d’une grammaire de reconnaissance, de dispositifs d’appui, l’invention d’une nouvelle catégorie d’acteurs - les « OSIM » - et la création d’acteurs collectifs dédiés à leur représentation. Les luttes pour l’institutionnalisation de ce nouveau cadre sont analysées. Face à des logiques globales, nationales et locales hétéronomes, il négocie son autonomie en misant sur la décentralisation et l’adoption des normes technicienne et apolitiques dominantes. Enfin, ce travail analyse les conditions d’une parité de participation des associations de migrants aux arènes translocales de la coopération. En déconstruisant deux évidences politiques, militantes et savantes du « développement porté par les migrants » de l’action « locale » et du « lien communautaire », ce travail explore les rapports inégalitaires et ethnicisants dans les arènes de la coopération française et rend compte d’un « petit monde » caractérisé par un ordre de reconnaissance ambiguë et peu visible. / Drawing on interviews, archives and ethnographic studies in Lyon, Lille, Paris and in Benin, this work studies the recognition process of organisations self-identified or assigned as migrant since 1981. First, it retraces the steps of the building, expressing and hearing of a request for recognition and participation in French cooperation arenas. Then it examines how an alliance of public officers and activists take charge of what is considered as a new public problem. A new frame promoting the ‘Migrant-led Development’ is elaborated in 2002. It if composed of a new recognition grammar, new public programmes, the invention of a new institutional category – the Migrant Organisations for International Solidarity ‘OSIM’ – and collectives dedicated to their representation. After that, the struggling process for the institutionalisation of this new frame is considered. It faces strong global, national and local heteronomous forces and tries to negotiate its autonomy and its stability through decentralisation and adoption of global technical and apolitical development norms. Finally, this work studies the conditions for participation parity for migrant associations into translocal arenas. Deconstructing the political, activistic and academic commonplace of ‘local’ and ‘community’ action for migrant associations, this work explores the unequal and ethnicised relations in cooperation for development arenas and reveals a ‘small world’ characterised by an ambiguous and almost invisible recognition order.
|
455 |
La condamnation symbolique / The symbolic condemnationBrunie, Juliette 05 April 2017 (has links)
Malgré une référence expresse faite à la condamnation symbolique par le législateur, cette notion demeure méconnue en droit français. Pouvant être définie comme une décision rendue par une autorité ayant pouvoir de juridiction prononçant, à l'égard d'un individu ou d'un acte, une sanction morale dépourvue d'incidences matérielles réelles exprimant la reconnaissance de la violation d'un droit ou du Droit imputable à cet individu ou à cet acte, la condamnation symbolique est présente de manière diffuse dans le droit français : droit civil, droit administratif et droit pénal. Si les dommages et intérêts symboliques en sont l'illustration la plus évidente, ils n'en sont pas la seule. Annulations dans l'intérêt de la loi, exemptions légale et judiciaire de peine, admonestation … sont aussi des condamnations symboliques. L'étude de l'ensemble de ces illustrations a permis de constater que toutes les condamnations symboliques ne sont pas guidées par la même logique. Quand certaines peuvent être qualifiées de normatives, d'autres sont recognitives ou mitigatives. / Despite a reference do to the symbolic condemnation by the lawmaker, this notion remains unknown in French law. It can be defined as a decision taken by an authority having jurisidiction power pronouncing, towards a person or an act, a moral sanction without material impact expressing the recognition of a right or rule of law's violation accountable to this person or act, the symbolic condemnation is present diffusely in French law : civil law, administrative law and criminal law. If nominal damages are the more obvious illustration, it's not the only. Cancellations in interest of law, absolute discharge, reprimand… are also symbolic condemnation. The study of all of these illustrations has enabled to notice that all the symbolics condemnation are not guided by the same logical. When some can be qualified as normatives, others are recognitives or mitigatives.
|
456 |
Recherche de motifs dans des images : apport des graphes plans / Searching for patterns in images : what plane graphs can bringSamuel, Emilie 06 June 2011 (has links)
La reconnaissance de formes s'intéresse à la détection automatique de motifs dans des données d'entrée, afin de pouvoir, par exemple, les classer en catégories. La matière première de ces techniques est bien souvent l'image numérique. Cette dernière, dans sa forme la plus courante, est codée sous la forme d'une matrice de pixels. Néanmoins, la question du développement de représentations plus riches se pose. Ainsi, la structuration de l'information contenue dans l'image devrait permettre la mise en évidence des différents objets représentés, et des liens les unissant. C'est pourquoi nous proposons de modéliser les images numériques sous forme de graphes, pour leur richesse et expressivité d'une part, et pour exploiter les résultats de la théorie des graphes en reconnaissance de formes d'autre part. Nous développons pour cela une méthode d'extraction de graphes plans à partir d'images, basée sur le respect de la sémantique. Nous montrons que nous pouvons, étant donné un graphe, reconstruire avec perte limitée l'image d'origine. Par la suite, nous introduisons les graphes plans à trous, graphes dont les faces peuvent être visibles ou invisibles. Leur justification trouve sa place dans la recherche de motifs notamment, pour laquelle les éléments constituant l'arrière-plan d'une image ne doivent pas être retrouvés. En dirigeant notre attention sur la planarité de ces graphes, nous proposons des algorithmes polynomiaux d'isomorphisme de graphes plans et de motifs ; nous traitons également leur équivalence, qui se trouve être un isomorphisme aux faces invisibles près / Pattern recognition deals with automatically detecting patterns in input values, so as to, for example, classify them into categories. Digital images often constitute the raw material for these applications. The term digital images usually refers to bitmap images, i. e. images represented as matrices of pixels. However, alternative representations can be considered. Thus, structuring the information contained in the image should underline the different objects depected in the image, as well as the links existing between them. This is the reason why we propose to use graph-based representations. Indeed, on the one hand, graphs are complex data structures with important expressive power and, on the other hand, we should benefit from graphs theory result and apply them to pattern recognition tasks. To this extent, we develop a method for extracting semantically well- founded plane graphs from images. We show that it is possible to rebuild the original image from this kind of graphs, with limited loss. Furthermore, we introduce open plane graphs, i. e. graphs whose faces can be visible or invisible. These graphs are useful in pattern recognition, when it is needed to search for patterns independently of the background. Focusing on the planarity of these graphs, we propose polynomial algorithms for plane graphs isomorphism and subgraphs isomorphism. We also address the equivalence issue, which is an isomorphism variant not taking into account visible faces
|
457 |
Non-rigid image alignment for object recognition / Alignement élastique d’images pour la reconnaissance d’objetDuchenne, Olivier 29 November 2012 (has links)
La vision permet aux animaux de recueillir une information riche et détaillée sur leur environnent proche ou lointain. Les machines ont aussi accès à cette information riche via leurs caméras. Mais, elles n'ont pas encore le logiciel adéquat leur permettant de la traiter pour transformer les valeurs brutes des pixels de l'image en information plus utile telle que la nature, la position, et la fonction des objets environnants. Voilà une des raisons pour laquelle il leur est difficile de se mouvoir dans un environnement inconnu, et d'interagir avec les humains ou du matériel dans des scénarios non-planifiés. Cependant, la conception de ce logiciel comporte de multiples défis. Parmi ceux-ci, il est difficile de comparer deux images entre elles, par exemple, afin que la machine puisse reconnaître que ce qu'elle voit est similaire à une image qu'elle a déjà vue et identifiée. Une des raisons de cette difficulté est que la machine ne sait pas, a priori, quelles parties des deux images se correspondent, et ne sait donc pas quoi comparer avec quoi. Cette thèse s'attaque à ce problème et propose une série d'algorithmes permettant de trouver les parties correspondantes entre plusieurs images, ou en d'autre terme d'aligner les images. La première méthode proposée permet d'apparier ces parties de manière cohérente en prenant en compte les interactions entre plus de deux d'entre elles. Le deuxième algorithme proposé applique avec succès une méthode d'alignement pour déterminer la catégorie d'un objet centré dans une image. Le troisième est optimisé pour la vitesse et tente de détecter un objet d'une catégorie donné où qu'il soit dans l'image. / Seeing allows animals and people alike to gather information from a distance, often with high spatial and temporal resolution. Machines have access to this rich pool of information thanks to their cameras. But, they still do not have the software to process it, in order to transform the raw pixel values into useful information such as nature, position, and function of the surrounding objects. That is one of the reasons why it is still difficult for them to naviguate in an unknown environment and interract with people and objects in an un-planned fashion. However, the design of such a software implies many challenges. Among them, it is hard to compare two images, for insance, in order to recognize that the seen image is similar to another which has been previously seen and identified. One of the difficulties here is that the software cannot know --a priori-- which parts of the two images match. So, it cannot know which parts it should compare. This thesis tackles that problem, and presents a set of algorithm to find correspondences in images, or in other words, to align them. The first proposed method match parts in images, in a coherent fachion, taking into account higher order interactions between more than to of them. The second proposed algorithm apply with success alignment technique to discover the category of an object centered in an image. The third one is optimized for speed and try to detect objects of a given category, which can be anywhere in an image.
|
458 |
Outils et méthodes pour l'analyse automatique multi-niveaux de tracés manuscrits à caractère géométrique acquis en ligne / Tools and methods for multi level automatic analysis of online handdrawn sketchesRenau-Ferrer, Ney 17 January 2011 (has links)
Cette thèse traite de la problématique de l'analyse automatique de tracés manuscrits réalisés à mains levée, à caractère géométrique et acquis en ligne. Lorsque l'on analyse un tracé en ligne, on peut le faire selon plusieurs angles. Comme pour les tracés hors ligne, on peu s'atteler à reconnaitre la forme produite. Mais le caractère en ligne de l'acquisition permet également d'autres niveaux d'analyse, comme l'analyse de la procédure utilisée par le dessinateur lors de la production de son dessin. Nous avons dans le cadre de ce travail élaboré des outils permettant de telles analyses de la production de tracé. Dans une première partie nous traitons des pré traitements à effectuer sur le tracé afin de pouvoir procéder aux analyses spatio-graphique et procédurale. Ces pré traitements sont le filtrage, la segmentation mixte à base d'arcs de cercles et de segments de droite, la sélection des points d'intérêt ainsi que l'identification de la nature de ces points. La seconde partie concerne l'analyse visuo-spatiale. Nous abordons alors deux aspects: la question de la reconnaissance des formes et celle de l'évaluation automatique de leur qualité. Notre contribution consiste en une méthode de reconnaissance basée sur l'apparence utilisant des descripteurs locaux. La dernière partie traite de l'analyse procédurale. Nous proposons une méthode d'extraction et de modélisation de la procédure mise en œuvre lors du dessin d'une forme. Nous montrons comment en utilisant cette modélisation, nous pouvons non seulement déterminer la procédure favorite d'un utilisateur mais également reconnaitre un dessinateur par l'analyse de sa procédure. / This thesis handles the problem of the automatic analysis of online hand drawn geometric sketches. An online sketch can be analysed according to several points of view. As for offline sketching, we can try to recognize the produced shape. However, online sketching allows other levels of analysis. For example the analysis of the behavior of the drawer during the production of the sketch. In this thesis, we have tried to develop tools allowing a multi level analysis, including both shape and behavior analysis. The first part of our work deals with the pre treatments that must be performed on the sketch in order to allow upper level analysis. Those pre treatments are filtering, mixed segmentation and feature points detection and labelisation. In the second part, we approach shape analysis in two aspects: shape recognition and evaluation. We have developed a appearance based method which use local descriptors to allows both recognition and evaluation of the quality of a produced shape compared to the model . in the last part we propose a method for drawer's behavior extraction and modeling. Then we show how we can not only determine the favorite procedure of a drawer but also recognize the drawer by analyzing his behavior.
|
459 |
Visual feature graphs and image recognition / Graphes d'attributs et reconnaissance d'imagesBehmo, Régis 15 September 2010 (has links)
La problèmatique dont nous nous occupons dans cette thèse est la classification automatique d'images bidimensionnelles, ainsi que la détection d'objets génériques dans des images. Les avancées de ce champ de recherche contribuent à l'élaboration de systèmes intelligents, tels que des robots autonomes et la création d'un web sémantique. Dans ce contexte, la conception de représentations d'images et de classificateurs appropriés constituent des problèmes ambitieux. Notre travail de recherche fournit des solutions à ces deux problèmes, que sont la représentation et la classification d'images. Afin de générer notre représentation d'image, nous extrayons des attributs visuels de l'image et construisons une structure de graphe basée sur les propriétés liées au relations de proximités entre les points d'intérêt associés. Nous montrons que certaines propriétés spectrales de ces graphes constituent de bons invariants aux classes de transformations géométriques rigides. Notre représentation d'image est basée sur ces propriétés. Les résultats expérimentaux démontrent que cette représentation constitue une amélioration par rapport à d'autres représentations similaires, mais qui n'intègrent pas les informations liées à l'organisation spatiale des points d'intérêt. Cependant, un inconvénient de cette méthode est qu'elle fait appel à une quantification (avec pertes) de l'espace des attributs visuels afin d'être combinée avec un classificateur Support Vecteur Machine (SVM) efficace. Nous résolvons ce problème en créant un nouveau classificateur, basé sur la distance au plus proche voisin, et qui permet la classification d'objets assimilés à des ensembles de points. La linéarité de ce classificateur nous permet également de faire de la détection d'objet, en plus de la classification d'images. Une autre propriété intéressante de ce classificateur est sa capacité à combiner différents types d'attributs visuels de manière optimale. Nous utilisons cette propriété pour formuler le problème de classification de graphes de manière différente. Les expériences, menées sur une grande variété de jeux de données, montrent les bénéfices quantitatifs de notre approche. / We are concerned in this thesis by the problem of automated 2D image classification and general object detection. Advances in this field of research contribute to the elaboration of intelligent systems such as, but not limited to, autonomous robots and the semantic web. In this context, designing adequate image representations and classifiers for these representations constitute challenging issues. Our work provides innovative solutions to both these problems: image representation and classification. In order to generate our image representation, we extract visual features from the image and build a graphical structure based on properties of spatial proximity between the feature points. We show that certain spectral properties of this graph constitute good invariants to rigid geometric transforms. Our representation is based on these invariant properties. Experiments show that this representation constitutes an improvement over other similar representations that do not integrate the spatial layout of visual features. However, a drawback of this method is that it requires a lossy quantisation of the visual feature space in order to be combined with a state-of-the-art support vector machine (SVM) classifier. We address this issue by designing a new classifier. This generic classifier relies on a nearest-neighbour distance to classify objects that can be assimilated to feature sets, i.e: point clouds. The linearity of this classifier allows us to perform object detection, in addition to image classification. Another interesting property is its ability to combine different types of visual features in an optimal manner. We take advantage of this property to produce a new formulation for the classification of visual feature graphs. Experiments are conducted on a wide variety of publicly available datasets to justify the benefits of our approach.
|
460 |
Reconnaissance d’objets 3D par points d’intérêt / 3D object recognition with points of interestShaiek, Ayet 21 March 2013 (has links)
Soutenue par les progrès récents et rapides des techniques d'acquisition 3D, la reconnaissance d'objets 3D a suscité de nombreux efforts de recherche durant ces dernières années. Cependant, il reste à résoudre dans ce domaine plusieurs problématiques liées à la grande quantité d'information, à l'invariance à l'échelle et à l'angle de vue, aux occlusions et à la robustesse au bruit.Dans ce contexte, notre objectif est de reconnaitre un objet 3D isolé donné dans une vue requête, à partir d'une base d'apprentissage contenant quelques vues de cet objet. Notre idée est de formuler une méthodologie locale qui combine des aspects d'approches existantes et apporte une amélioration sur la performance de la reconnaissance.Nous avons opté pour une méthode par points d'intérêt (PIs) fondée sur des mesures de la variation locale de la forme. Notre sélection de points saillants est basée sur la combinaison de deux espaces de classification de surfaces : l'espace SC (indice de forme- intensité de courbure), et l'espace HK (courbure moyenne-courbure gaussienne).Dans la phase de description de l'ensemble des points extraits, nous proposons une signature d'histogrammes, qui joint une information sur la relation entre la normale du point référence et les normales des points voisins, avec une information sur les valeurs de l'indice de forme de ce voisinage. Les expérimentations menées ont permis d'évaluer quantitativement la stabilité et la robustesse de ces nouveaux détecteurs et descripteurs.Finalement nous évaluons, sur plusieurs bases publiques d'objets 3D, le taux de reconnaissance atteint par notre méthode, qui montre des performances supérieures aux techniques existantes. / There has been strong research interest in 3D object recognition over the last decade, due to the promising reliability of the 3D acquisition techniques. 3D recognition, however, conveys several issues related to the amount of information, to scales and viewpoints variation, to occlusions and to noise.In this context, our objective is to recognize an isolated object given in a request view, from a training database containing some views of this object. Our idea is to propose a local method that combines some existent approaches in order to improve recognition performance.We opted for an interest points (IPs) method based on local shape variation measures. Our selection of salient points is done by the combination of two surface classification spaces: the SC space (Shape Index-Curvedness), and the HK space (Mean curvature- Gaussian curvature).In description phase of the extracted set of points, we propose a histogram based signature, in which we join information about the relationship between the reference point normal and normals of its neighbors, with information about the shape index values of this neighborhood. Performed experiments allowed us to evaluate quantitatively the stability and the robustness of the new proposed detectors and descriptors.Finally we evaluate, on several public 3D objects databases, the recognition rate attained by our method, which outperforms existing techniques on same databases.
|
Page generated in 0.0861 seconds