Spelling suggestions: "subject:"représentation visuelle"" "subject:"représentation visuell""
1 |
INFLUENCE DE LA TÂCHE SUR LE TRAITEMENT DES SCÈNES VISUELLES COMPLEXES : UNE MODÉLISATION DES NIVEAUX DE REPRÉSENTATIONBoloix, Emmanuelle 09 December 2005 (has links) (PDF)
Cette thèse examine l'influence de la tâche sur la représentation en mémoire de scènes visuelles complexes. Dans un premier temps, elle étudie comment sont représentées les informations visuelles portées par une scène naturelle, selon qu'elles sont pertinentes par rapport à une tâche de recherche visuelle ou d'intérêt sémantique pour la compréhension et l'interprétation de la scène. Les résultats de plusieurs expériences montrent que les informations visuelles pertinentes par rapport à une tâche de recherche visuelle sont extraites de la scène, traitées, et représentées de manière plus précise que les autres informations de la scène. Ils suggèrent également que ces informations sont codées au sein d'un haut niveau de représentation visuelle, quel que soit leur intérêt sémantique, c'est-à-dire leur implication dans la compréhension et l'interprétation de la tâche. Dans un second temps, cette thèse étudie les modalités de la représentation fonctionnelle de ces informations visuelles en mémoire. Les résultats de plusieurs expériences révèlent que le niveau fonctionnel de nos représentations est de nature transitoire, et qu'il ne code à chaque instant que le détail des informations visuelles qui sont immédiatement requises par la tâche. Enfin, cette thèse propose un modèle multinomial de l'influence de la tâche sur la perception et la représentation d'une scène visuelle complexe. Mis à l'épreuve à partir de données expérimentales recueillies auprès de sujets humains dont la perception d'une scène visuelle est assujettie à la réalisation d'une tâche complexe, le modèle prouve son adéquation aux données. Ce faisant, il valide l'hypothèse selon laquelle les représentations visuelles stockées en mémoire contiennent majoritairement des informations pertinentes par rapport aux exigences de la tâche, avec une priorité représentationnelle allouée aux éléments de la scène qui sont directement et immédiatement pertinents pour la réalisation de cette tâche.
|
2 |
Enhanced image and video representation for visual recognition / Représentations d'image et de vidéo pour la reconnaissance visuelleJain, Mihir 09 April 2014 (has links)
L'objectif de cette thèse est d'améliorer les représentations des images et des vidéos dans le but d'obtenir une reconnaissance visuelle accrue, tant pour des entités spécifiques que pour des catégories plus génériques. Les contributions de cette thèse portent, pour l'essentiel, sur des méthodes de description du contenu visuel. Nous proposons des méthodes pour la recherche d'image par le contenu ou par des requêtes textuelles, ainsi que des méthodes pour la reconnaissance et la localisation d'action dans des vidéos. En recherche d'image, les contributions se fondent sur des méthodes `a base de plongements de Hamming. Tout d'abord, une méthode de comparaison asymétrique vecteur-`a-code est proposée pour améliorer la méthode originale, symétrique et utilisant une comparaison code-`a-code. Une méthode de classification fondée sur l'appariement de descripteurs locaux est ensuite proposée. Elle s'appuie sur une classification opérée dans un espace de similarités associées au plongement de Hamming. En reconnaissance d'action, les contributions portent essentiellement sur des meilleures manières d'exploiter et de représenter le mouvement. Finalement, une méthode de localisation est proposée. Elle utilise une partition de la vidéo en super-voxels, qui permet d'effectuer un échantillonnage 2D+t de suites de boîtes englobantes autour de zones spatio-temporelles d'intérêt. Elle s'appuie en particulier sur un critère de similarité associé au mouvement. Toutes les méthodes proposées sont évaluées sur des jeux de données publics. Ces expériences montrent que les méthodes proposées dans cette thèse améliorent l'état de l'art au moment de leur publication. / The subject of this thesis is about image and video representations for visual recognition. This thesis first focuses on image search, both for image and textual queries, and then considers the classification and the localization of actions in videos. In image retrieval, images similar to the query image are retrieved from a large dataset. On this front, we propose an asymmetric version of the Hamming Embedding method, where the comparison of query and database descriptors relies on a vector-to-binary code comparison. For image classification, where the task is to identify if an image contains any instance of the queried category, we propose a novel approach based on a match kernel between images, more specifically based on Hamming Embedding similarity. We also present an effective variant of the SIFT descriptor, which leads to a better classification accuracy. Action classification is improved by several methods to better employ the motion inherent to videos. This is done by dominant motion compensation, and by introducing a novel descriptor based on kinematic features of the visual flow. The last contribution is devoted to action localization, whose objective is to determine where and when the action of interest appears in the video. A selective sampling strategy produces 2D+t sequences of bounding boxes, which drastically reduces the candidate locations. The method advantageously exploits a criterion that takes in account how motion related to actions deviates from the background motion. We thoroughly evaluated all the proposed methods on real world images and videos from challenging benchmarks. Our methods outperform the previously published related state of the art and remains competitive with the subsequently proposed methods.
|
3 |
L'échange autour du projet urbain : quels savoirs partagés ? / (Make) participate in the urban project : springs and resource exchange face to faceMamou, Khedidja 22 September 2015 (has links)
Au croisement de la sociologie de l’action et de l’anthropologie de la communication et du langage, la thèse entend vérifier l’hypothèse de la co-construction d’un outillage collectif de la fabrique de la ville. Elle s’appuie sur une ethnographie de quatre processus participatifs sur des projets urbains franciliens de différentes natures : projet de rénovation et éco projet. La première partie montre comment se dessine un cadre d’action dans lequel la fabrique de la ville devient un projet participatif qui met les acteurs en situation d’enquête collective. Le face à face devient un double espace de projétation - projection des transformations urbaines - et de fabrique des modalités et ressources participatives. Saisir ce double espace nécessite une approche socio-anthropologique.La seconde partie s’intéresse aux contraintes avec lesquelles les participants doivent conjuguer : elle insiste sur les différents cadrages qui contribuent très fortement à la définition d’une offre participative (mises en place dans le cadre de commande public ou encore d’une recherche-action). Les contraintes se situent dans les trois niveaux de l’activité participative (interactionnelle, organisationnelle et politique), ce qui rend l’exercice collectif très complexe. Dans une perspective pragmatiste, la troisième partie s’attache à regarder comment la participation remodèle les ressources de l’échange en face à face et comment elle construit des façons de (faire) participer. Elle insiste sur les obstacles et les leviers d’un outillage collectif. L’étude ethnographique dégage un contraste dans les possibles redéfinitions de la situation qui sont laissées aux acteurs. / Situated between sociology of action and anthropology of communication and language, the thesis intends to verify the hypothesis of a collective tooling for building the city. It is based on the ethnography of four participatory processes in different urban projects situated in the Paris metropolitan area, ranging from the eco-project to the urban renewal project. The first part of the thesis retraces the history of the emergence of the participation, mainly from the point of view of the understanding and the recognition of the city and its inhabitants. It shows how a framework for action when building the city becomes a participative process of collective investigation. The face-to-face becomes a double space of “projétation”. Understanding this needs to develop a socio-anthropological approach.The second part analyses the constraints that the inhabitants have to deal with: it insists on the various framings that contribute very strongly to the definition of the participative offer (organized within the framework of a public order or a research action). These constrains are situated (and can be read) at the same three participative activity levels (interactional, organizational and political), with further complexity for the collective process. Using a pragmatist analytical frame, the third part attempts to describe how the participation process remodels the resources of the face-to-face exchange, and how it builds ways to devise/engage in the participation process. It insists on the obstacles and the levers of a collective tooling of the process. The ethnographical study allowed to identify different possible redefinitions of the situation available to the actors.
|
4 |
Apprentissage de Représentations Visuelles ProfondesGoh, Hanlin 12 July 2013 (has links) (PDF)
Les avancées récentes en apprentissage profond et en traitement d'image présentent l'opportunité d'unifier ces deux champs de recherche complémentaires pour une meilleure résolution du problème de classification d'images dans des catégories sémantiques. L'apprentissage profond apporte au traitement d'image le pouvoir de représentation nécessaire à l'amélioration des performances des méthodes de classification d'images. Cette thèse propose de nouvelles méthodes d'apprentissage de représentations visuelles profondes pour la résolution de cette tache. L'apprentissage profond a été abordé sous deux angles. D'abord nous nous sommes intéressés à l'apprentissage non supervisé de représentations latentes ayant certaines propriétés à partir de données en entrée. Il s'agit ici d'intégrer une connaissance à priori, à travers un terme de régularisation, dans l'apprentissage d'une machine de Boltzmann restreinte. Nous proposons plusieurs formes de régularisation qui induisent différentes propriétés telles que la parcimonie, la sélectivité et l'organisation en structure topographique. Le second aspect consiste au passage graduel de l'apprentissage non supervisé à l'apprentissage supervisé de réseaux profonds. Ce but est réalisé par l'introduction sous forme de supervision, d'une information relative à la catégorie sémantique. Deux nouvelles méthodes sont proposées. Le premier est basé sur une régularisation top-down de réseaux de croyance profonds à base de machines des Boltzmann restreintes. Le second optimise un cout intégrant un critère de reconstruction et un critère de supervision pour l'entrainement d'autoencodeurs profonds. Les méthodes proposées ont été appliquées au problème de classification d'images. Nous avons adopté le modèle sac-de-mots comme modèle de base parce qu'il offre d'importantes possibilités grâce à l'utilisation de descripteurs locaux robustes et de pooling par pyramides spatiales qui prennent en compte l'information spatiale de l'image. L'apprentissage profonds avec agrégation spatiale est utilisé pour apprendre un dictionnaire hiérarchique pour l'encodage de représentations visuelles de niveau intermédiaire. Cette méthode donne des résultats très compétitifs en classification de scènes et d'images. Les dictionnaires visuels appris contiennent diverses informations non-redondantes ayant une structure spatiale cohérente. L'inférence est aussi très rapide. Nous avons par la suite optimisé l'étape de pooling sur la base du codage produit par le dictionnaire hiérarchique précédemment appris en introduisant introduit une nouvelle paramétrisation dérivable de l'opération de pooling qui permet un apprentissage par descente de gradient utilisant l'algorithme de rétro-propagation. Ceci est la première tentative d'unification de l'apprentissage profond et du modèle de sac de mots. Bien que cette fusion puisse sembler évidente, l'union de plusieurs aspects de l'apprentissage profond de représentations visuelles demeure une tache complexe à bien des égards et requiert encore un effort de recherche important.
|
5 |
L’induction implicite de l’utilisation de l’oeil droit produit une meilleure discrimination faciale du sexeFaghel-Soubeyrand, Simon 08 1900 (has links)
No description available.
|
6 |
Le concept de série dans les manuels au niveau collégial : registres de représentation et activités cognitivesSeffah, Rachid 01 1900 (has links)
Au niveau postsecondaire, les concepts mathématiques avancés seraient des concepts difficiles à appréhender pour beaucoup d’étudiants. Le concept de série fait partie de ces concepts avancés que les étudiants rencontrent pour la première fois de façon formelle dans leurs études postsecondaires (au niveau collégial, Cégep, dans le contexte québécois). Ce concept a un très grand nombre d’applications et ce, aussi bien en mathématiques que dans le domaine scientifique. Cependant, sa complexité propre et sa nature contre-intuitive font qu’il est très difficile à appréhender par certains étudiants. Parmi les difficultés d’appréhension, dans un grand nombre de cas, on peut trouver la conception que la somme d’une infinitude de termes donnera une quantité qui ne peut être qu’infiniment grande. Étant donné l’importance et la complexité de ce concept, on pourrait s’attendre à ce qu’il soit pris en compte avec une grande attention par la recherche. Cependant, notre recension d’écrits montre qu’il y a très peu d’études centrées sur le concept de somme infinie. Dans ce mémoire, nous allons présenter des résultats d’une analyse effectuée sur dix-sept manuels utilisés dans les Cégeps du Québec. Les résultats de cette analyse nous ont permis de prendre conscience que les manuels utilisés par l’enseignement actuel font rarement usage du registre graphique et que le registre algébrique est souvent privilégié. Ainsi, la plupart des manuels utilisés dans les Cégeps utilisent rarement les représentations visuelles qui pourraient être un outil important pouvant contribuer dans une appréhension complète du concept de série et les graphiques sont pratiquement absents dans tous les exercices et problèmes que ces manuels proposent. Par ailleurs, les résultats de notre recherche montre que les applications mathématiques et extramathématiques sont rares, et ce, bien que les sommes infinies soient un concept essentiel dans l’introduction d’autres concepts mathématiques et qu’elles permettent de modéliser plusieurs phénomènes. De plus, parmi le peu d’applications extramathématiques qui apparaissent dans les dix-sept manuels, beaucoup sont peu utiles à l’appréhension du concept en question étant donné que celles-ci sont artificielles (applications difficiles à réaliser dans la vie quotidienne). Enfin, nos résultats de recherche nous révèlent que le contenu des manuels en lien avec le concept de série mériterait d’être réajusté afin de permettre aux étudiants une meilleure appréhension de ce concept. / At the post high school level, advanced mathematical concepts are difficult to grasp for many students. The series concept is one such advanced concept that students meet for the first time formally in their postsecondary studies (Cégep in the Québec context). This concept has a very large number of applications both in mathematics and in science. However, its own complexity and nature against-intuitive make it very difficult to understand by some students. Among the difficulties to apprehend it, in many cases, we can find the idea that the sum of an infinite number of terms will give a quantity which will necessarily be infinitely large. Given the importance and complexity of this concept, one might expect it to be considered with great attention by the research. However, our literature review shows that there are very few studies focusing on the concept of infinite sum. In this Masters thesis, we will present the results of an analysis carried out on seventeen textbooks used in Cégeps in Quebec. The results of this analysis have allowed us to realize that the textbooks used by the current education rarely make use of the graphic register and that the algebraic register is often favored. Thus, most of the textbooks used in Cégeps rarely use visual representations that could be an important tool that can contribute to a comprehensive understanding of the concept of series and graphics are virtually absent in all the exercises and problems that these books offer. Furthermore, the results of our research show that mathematical and extramathematical applications are scarce, although infinite sums are a key concept in the introduction of other mathematical concepts and they allow modeling several phenomena. Moreover, among the few extramathematical applications that appear in the seventeen textbooks, many are of little use to the understanding of the concept in question since they are artificial (difficult applications to perform in daily life). Finally, our research results reveal that the content of textbooks in connection with the concept of series deserves to be readjusted to allow students a better understanding of this concept.
|
Page generated in 0.1326 seconds