Spelling suggestions: "subject:"saillance"" "subject:"vaillance""
41 |
Métrologie et modélisation de l'aspect pour l'inspection qualité des surfaces / Surface appearance metrology and modeling for industrial quality inspectionPitard, Gilles 19 May 2016 (has links)
Dans les secteurs industriels, la maîtrise de l’aspect des surfaces est une problématique majeure de la conception jusqu’à la réalisation des produits. En entreprise, l’évaluation de la qualité des surfaces est généralement réalisée par des contrôleurs humains, sauf pour certaines applications spécifiques pour lesquels des systèmes ont pu être mis en œuvre. L’objectif est donc d’aider les fabricants à mieux évaluer l’aspect et d’avancer vers l’automatisation du processus d’inspection qualité des surfaces.D’un point de vue métrologique, la quantification de l’aspect passe par l’acquisition de la fonction de répartition du coefficient de luminance (BRDF) qui fournit une cartographie de la lumière réfléchie à la surface d’un échantillon. Le système visuel humain extrait de cette mesure des facteurs à partir desquels il élabore des attributs de l’aspect : régularité d’une texture, uniformité de la couleur, qualité du brillant, saillance d’une anomalie, etc.En conséquence, notre approche consiste à utiliser les techniques appelées Reflectance Transformation Imaging (RTI) originellement issues du domaine archéologique, pour l’industrie. Elles permettent d’obtenir simultanément une estimation réduite et simplifiée de la BRDF et une estimation des normales à la surface.Un dispositif d’acquisition RTI appelé la Sphère MeSurA permet d’obtenir des données stéréophotométriques (luminances). L’approximation de forme des mesures discrètes de luminances acquises est fournie selon le principe de la Décomposition Modale Discrète (DMD). Une analyse comparative avec les autres modèles montre que la DMD décrit plus fidèlement les réflexions spéculaires, et plus généralement les zones locales de surfaces brillantes.Nous développons une méthode permettant de mesurer la similarité d’aspect en définissant des descripteurs invariants à la rotation obtenus par un changement de paramétrage de la DMD. Nous calculons ainsi des cartes de distance permettant d’extraire les anomalies les plus saillantes. Nous proposons également leur évaluation par des attributs pertinents sur lesquels les contrôleurs pourront se baser pour décider de la conformité d’un produit.De plus, nous mettons l’accent sur des indicateurs directionnels de normales et de courbures à la surface. Ils permettent de séparer efficacement les composantes périodiques et non-périodiques de la surface, et ainsi de caractériser géométriquement les anomalies d’aspect d’une part et d’autre part la signature d’un procédé de fabrication.Les résultats de ces travaux permettent ainsi d’aider les fabricants à maîtriser la qualité d’aspect en accédant à différentes modalités de la surface inspectée, dans un logiciel d’application appelé MsaTool®. / In industry, controlling the surface appearance is an important issue in the product creation, from the conception phases through the manufacturing phase all the way to delivery to the final consumer. The surface quality control is mostly carried out by human controllers, except for specific applications where inspection devices have been designed. Our prime purpose is to help manufacturers for the assessment of the surface finish appearance and move towards automation of the inspection process.From a metrological point of view, the relevant quantity is the Bidirectional Reflectance Distribution Function (BRDF) that describes the angular distribution of the reflected light from a surface. The human visual system is able to extract information about these surface reflectance properties, that allow us to construct a mental representation of the stimulus and give meaning to the observations : structural regularity, color uniformity, gloss quality, characteristics of salience, etc.Our approach is based on the use of techniques known as Reflectance Transformation Imaging (RTI), initialy developed to study the surface of cultural heritage artefacts, as industrial measurement instrument. The RTI techniques allow us to obtain both a reduced and simplified BRDF estimation and the normal field to the surface.A RTI acquisition system called MeSurA Sphere provides photometric stereo datasets (radiance values captured under varying illumination). The continuous model of the local reflection of radiances is based on the Discrete Modal Decomposition (DMD). A comparative analysis with other RTI models shows that the DMD is well suited for approximating the complex physical behavior of light reflections and enhance the overall accuracy of appearance reconstruction of shiny reflective surfaces.We developed a method to measure the similarity of surface appearance using rotation invariant descriptors obtained by chan- ging the DMD parameterization. We then calculate distance maps to extract the most salient features leading to an effective separa- tion of surface defects. We identify relevant parameters from which controllers are able to decide on product conformity.We propose orientation-preserving maps of slopes and curvatures for identifying and separating the periodic and aperiodic components of the surface. We are then able to make a geometric characterization of the detected surface defects or of the manu- facturing process signature.The results of this work make possible to help manufacturers in the control of surface appearance using a software called MsaTool® bringing together several modalities of our treatments.
|
42 |
Salience concept in auditory domain with regard to music cognition / La saillance dans le domaine auditif et ses liens avec la cognition musicaleGiorgio, Maurizio 18 September 2014 (has links)
Le travail de recherche examine plusieurs problématiques relatives à la perception, la représentation et la catégorisation des stimuli musicaux durant l’écoute. Nous souhaitons enquêter ces processus cognitifs dans le cadre des différentes approches théorétiques présentes dans la littérature scientifique internationale. En particulier, la thèse s’est focalisée sur le processus de segmentation perceptif du morceau pendant l'écoute, et a analysé au moyen de deux expériences comportementales, les différents rôles des nombreuses caractéristiques structurelles et dynamiques dans le développement de la représentation de la composition musicale par Pauditeur. Ils sont aussi considérés les variables liées au musicien et à l’écouter. Les données expérimentales obtenues sont étudiées en relation avec les modèles modernes de auditory map of salience, et parallèlement, avec les modèles plus spécifiques de segmentation développés pendant ces trente dernières années dans la cadre de la psychologie cognitive de la musique. Pour les expériences on a utilisé un paradigme de segmentation musical avec deux écoutes de morceaux atonales et un ordre balancé de présentation. Les résultats expérimentaux démontrent que la carte de saillance n'est pas une trame immuable pouvant être remplie avec des combinaisons de caractéristiques du stimulus. Au contraire, elle peut être modulée par la répartition de l'attention « goal directed » il travers, par exemple, une modulation des seuils perceptifs spécifiques pour certaines caractéristiques. / This research examines several issues related to the collection, representation and the categorization of musical stimuli during the listening. We investigate these cognitive processes in the with reference to the different theoretical approaches existing in the international scientific literature. In particular, the thesis focuses on the process of perceptual segmentation of musical pieces during the listening. Two behavioral experiments allow analyzing the different roles of many structural and dynamic features in the development of the listeners’ representation of the music. Experiments take into account also the variables related to the musician and the listener. The experimental data obtained are discussed with regard to the current models of auditory map of salience, as well as with models of music segmentation models. In the paradigm of musical segmentation we used subjects have to hear and segment two versions of an atonal piece. Order of presentation is balanced across participants. The results demonstrate that the saliency map is not an immutable frame deriving only from the features of the stimuli. On the opposite, it can be modulated by goal-directed attention through, for example, modulation of specific perceptual thresholds for certain characteristics.
|
43 |
Reconnaissance perceptuelle des objets d’Intérêt : application à l’interprétation des activités instrumentales de la vie quotidienne pour les études de démence / Perceptual object of interest recognition : application to the interpretation of instrumental activities of daily living for dementia studiesBuso, Vincent 30 November 2015 (has links)
Cette thèse est motivée par le diagnostic, l’évaluation, la maintenance et la promotion de l’indépendance des personnes souffrant de maladies démentielles pour leurs activités de la vie quotidienne. Dans ce contexte nous nous intéressons à la reconnaissance automatique des activités de la vie quotidienne.L’analyse des vidéos de type égocentriques (où la caméra est posée sur une personne) a récemment gagné beaucoup d’intérêt en faveur de cette tâche. En effet de récentes études démontrent l’importance cruciale de la reconnaissance des objets actifs (manipulés ou observés par le patient) pour la reconnaissance d’activités et les vidéos égocentriques présentent l’avantage d’avoir une forte différenciation entre les objets actifs et passifs (associés à l’arrière plan). Une des approches récentes envers la reconnaissance des éléments actifs dans une scène est l’incorporation de la saillance visuelle dans les algorithmes de reconnaissance d’objets. Modéliser le processus sélectif du système visuel humain représente un moyen efficace de focaliser l’analyse d’une scène vers les endroits considérés d’intérêts ou saillants,qui, dans les vidéos égocentriques, correspondent fortement aux emplacements des objets d’intérêt. L’objectif de cette thèse est de permettre au systèmes de reconnaissance d’objets de fournir une détection plus précise des objets d’intérêts grâce à la saillance visuelle afin d’améliorer les performances de reconnaissances d’activités de la vie de tous les jours. Cette thèse est menée dans le cadre du projet Européen Dem@care.Concernant le vaste domaine de la modélisation de la saillance visuelle, nous étudions et proposons une contribution à la fois dans le domaine "Bottom-up" (regard attiré par des stimuli) que dans le domaine "Top-down" (regard attiré par la sémantique) qui ont pour but d’améliorer la reconnaissance d’objets actifs dans les vidéos égocentriques. Notre première contribution pour les modèles Bottom-up prend racine du fait que les observateurs d’une vidéo sont normalement attirés par le centre de celle-ci. Ce phénomène biologique s’appelle le biais central. Dans les vidéos égocentriques cependant, cette hypothèse n’est plus valable.Nous proposons et étudions des modèles de saillance basés sur ce phénomène de biais non central.Les modèles proposés sont entrainés à partir de fixations d’oeil enregistrées et incorporées dans des modèles spatio-temporels. Lorsque comparés à l’état-de-l’art des modèles Bottom-up, ceux que nous présentons montrent des résultats prometteurs qui illustrent la nécessité d’un modèle géométrique biaisé non-centré dans ce type de vidéos. Pour notre contribution dans le domaine Top-down, nous présentons un modèle probabiliste d’attention visuelle pour la reconnaissance d’objets manipulés dans les vidéos égocentriques. Bien que les bras soient souvent source d’occlusion des objets et considérés comme un fardeau, ils deviennent un atout dans notre approche. En effet nous extrayons à la fois des caractéristiques globales et locales permettant d’estimer leur disposition géométrique. Nous intégrons cette information dans un modèle probabiliste, avec équations de mise a jour pour optimiser la vraisemblance du modèle en fonction de ses paramètres et enfin générons les cartes d’attention visuelle pour la reconnaissance d’objets manipulés. [...] / The rationale and motivation of this PhD thesis is in the diagnosis, assessment,maintenance and promotion of self-independence of people with dementia in their InstrumentalActivities of Daily Living (IADLs). In this context a strong focus is held towardsthe task of automatically recognizing IADLs. Egocentric video analysis (cameras worn by aperson) has recently gained much interest regarding this goal. Indeed recent studies havedemonstrated how crucial is the recognition of active objects (manipulated or observedby the person wearing the camera) for the activity recognition task and egocentric videospresent the advantage of holding a strong differentiation between active and passive objects(associated to background). One recent approach towards finding active elements in a sceneis the incorporation of visual saliency in the object recognition paradigms. Modeling theselective process of human perception of visual scenes represents an efficient way to drivethe scene analysis towards particular areas considered of interest or salient, which, in egocentricvideos, strongly corresponds to the locus of objects of interest. The objective of thisthesis is to design an object recognition system that relies on visual saliency-maps to providemore precise object representations, that are robust against background clutter and, therefore,improve the recognition of active object for the IADLs recognition task. This PhD thesisis conducted in the framework of the Dem@care European project.Regarding the vast field of visual saliency modeling, we investigate and propose a contributionin both Bottom-up (gaze driven by stimuli) and Top-down (gaze driven by semantics)areas that aim at enhancing the particular task of active object recognition in egocentricvideo content. Our first contribution on Bottom-up models originates from the fact thatobservers are attracted by a central stimulus (the center of an image). This biological phenomenonis known as central bias. In egocentric videos however this hypothesis does not alwayshold. We study saliency models with non-central bias geometrical cues. The proposedvisual saliency models are trained based on eye fixations of observers and incorporated intospatio-temporal saliency models. When compared to state of the art visual saliency models,the ones we present show promising results as they highlight the necessity of a non-centeredgeometric saliency cue. For our top-down model contribution we present a probabilisticvisual attention model for manipulated object recognition in egocentric video content. Althougharms often occlude objects and are usually considered as a burden for many visionsystems, they become an asset in our approach, as we extract both global and local featuresdescribing their geometric layout and pose, as well as the objects being manipulated. We integratethis information in a probabilistic generative model, provide update equations thatautomatically compute the model parameters optimizing the likelihood of the data, and designa method to generate maps of visual attention that are later used in an object-recognitionframework. This task-driven assessment reveals that the proposed method outperforms thestate-of-the-art in object recognition for egocentric video content. [...]
|
44 |
De l’apposition à la construction nominale détachée : Étude syntaxique et textuelle des constructions [GN1, GN2] en allemand / From apposition to detached noun phrases : Syntactic and textual study of [NP1, NP2] constructions in GermanDurand, Marie-Laure Blanche 02 December 2013 (has links)
Cette étude, syntaxique et textuelle, se penche sur le problème de la définition de l’apposition. Les grammaires de l’allemand et les études linguistiques consacrées à l’apposition font apparaître de grandes divergences quant à l’extension de la notion qui reste encore empreinte du poids de la tradition grammaticale. Les critères relevés dans les différentes définitions (accord casuel, accolage, identité référentielle, non restrictivité, suppressibilité, parenté avec une structure propositionnelle ou relation prédicative) sont soumis à un examen critique qui motive une redéfinition en intension et en extension de l’objet d’étude : la construction détachée à support nominal est une prédication supplémentaire averbale dans laquelle l’apport GN2 peut morphosyntaxiquement toujours se positionner directement à droite du support GN1. Cette définition permet de distinguer la construction détachée de phénomènes considérés comme appositifs (le GN en als et wie, la dislocation, la construction absolue).La mise à distance de GN2 par rapport à GN1 s’explique par la répartition et la hiérarchisation de l’information dans l’énoncé et au-delà, dans le texte. La construction détachée apporte les éléments pertinents pour la compréhension du texte. Cette fonction explicative instaure et entretient l’ethos coopératif du locuteur-scripteur dont celui-ci peut jouer à des fins argumentatives.Le corpus d’étude (volume 2) est composé de textes de presse et de textes littéraires contemporains. / This syntactic and textual study examines the various ways apposition can be defined. German grammars and linguistic studies devoted to apposition vary widely in the range of that notion, which is still very much under the influence of grammatical tradition. The various criteria which appear in definitions (case agreement, adjacency, referential identity, non-restrictiveness, deletability, similarity to a grammatical clause, subject-predicate relation) are critically examined, which leads to a redefinition of the object of our study, both intensionally and extentionally: noun-based detached constructions can be seen as additional averbal predications in which the appositive NP2 can always be morphosyntactically positioned immediately to the right of the NP1 base. Our definition makes it possible to distinguish detached constructions from phenomena which are usually considered as appositive (als- or wie-introduced NPs, dislocations, absolute constructions).NP2 displacement away from NP1 results from the distribution and prioritization of information within utterances, and further at the textual level. Detached constructions provide relevant elements for textual comprehension. This explanatory function creates and maintains a high level of mutual comprehension between the speaker/writer and the reader, which the speaker can use for argumentative purposes.The corpus of our study (vol. 2) is made up of newspaper and magazine articles and contemporary literary texts.
|
45 |
Détection de primitives par une approche discrète et non linéaire : application à la détection et la caractérisation de points d'intérêt dans les maillages 3D / Primitives detection by a discrete and non linear approach : application to the detection and caracterization of interest points for 3D meshesWalter, Nicolas 26 August 2010 (has links)
Ce manuscrit est dédié à la détection et la caractérisation de points d'intérêt dans les maillages. Nous montrons tout d'abord les limitations de la mesure de courbure sur des contours francs, mesure habituellement utilisée dans le domaine de l'analyse de maillages. Nous présentons ensuite une généralisation de l'opérateur SUSAN pour les maillages, nommé SUSAN-3D. La mesure de saillance proposée quantifie les variations locales de la surface et classe directement les points analysés en cinq catégories : saillant, crête, plat, vallée et creux. Les maillages considérés sont à variété uniforme avec ou sans bords et peuvent être réguliers ou irréguliers, denses ou non et bruités ou non. Nous étudions ensuite les performances de SUSAN-3D en les comparant à celles de deux opérateurs de courbure : l'opérateur de Meyer et l'opérateur de Stokely. Deux méthodes de comparaison des mesures de saillance et courbure sont proposées et utilisées sur deux types d’objets : des sphères et des cubes. Les sphères permettent l'étude de la précision sur des surfaces différentiables et les cubes sur deux types de contours non-différentiables : les arêtes et les coins. Nous montrons au travers de ces études les avantages de notre méthode qui sont une forte répétabilité de la mesure, une faible sensibilité au bruit et la capacité d'analyser les surfaces peu denses. Enfin, nous présentons une extension multi-échelle et une automatisation de la détermination des échelles d'analyse qui font de SUSAN-3D un opérateur générique et autonome d’analyse et de caractérisation pour les maillages / This manuscript is dedicated to the detection and caracterization of interest points for 3D meshes. First of all, we show the limitations of the curvature measure on sharp edges, the measure usually used for the analysis of meshes. Then, we present a generalization of the SUSAN operator for meshes, named SUSAN-3D. The saliency measure proposed quantify the local variation of the surface and classify directly the analysed vertices in five classes: salient, crest, flat, valley and cavity. The meshes under consideration are manifolds and can be closed or non-closed, regulars or irregulars, dense or not and noised or not. The accuracy of the SUSAN-3D operator is compared to two curvature operators: the Meyer's operator and the Stokely's operator. Two comparison methods of saliency and curvature measures are described and used on two types of objects: spheres and cubes. The spheres allow the study of the accuracy for differentiable surfaces and the cubes for two types of sharp edges: crests and corners. Through these studies, we show the benefits of our method that are a strong repeatability of the measure, high robustness to noise and capacity to analyse non dense meshes. Finally, we present a multi-scale scheme and automation of the determination of the analysis scales that allow SUSAN-3D to be a general and autonomous operator for the analysis and caracterization of meshes
|
46 |
La programmation des saccades oculaires chez l'homme : rôle et décours temporel des traitements visuels élémentaires / Saccade programming in humans : Influence and time course of elementary visual processesMassendari, Delphine 23 April 2015 (has links)
Notre environnement visuel est riche en lumière, couleurs, traits, textures et formes. Pour appréhender cette richesse, nous déplaçons nos yeux tous les quarts de seconde à l'aide de mouvements très rapides appelés saccades. Une telle vision dite active a fait l’objet de multiples recherches, mais les interactions entre les systèmes visuel et oculomoteur ne sont pas clairement établies. Cette thèse vise à préciser ces interactions en étudiant si les délais temporels associés au traitement d'informations visuelles de plus en plus élaborées contraignent où et quand nos yeux bougent. Trois séries d'études comportementales menées chez l'homme et utilisant des paradigmes novateurs ont été réalisées. Elles nous ont permis de mettre en évidence que le traitement des contrastes d'orientation, tout comme le traitement des contrastes de luminance sont intégrés par le système saccadique. En effet, un stimulus (distracteur) différant d'un fond texturé par sa luminance ou son orientation dévie le regard de sa cible dans la même mesure, et ce, quelle que soit la latence des saccades. Néanmoins, le contraste de luminance conserve un rôle prédominant. Premièrement, il conduit au déclenchement plus précoce des saccades en comparaison avec le contraste d’orientation. Deuxièmement, dès lors qu'il entre en compétition avec des informations plus élaborées comme le contour, il suffit à déterminer la métrique des saccades. Ainsi, en accord avec l'architecture des systèmes visuel et oculomoteur, les traitements visuels influencent la programmation des saccades de manière ordonnée. / Our environment is rich in light, color, features, textures, and shapes. To extract this information, we move our eyes four times per second with rapid eye movements called saccades. This so-called active vision has been studied extensively, but the interactions between the visual and oculomotor systems have not been fully characterized yet. This thesis aims to clarify these interactions by investigating whether the delays in processing visual information of increasing complexity determine where and when our eyes move. The present work focuses on three types of basic visual processing for which the neural substrates are well established and predict a specific order in the programming of saccades at the level of the superior colliculus. We conducted three series of behavioral studies with human participants using novel experimental paradigms. These studies showed that orientation-contrast processing as well as early luminance-contrast processing are integrated in the saccadic system to the same extent. When aiming for a target stimulus, the eyes deviate toward a distractor stimulus in equal measure, irrespective of whether the distractor differed in luminance or orientation from a texture background and irrespective of saccade latency. However, the role of luminance contrast remains dominant. Firstly, luminance contrast triggers faster saccades than orientation contrast. Secondly, when luminance contrast competes with more complex information such as contour, solely luminance contrast determines saccade metrics. Therefore, visual processes influence saccade programming in a specific order that is consistent with the architecture of the visual and oculomotor systems.
|
47 |
Modulation noradrénergique et ajustement des processus attentionnels chez le singe / Noradrenergic modulation and adjustement of attentional processes in monkeysReynaud, Amélie 31 October 2019 (has links)
L'attention est une fonction au cœur de la cognition qui, à tout moment, nous permet de sélectionner les informations pertinentes à traiter, tout en ignorant les autres. Cette sélection de l’information qui s’opère à la fois dans l'espace et dans le temps résulte de l’intégration des informations sensorielles et d’un contrôle de "haut niveau" en fonction de nos buts. Cette fonction dépend d’un réseau cérébral incluant le système fronto-pariétal et est sous l’influence de différents neuromodulateurs, en particulier la noradrénaline, dont l’action reste encore mal connue. Mon travail de thèse consistait à comprendre le rôle de la noradrénaline sur les processus attentionnels. Mes objectifs étaient d’une part de vérifier notre hypothèse selon laquelle la noradrénaline modulerait les différentes facettes de l’attention (attention spatiale et attention soutenue) et d’autre part d’élucider les mécanismes d’action par lesquelles la noradrénaline exercerait ces effets. Pour répondre à ces questions, nous avons testé l’impact d’une augmentation de la transmission noradrénergique (administration intramusculaire d'atomoxétine) chez le singe, dans des tâches comportementales nécessitant une sélection de l’information visuelle soit dans l’espace (tâche d'attention avec indice et exploration spontanée d'images) soit au cours du temps (tâche de discrimination go/nogo). Nos résultats démontrent que l’atomoxétine facilite les processus attentionnels à la fois dans l’espace et au cours du temps. Dans l’espace, l’atomoxétine module l’orientation de l’attention visuo-spatiale en fonction du contexte, en ajustant le taux d’accumulation sensorielle ou l’impact de la saillance des images sur l’orientation de l’attention. Au cours du temps, l’atomoxétine ajuste la relation entre la sensibilité à discriminer la cible parmi des distracteurs et le biais de réponse des animaux. En résumé, mes résultats démontrent que la noradrénaline influence les deux facettes, spatiale et temporelle de l’attention et suggèrent une action via un ajustement des processus de traitement de l’information sensorielle et un ajustement du contrôle de l’attention au contexte / Attention is a function at the heart of cognition that, at any given moment, enables us to select some information for further processing, while setting aside others. This selection of information that operates both in space and time, results from the integration of sensory information and higher-level control according to our goals. This function depends on a cerebral network including the fronto-parietal system. It is also under the influence of different neuromodulators, in particular norepinephrine, the action of which is still poorly understood.The aim of my PhD work was to understand the role of norepinephrine on attentional processes. My objectives were, on the one hand, to test our hypothesis that norepinephrine is capable of acting on the different facets of attention (spatial attention and sustained attention) and, on the other hand, to elucidate the mechanisms of action by which noradrenaline exerts its action. To answer these questions, we tested the impact of an increase in noradrenergic transmission (intramuscular administration of atomoxetine) in monkeys, using behavioral tasks requiring a selection of visual information in space (cued attentional task and spontaneous image exploration) or over time (go/nogo discrimination task). Our results demonstrate that atomoxetine facilitates attentional processes both in space and over time. In space, atomoxetine modulates the orientation of visuospatial attention according to the context, adjusting the rate of sensory accumulation or the impact of image saliency on attention orientation. Over time, atomoxetine adjusts the relationship between the sensitivity to discriminate a target among distractors and the animal’s response bias.In summary, my results demonstrate that norepinephrine influences both the spatial and temporal facets of attention and suggests an action through an adjustment of sensory information processing and an adjustment of attention control to the context
|
48 |
L'inhibition, un processus au cœur de la compétition visuo-attentionnelle globale/locale : perspectives développementales / Inhibition as a core mechanism for global/local visuo-attentional competition : developmental perspectivesKrakowski, Claire-Sara 27 November 2015 (has links)
Le monde visuel qui nous entoure est extrêmement complexe, constitué d'une grande quantité d'informations, toutes emboîtées les unes aux autres, qui entrent en compétition pour l'octroi de nos ressources attentionnelles. Notre système cognitif doit ainsi sélectionner un nombre limité d'informations qui lui permettront d'agir de façon adaptée sur son environnement. La saillance perceptive d'une information biaise automatiquement les ressources attentionnelles en sa faveur, un processus qui est la plupart du temps efficace et adaptatif. Néanmoins, lorsque l'information avantagée n'est pas celle qui est pertinente, un effort mental supplémentaire d'inhibition est nécessaire pour la supprimer et permettre la sélection de l'information d'intérêt. Cette thèse a pour objectif de faire le lien entre les modèles de sélection et d'inhibition attentionnelles et l'effet de précédence globale, c'est à dire le fait que la structure globale soit traitée plus rapidement que ses parties constituantes locales et interfère avec elles. Chez l'enfant d'âge préscolaire et scolaire, un tel effet de précédence globale semble exister précocement mais serait sensible à des manipulations de sa saillance : lorsque les éléments locaux sont denses, la forme globale émerge spontanément et est privilégiée. À l'inverse, lorsque les éléments locaux sont moins denses, ce sont eux qui semblent être traitées prioritairement. L'objectif de cette thèse est de préciser le développement du traitement global/local par 1) l'étude de la compétition attentionnelle entre les niveaux hiérarchiques global, intermédiaire et local au cours du développement et 2) la mise en évidence du rôle central du contrôle inhibiteur dans la sélection du niveau hiérarchique le moins saillant. Nous avons montré chez l'adulte, grâce à un paradigme de recherche visuelle, que le niveau local est toujours désavantagé durant la compétition attentionnelle par rapport aux niveaux structurels global et intermédiaire. Même si les enfants présentaient un pattern de résultats similaires, les enfants de 5 et 6 ans avaient des difficultés accrues dans la sélection locale, faisant davantage d'erreurs que les enfants plus âgés et les adultes. Ces résultats semblent indiquer un défaut d'inhibition de la structure globale chez les enfants d'âge préscolaire. Grâce à un paradigme d'amorçage négatif, nous avons vérifié que, chez l'adulte et l'enfant de 7 ans, la sélection du niveau local (peu saillant) nécessite bien l'inhibition du niveau global (le plus saillant). Toutefois, en utilisant des figures peu denses, une inversion de ce pattern de résultats était observée chez les enfants de 7 ans, résultat qui n'était pas observé chez les adultes. Une inhibition du niveau local, et non plus du niveau global, serait ainsi nécessaire chez l'enfant. Quel que soit le niveau le plus saillant à un âge donné, l'inhibition permettrait de supprimer l'information présente au niveau saillant et non-pertinent au profit de l'information d'intérêt moins saillante. L'ensemble de ces résultats, au regard des modèles actuels de sélection et d'inhibition attentionnelles et des théories dynamiques du développement, permet de nouvelles interprétations et perspectives dans l'étude de l'effet de précédence globale chez l'adulte et l'enfant. / The visual world around us is extremely complex and has a great deal of information embedded in various sources that compete for our attentional resources. Our cognitive system must select a limited amount of visual information, which allows one to adapt to the environment. The perceptive saliency of a piece of information automatically biases attentional resources towards it, and this process is often useful and adaptive. Nevertheless, when the advantaged information is not the most pertinent available, additional mental effort is necessary to suppress it and to select the information of interest. The purpose of this thesis is to connect models of attentional selection and inhibition to the global precedence effect. The latter describes the faster processing of the global structure of an object compared to its local constitutive parts as well as the interference from global to local level. This global precedence effect seems to exist in preschoolers, but appears to be sensitive to manipulations of saliency: when the local elements are dense, the global form spontaneously emerges and is prioritized; however, when local elements are sparse, they seem to be processed with priority. The main goal of this thesis is to specify the global/local development by 1) studying the attentional competition between global, intermediate and local hierarchical levels during development and 2) highlighting the central role of inhibitory control when selecting the less salient level. With a visual search task, we demonstrated that in adults the local level is always disadvantaged during the attentional competition for resources compared to more structural, global and intermediate, levels. Although children showed a similar pattern of results, the selection of the local level was impaired in 5- and 6-year-old children who committed more errors than older children and adults. This result indicates there is a lack of inhibition of the global form in preschoolers. With a negative priming paradigm, we validated the idea that adults and 7-year-old children need to inhibit the global hierarchical level (the most salient one) to select the local hierarchical level (the less salient one). However, when using sparse hierarchical figures, this pattern of results was reversed in 7-year-old children but not in adults. A local inhibition, instead of a global inhibition, seems to be necessary in children when processing sparse figures. Regardless of which level is the most salient at each age, the inhibition process appears necessary to suppress the information at the salient and non-pertinent level in order to select the less salient but most relevant information. Taken together, and with regards to models of attentional selection and inhibition and to dynamic theories of development, these results provide new interpretations and perspectives in the study of the global precedence effect in children and adults.
|
49 |
Intrinsic motivation mecanisms for incremental learning of visual saliency / Apprentissage incrémental de la saillance visuelle par des mécanismes de motivation intrinsèqueCraye, Céline 03 April 2017 (has links)
La conception de systèmes de perception autonomes, tels que des robots capables d’accomplir un ensemble de tâches de manière sûre et sans assistance humaine, est l’un des grands défis de notre siècle. Pour ce faire, la robotique développementale propose de concevoir des robots qui, comme des enfants, auraient la faculté d’apprendre directement par interaction avec leur environnement. Nous avons dans cette thèse exploré de telles possibilités en se limitant à l’apprentissage de la localisation des objets d’intérêt (ou objets saillants) dans l’environnement du robot.Pour ce faire, nous présentons dans ces travaux un mécanisme capable d’apprendre la saillance visuelle directement sur un robot, puis d’utiliser le modèle appris de la sorte pour localiser des objets saillants dans son environnement. Cette méthode a l’avantage de permettre la création de modèles spécialisés pour l’environnement du robot et les tâches qu’il doit accomplir, tout en restant flexible à d’éventuelles nouveautés ou modifications de l’environnement.De plus, afin de permettre un apprentissage efficace et de qualité, nous avons développé des stratégies d’explorations basées sur les motivations intrinsèques, très utilisées en robotique développementale. Nous avons notamment adapté l’algorithme IAC à l’apprentissage de la saillance visuelle, et en avons conçu une extension, RL-IAC, pour permettre une exploration efficace sur un robot mobile. Afin de vérifier et d’analyser les performances de nos algorithmes, nous avons réalisé des évaluations sur plusieurs plateformes robotiques dont une plateforme fovéale et un robot mobile, ainsi que sur des bases de données publiques. / Conceiving autonomous perceptual systems, such as robots able to accomplish a set of tasks in a safe way, without any human assistance, is one of the biggest challenge of the century. To this end, the developmental robotics suggests to conceive robots able to learn by interacting directly with their environment, just like children would. This thesis is exploring such possibility while restricting the problem to the one of localizing objects of interest (or salient objects) within the robot’s environment.For that, we present in this work a mechanism able to learn visual saliency directly on a robot, then to use the learned model so as to localize salient objects within their environment. The advantage of this method is the creation of models dedicated to the robot’s environment and tasks it should be asked to accomplish, while remaining flexible to any change or novelty in the environment.Furthermore, we have developed exploration strategies based on intrinsic motivations, widely used in developmental robotics, to enable efficient learning of good quality. In particular, we adapted the IAC algorithm to visual saliency leanring, and proposed an extension, RL-IAC to allow an efficient exploration on mobile robots.In order to verify and analyze the performance of our algorithms, we have carried out various experiments on several robotics platforms, including a foveated system and a mobile robot, as well as publicly available datasets.
|
50 |
Mesure sans référence de la qualité des vidéos haute définition diffusées avec des pertes de transmission / No-Reference Video Quality Assessment of High Definition Video Streams Delivered with LossesBoujut, Hugo 24 September 2012 (has links)
Les objectifs de ce travail de thèse ont été: d’une part de détecter automatique-ment les images gelées dans des vidéos télédiffusées; et d’autre part de mesurer sans référencela qualité des vidéos télédiffusées (IP et DVB-T). Ces travaux ont été effectués dans le cadred’un projet de recherche mené conjointement par le LaBRI et la société Audemat WorldCastSystems.Pour la détection d’images gelées, trois méthodes ont été proposées: MV (basée vecteurde mouvement), DC (basée sur les coefficients DC de la DCT) et SURF (basée sur les pointscaractéristiques SURF). Les deux premières méthodes ne nécessitent qu’un décodage partieldu flux vidéo.Le second objectif était de mesurer sans référence la qualité des vidéos télédiffusées (IP etDVB-T). Une métrique a été développée pour mesurer la qualité perçue lorsque le flux vidéoa été altéré par des pertes de transmission. Cette métrique "Weighted Macro-Block ErrorRate" (WMBER) est fondée sur la mesure de la saillance visuelle et la détection des macro-blocs endommagés. Le rôle de la saillance visuelle est de pondérer l’importance des erreursdétectées. Certaines améliorations ont été apportées à la construction des cartes de saillancespatio-temporelle. En particulier, la fusion des cartes de saillance spatiale et temporelle aété améliorée par rapport à l’état de l’art. Par ailleurs, plusieurs études ont montré que lasémantique d’une scène visuelle avait une influence sur le comportement du système visuelhumain. Il apparaît que ce sont surtout les visages humains qui attirent le regard. C’est laraison pour laquelle nous avons ajouté une dimension sémantique aux cartes de saillancespatio-temporelle. Cette dimension sémantique est essentiellement basée sur le détecteurde visage de Viola Jones. Pour prédire la qualité perçue par les utilisateurs, nous avonsutilisé une méthode par apprentissage supervisé. Cette méthode offre ainsi la possibilité deprédire la métrique subjective "Mean Opinion Score" (MOS) à partir de mesures objectivestelles que le WMBER, PSNR ou SSIM. Une expérience psycho-visuelle a été menée avec 50sujets pour évaluer ces travaux. Cette base de données vidéo Haute-Définition est en coursde transfert à l’action COST Qualinet. Ces travaux ont également été évalués sur une autrebase de données vidéo (en définition standard) provenant de l’IRCCyN / The goal of this Ph.D thesis is to design a no-reference video quality assessment method for lossy net-works. This Ph.D thesis is conducted in collaboration with the Audemat Worldcast Systemscompany.Our first no-reference video quality assessment indicator is the frozen frame detection.Frozen frame detection was a research topic which was well studied in the past decades.However, the challenge is to embed a frozen frame detection method in the GoldenEagleAudemat equipment. This equipment has low computation resources that not allow real-time HD video decoding. Two methods are proposed: one based on the compressed videostream motion vectors (MV-method) and another one based on the DC coefficients from thedct transform (DC-method). Both methods only require the partial decoding of the com-pressed video stream which allows for real-time analysis on the GoldenEagle equipment.The evaluation shows that results are better than the frame difference base-line method.Nevertheless, the MV and the DC methods are only suitable with for MPEG2 and H.264video streams. So a third method based on SURF points is proposed.As a second step on the way to a no-reference video quality assessment metric, we areinterested in the visual perception of transmission impairments. We propose a full-referencemetric based on saliency maps. This metric, Weighted Mean Squared Error (WMSE), is theMSE metric weighted by the saliency map. The saliency map role is to distinguish betweennoticeable and unnoticeable transmission impairments. Therefore this spatio-temporal saliencymaps is computed on the impaired frame. Thus the pixel difference in the MSE computationis emphasized or diminished with regard to the pixel saliency. According to the state of theart, several improvements are brought to the saliency map computation process. Especially,new spatio-temporal saliency map fusion strategies are designed.After our successful attempt to assess the video quality with saliency maps, we develop ano-reference quality metric. This metric, Weighted Macro-Block Error Rate (WMBER), relies on the saliency map and the macro-block error detection. The macro-block error detectionprovides the impaired macro-blocks location in the frame. However, the impaired macro-blocks are concealed with more or less success during the decoding process. So the saliencymap provides the user perceived impairment strength for each macro-block.Several psycho-visual studies have shown that semantics play an important role in visualscene perception. These studies conclude that faces and text are the most attractive. Toimprove the spatio-temporal saliency model a semantic dimension is added. This semanticsaliency is based on the Viola & Jones face detector.To predict the Mean Opinion Score (MOS) from objective metric values like WMBER,WMSE, PSNR or SSIM, we propose to use a supervised learning approach. This approach iscalled Similarity Weighted Average (SWA). Several improvements are brought to the originalSWA.For the metrics evaluation a psycho-visual experiment with 50 subjects has been carriedout. To measure the saliency map models accuracy, a psycho-visual experiment with aneye-tracker has also been carried out. These two experiments habe been conducted in col-laboration with the Ben Gurion University, Israel. WMBER and WMSE performances arecompared with reference metrics like SSIM and PSNR. The proposed metrics are also testedon a database provided by IRCCyN research laboratory.
|
Page generated in 0.0352 seconds