• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 61
  • 49
  • 9
  • 7
  • 3
  • 3
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 164
  • 28
  • 28
  • 25
  • 22
  • 20
  • 17
  • 17
  • 16
  • 16
  • 15
  • 15
  • 13
  • 13
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Exploring the Neural Correlates of Auditory Awareness / Utforskning av neurala korrelat inom auditivt medvetande

Gerdfeldter, Billy January 2018 (has links)
Neural correlates of consciousness (NCCs) represent the physiological processes related to consciousness and awareness. Consciousness is theorized as a recurrent process of integration between separate but specialized brain areas. Previous research has used electroencephalography (EEG) to locate NCCs of sensory awareness in vision through event-related potentials (ERPs). Two ERP components thought to represent visual awareness are the visual awareness negativity (VAN) and late positivity (LP). VAN and LP have been extensively studied, yet little research has been conducted in other sensory modalities. In this study, the presence of an auditory awareness negativity (AAN) and associated LP is investigated in 23 subjects using EEG. To avoid false positives in data analysis, two research hypotheses were preregistered. The results indicate that auditory LP does occur, but that AAN does not, in hypothesized intervals. However, the data suggest that AAN may occur at a later interval. Possible attributes of the later interval are discussed. In sum, the data provide results consistent with recurrent theories of sensory awareness.
82

Natural Correlations of Spectral Envelope and their Contribution to Auditory Scene Analysis

January 2017 (has links)
abstract: Auditory scene analysis (ASA) is the process through which listeners parse and organize their acoustic environment into relevant auditory objects. ASA functions by exploiting natural regularities in the structure of auditory information. The current study investigates spectral envelope and its contribution to the perception of changes in pitch and loudness. Experiment 1 constructs a perceptual continuum of twelve f0- and intensity-matched vowel phonemes (i.e. a pure timbre manipulation) and reveals spectral envelope as a primary organizational dimension. The extremes of this dimension are i (as in “bee”) and Ʌ (“bun”). Experiment 2 measures the strength of the relationship between produced f0 and the previously observed phonetic-pitch continuum at three different levels of phonemic constraint. Scat performances and, to a lesser extent, recorded interviews were found to exhibit changes in accordance with the natural regularity; specifically, f0 changes were correlated with the phoneme pitch-height continuum. The more constrained case of lyrical singing did not exhibit the natural regularity. Experiment 3 investigates participant ratings of pitch and loudness as stimuli vary in f0, intensity, and the phonetic-pitch continuum. Psychophysical functions derived from the results reveal that moving from i to Ʌ is equivalent to a .38 semitone decrease in f0 and a .75 dB decrease in intensity. Experiment 4 examines the potentially functional aspect of the pitch, loudness, and spectral envelope relationship. Detection thresholds of stimuli in which all three dimensions change congruently (f0 increase, intensity increase, Ʌ to i) or incongruently (no f0 change, intensity increase, i to Ʌ) are compared using an objective version of the method of limits. Congruent changes did not provide a detection benefit over incongruent changes; however, when the contribution of phoneme change was removed, congruent changes did offer a slight detection benefit, as in previous research. While this relationship does not offer a detection benefit at threshold, there is a natural regularity for humans to produce phonemes at higher f0s according to their relative position on the pitch height continuum. Likewise, humans have a bias to detect pitch and loudness changes in phoneme sweeps in accordance with the natural regularity. / Dissertation/Thesis / Doctoral Dissertation Psychology 2017
83

Spatialisation de sources auditives étendues : applications musicales avec la bibliothèque HOA / Extended auditory sources spatialization : Musical applications within the HOA library

Colafrancesco, Julien 28 October 2015 (has links)
Les principales techniques de spatialisation sonores sont pour la plupart orientées vers la reproduction de sources ponctuelles, l’étendue reste un sujet peu exploré. Cette thèse défend l’idée que les sources étendues sont pourtant des objets expressifs pouvant significativement contribuer à la richesse des pratiques de spatialisation, notamment en musique. Nous décomposerons cette thèse en trois hypothèses. La première, auditive, postulera que les sources étendues sont pertinentes perceptivement. C’est-à-dire qu’elles offrent la possibilité de faire varier de nouveaux attributs sonores et que l’auditeur est sensible à ces variations. La seconde, analytique, proposera que la polarisation des techniques de spatialisation les plus courantes vers la source ponctuelle n’est qu’arbitraire et que d’autres modèles de sources peuvent être considérés. La troisième, opérationnelle, suggèrera qu’il est possible de créer des outils permettant aux compositeurs de manier et de s’approprier les sources étendues à des fins musicales.Pour valider ces hypothèses, nous formaliserons les propriétés auditives et musicales de ces sources puis nous proposerons des méthodes concrètes pour les analyser et les synthétiser. Ces travaux seront considérés dans le cadre de la bibliothèque HOA, un ensemble d’outils de spatialisation de bas niveau que nous avons spécialement fondé à des fins d’expérimentations. Nous décrirons les spécificités de cette bibliothèque. Nous verrons notamment comment son architecture et ses différents modules permettent d’ouvrir l’ambisonie à de nouvelles pratiques éloignées du concept de ponctualité. / Mainstream spatialization techniques are often oriented towards the reproduction of point sources; extension remains a relatively unexplored topic. This thesis advocates that extended sources are yet expressive objects that could contribute to the richness of spatialization practices, especially in the field of music. We’ll decompose this thesis in three hypotheses. A perceptive one, who postulates that extended sources are perceptually relevant, i.e., that they offer the possibility of varying new sound attributes and that the listener is sensitive to these variations. An analytical one, who proposes that the most common spatialization techniques focus to point sources is arbitrary and that other source’s models can be considered. And an operational one, who suggests that it’s possible to create tools for composers so they can handle and musicalize extended objects. To confirm these hypotheses, we’ll formalize the auditory and musical properties of extended sources and we’ll propose concrete methods for their analysis and synthesis. This work will be considered as part of the HOA library, a set of low-level spatialization tools we’ve founded for the purpose of experimentation. We’ll describe the specificities of this library and see how its architecture and its different modules allow the generalization of ambisonics to new practices away of punctuality.
84

Les adolescents en situation de témoignage oculaire : d’observations de terrain à l’étude d’un protocole d’audition judiciaire en laboratoire / Teenagers in situation of eyewitness testimony : from field observation to the study of a laboratory judicial audition protocol

Dodier, Olivier 17 October 2017 (has links)
L’objectif de cette thèse était de fournir des recommandations aux professionnels de la justice pour recueillir la parole des adolescents, population de témoin peu étudiée en laboratoire. Pour cela, cinq études ont été conduites. Les deux premières avaient pour objectif de dresser un état des lieux des pratiques des enquêteurs français. Nous avons observé une spécificité des adolescents, notamment en ce qui concerne le recours aux suggestions d’informations. Celles-ci étaient plus fréquemment faites lorsque l’adolescent venait de développer un propos, ce qui n’était pas le cas avec des mineurs plus jeunes. Cela pourrait signifier des objectifs d’audition différents selon l’âge du mineur (Étude 1). Pourtant, les recommandations internationales déconseillent fortement l’usage des suggestions en raison des biais mémoriels qu’elles peuvent entrainer immédiatement comme de manière différée. Ensuite, nous avons montré que les adolescents sont les plus représentés parmi les mineurs témoins et/ou victimes dans les affaires françaises et qu’ils sont généralement perçus comme menteurs et pudiques par les enquêteurs (Étude 2). Une étude conduite avec des gendarmes formés aux techniques de recueil de la parole des mineurs témoins (vs. non formés ; Étude 3) a montré que ces utilisations des questions suggestives seraient dues à une croyance des enquêteurs selon laquelle les suggestions pouvaient aider le mineur à se souvenir et à rappeler des informations, mais aussi (et surtout) permettre à l’enquête d’avancer. Ceci était d’autant plus vrai pour les gendarmes non formés. Pour répondre à ces pratiques inappropriées, mais aussi aux besoins des enquêteurs, nous nous sommes intéressés à deux versions modifiées de l’entretien cognitif (ECM). En effet, ce protocole d’audition est basé sur un questionnement ouvert (plutôt que fermé ou suggestif), et propose des stratégies de récupération efficaces. En favorisant la récupération en mémoire et le rappel des informations, il pourrait alors optimiser leur fiabilité, en vue de les exploiter lors de l’enquête judiciaire. Pour cela, nous avons testé la mnémotechnique du Séquençage (Étude 4), qui a montré ses bénéfices. Nous avons en effet observé une hausse du rappel des informations correctes (vs. entretien structuré ; ES). Toutefois, celle-ci s’accompagnait d’une hausse des erreurs. Un résultat similaire a été observé en testant une version raccourcie de l’ECM pour des événements répétés dans le temps (vs. événement unique ; Étude 5). De plus, cette étude a mis en avant une hausse des affabulations avec l’ECM (comparativement à un ES, et indépendamment de la fréquence de l’événement), mais aussi des confusions entre les différents événements visionnés par une partie des adolescents. Ces augmentations des informations erronées n’entrainaient cependant, dans aucune des deux études, de chute du taux d’exactitude. Ces résultats seront discutés au regard de la littérature scientifique, et des recommandations appliquées seront formulées afin d’aider les enquêteurs à conduire au mieux leurs auditions d’adolescents témoins et/ou victimes. / The goal of this thesis was to provide recommendations to any practitioner involved in the justice system to interview adolescent witnesses and/or victims, a population little studied in laboratory analogue contexts. To do so, five studies were conducted. The first two studies were aimed at establishing an inventory of the young French investigators’ witness interview practices. We observed that adolescents are a specific population, in particular regarding the use of suggestive questions. This type of questions increased right after the adolescents had just developed a statement, which was not the case with younger children. This result might reveal that, during investigative interviews with children and adolescents, the investigators have different aims depending on the age of the young witness (Study 1). However, international recommendations strongly discourage the use of suggestions because of immediate and delayed memory biases that may occur. Secondly, we have shown that adolescents represent most of the under legal age witnesses and/or victims in French cases, and that investigators generally perceived them as liars and as easily ashamed (Study 2). A study conducted with military police officers who previously had training in the use of structured interview techniques (vs. untrained officers; Study 3) showed that their use of suggestive questions were related to the belief that suggestive prompts could help the young witness and/or victim retrieve and recall information, but also (and most importantly) allow the investigation to move forward. This was especially observed with untrained military police officers. To deal with these inappropriate practices, we investigated the efficiency of two modified versions of the cognitive interview (MCI). This interview protocol is based on an open (rather than closed or suggestive) questioning style, and proposes effective retrieval strategies. Relying on techniques that promote memory retrieval and recall of information, it could then enhance the adolescents’ statements’ reliability, for these to be used during the investigation. We therefore tested a mnemonic called ‘guided peripheral focus’ (Study 4), which showed its benefits. Indeed, we observed an increase in the recall of correct information (vs. structured interview; SI). However, this was accompanied by an increase in errors. A similar pattern was observed with a shortened version of the MCI (vs. SI) used for repeated events (vs. single event; Study 5). In addition, this last study showed an increase in confabulations with the MCI (compared to a SI, and irrespective of the frequency of the event), but also in confusions between the different events experienced by some of the adolescents. However, these increases in erroneous details did not lead to a drop in the accuracy rate in either study. The results of the five studies will be discussed in regards with the scientific literature, and recommendations to help justice practitioners conduct their adolescent witness and/or victim interviews as appropriately as possible will be provided
85

Audition et démasquage binaural chez l'homme / Binaural hearing and binaural masking release in human

Lorenzi, Antoine 14 December 2016 (has links)
Contexte : Le démasquage binaural est un processus indispensable pour la compréhension en environnement bruyant. Ce mécanisme ferait intervenir la comparaison d’indices temporels et fréquentiels tout au long des voies nerveuses auditives. Cependant, il n’existe pas de réel consensus évoquant un traitement du démasquage à un niveau sous-cortical et/ou cortical. L’objet de cette étude est d’étudier ces indices temporels et fréquentiels du démasquage par le biais d’une étude perceptive, puis d’une étude électroencéphalographique (EEG). Matériels et méthodes : Une population normoentendante a été évaluée lors d’une étude perceptive visant à estimer l’importance du démasquage en fonction de 1) la largeur fréquentielle du bruit controlatéral (de 1 octave, 3 octaves ou à large bande), 2) la cohérence temporelle des bruits bilatéraux (corrélation égale à 0 ou 1) et 3) la fréquence des stimuli cibles (0,5, 1, 2 et 4 kHz). Puis, le démasquage a été évalué en EEG par l’étude 1) des latences précoces (<10 ms, PEA-P), 2) des latences tardives (<50 ms, PEA-T) et 3) de l’onde de discordance (PEA-MMN). Pour ces trois études EEG, l’influence de la cohérence temporelle des bruits bilatéraux a été explorée.Résultats : L’étude perceptive traduit un démasquage croissant lorsque la largeur fréquentielle du bruit controlatéral augmente. L’ajout du bruit controlatéral non corrélé (corrélation=0) se traduit par une amélioration de détection de 1,28 dB, quelle que soit la fréquence des stimuli cibles (antimasquage), alors que l’ajout d’un bruit controlatéral corrélé (corrélation=1) évoque une amélioration de détection lorsque la fréquence des stimuli cibles diminue (démasquage) : 0,97 dB à 4 kHz et 9,25 dB à 0,5 kHz. En PEA-P, les latences des ondes III et V se raccourcissent lorsqu’un bruit controlatéral corrélé ou non corrélé est ajouté (≈0,1 ms). En PEA-T, les amplitudes des ondes P1, N1 et des complexes P1N1 et N1P2 augmentent lorsqu’un bruit controlatéral corrélé ou non corrélé est ajouté. Enfin, l’amplitude de la MMN est plus conséquente lorsque le bruit controlatéral ajouté est corrélé (versus non corrélé). Conclusion : L’étude perceptive explicite l’importance des indices spectraux (antimasquage) et temporels (démasquage), pour améliorer la perception d’un signal initialement masqué. L’étude EEG suggère, quant à elle, un traitement sous-cortical influencé uniquement par les indices spectraux (antimasquage) et un traitement plus cortical influencé par les indices temporels (démasquage). / Background: Binaural unmasking is an essential process for understanding in noisy environments. This mechanism would involve the comparison of time and frequency cues throughout the hearing nerve pathways. However, there is no real consensus evoking a treatment of a binaural masking release at a subcortical and/or a cortical level. The purpose of this study is to investigate the time and frequency cues of the binaural unmasking through a perceptual study, and then through an electroencephalographic study (EEG).Materials and Methods: Normal hearing people were evaluated with a perceptive study to estimate the importance of the binaural unmasking according to 1) the frequency width of the contralateral noise (1 octave, 3 octaves or broadband), 2) the temporal coherence of bilateral noises (correlation equal to 0 or 1) and 3) the frequency of the target stimuli (0.5, 1, 2 and 4 kHz). Binaural unmasking was then evaluated with EEG by studying 1) early latencies (<10 ms, PEA-P), 2) late latencies (<50 ms, PEA-T) and 3), the mismatch wave (PEA- MMN). For these three EEG studies, the influence of the temporal coherence of bilateral noise was investigated.Results: The study shows a growing perceptive binaural unmasking when the frequency width of the contralateral noise increases. The addition of an uncorrelated contralateral noise (correlation = 0) results in a 1.28 dB detection enhancement, regardless of the frequency of the target stimuli (antimasking), while adding a contralateral correlated noise (correlation = 1) refers to a detection enhancement when the frequency of the target stimuli decreases (unmasking): 0.97 dB at 4 kHz and 9.25 dB at 0.5 kHz. The latencies of waves III and V are shortened when a contralateral correlated or uncorrelated noise is added (≈0,1 ms) in the PEA-P. The amplitudes of P1, N1 waves and P1N1 and N1P2 complex increase when contralateral correlated or uncorrelated noise is added in PEA-T. Finally, the amplitude of the MMN is higher when a contralateral correlated noise is added (versus an uncorrelated one).Conclusion: The perceptual study shows the significance of spectral cues (antimasking) and temporal cues (unmasking), to improve the perception of an initially masked signal. The EEG study suggests a subcortical treatment which is only influenced by spectral cues (antimasking) and a cortical processing, influenced by temporal cues (unmasking).
86

Système d'audition artificielle embarqué optimisé pour robot mobile muni d'une matrice de microphones

Grondin, François January 2017 (has links)
Dans un environnement non contrôlé, un robot doit pouvoir interagir avec les personnes d’une façon autonome. Cette autonomie doit également inclure une interaction grâce à la voix humaine. Lorsque l’interaction s’effectue à une distance de quelques mètres, des phénomènes tels que la réverbération et la présence de bruit ambiant doivent être pris en considération pour effectuer efficacement des tâches comme la reconnaissance de la parole ou de locuteur. En ce sens, le robot doit être en mesure de localiser, suivre et séparer les sources sonores présentes dans son environnement. L’augmentation récente de la puissance de calcul des processeurs et la diminution de leur consommation énergétique permettent dorénavant d’intégrer ces systèmes d’audition articielle sur des systèmes embarqués en temps réel. L’audition robotique est un domaine relativement jeune qui compte deux principales librairies d’audition artificielle : ManyEars et HARK. Jusqu’à présent, le nombre de microphones se limite généralement à huit, en raison de l’augmentation rapide de charge de calculs lorsque des microphones supplémentaires sont ajoutés. De plus, il est parfois difficile d’utiliser ces librairies avec des robots possédant des géométries variées puisqu’il est nécessaire de les calibrer manuellement. Cette thèse présente la librairie ODAS qui apporte des solutions à ces difficultés. Afin d’effectuer une localisation et une séparation plus robuste aux matrices de microphones fermées, ODAS introduit un modèle de directivité pour chaque microphone. Une recherche hiérarchique dans l’espace permet également de réduire la quantité de calculs nécessaires. De plus, une mesure de l’incertitude du délai d’arrivée du son est introduite pour ajuster automatiquement plusieurs paramètres et ainsi éviter une calibration manuelle du système. ODAS propose également un nouveau module de suivi de sources sonores qui emploie des filtres de Kalman plutôt que des filtres particulaires. Les résultats démontrent que les méthodes proposées réduisent la quantité de fausses détections durant la localisation, améliorent la robustesse du suivi pour des sources sonores multiples et augmentent la qualité de la séparation de 2.7 dB dans le cas d’un formateur de faisceau à variance minimale. La quantité de calculs requis diminue par un facteur allant jusqu’à 4 pour la localisation et jusqu’à 30 pour le suivi par rapport à la librairie ManyEars. Le module de séparation des sources sonores exploite plus efficacement la géométrie de la matrice de microphones, sans qu’il soit nécessaire de mesurer et calibrer manuellement le système. Avec les performances observées, la librairie ODAS ouvre aussi la porte à des applications dans le domaine de la détection des drones par le bruit, la localisation de bruits extérieurs pour une navigation plus efficace pour les véhicules autonomes, des assistants main-libre à domicile et l’intégration dans des aides auditives.
87

Traitements conscient et non-conscient des régularités temporelles : Modélisation et neuroimagerie / Conscious and unconscious processing of temporal regularities : a joint modeling and experimental approach

Wacongne, Catherine 07 July 2014 (has links)
Que va-t-il arriver ensuite ? Les stimuli naturels ont tendance à se suivre d'une façon prédictible. De nombreux domaines de la psychologie et des neurosciences ont montré que le cerveau et le comportement des humains sont sensibles à la structure temporelle des stimuli sensoriels et sont capables de l'exploiter de multiples façons : pour prendre des décisions appropriées, encoder l'information de façon efficace, réagir plus vite aux événements prédictibles ou encore orienter l'attention vers les stimuli inattendus. Si de nombreuses aires cérébrales sont sensibles aux régularités temporelles (RT), toutes ne semblent pas traiter les mêmes types de structure temporelle. L'accès conscient aux stimuli semble jouer un rôle important dans la capacité à apprendre certains types de RT. Cette thèse explore l'organisation hiérarchique du traitement des RT et les propriétés computationnelles propres à leur traitement conscient et non conscient en combinant un travail de modélisation et des expériences de neuroimagerie en magnétoencéphalographie et électroencéphalographie (MEEG). Un premier modèle neuronal basé sur les principes du codage prédictif reproduit les principales propriétés du traitement préattentif des sons purs dans le cortex auditif indexé par le potentiel évoqué appelé négativité d'incongruence (MMN). Une seconde étude en MEEG met en évidence l'existence d'une hiérarchie de processus prédictifs dans le cortex auditif. Enfin, un second modèle explore les contraintes et les nouvelles propriétés computationnelles qui sont associées à l'accès conscient des stimuli à un système de mémoire de travail capable de maintenir indéfiniment un nombre limité d'objets. / What is going to happen next? Natural stimuli tend to follow each other in a reproducible way. Multiple fields of neuroscience and psychology bring evidence that human’s brain and behavior are sensitive to the temporal structure of stimuli and are able to exploit them in multiple ways: to make appropriate decisions, encode efficiently information, react faster to predictable stimuli or orient attention towards surprising ones… Multiple brain areas show sensitivity to the temporal structure of events. However, all areas do not seem to be sensitive to the same kind of temporal regularities. Conscious access to the stimuli seems to play a key role in some of these dissociations and better understanding this role could improve the current diagnostic tools for non-communicative patients. This thesis explores the hierarchical organization of the processing of temporal regularities and the computational properties of conscious and unconscious levels of processing by combining a modeling approach with neuroimaging experiments using magnetoencephalography and electroencephalography (MEEG). First, a plausible neuronal model based on predictive coding principles reproduces the main properties of the preattentive processing of pure tones in the auditory cortex indexed by the evoked potential mismatch negativity (MMN). Second, a MEEG experiment provides evidence for a hierarchical organization of multiple predictive processes in the auditory cortex. Finally, a second model explores the new computational properties and constraints associated to the access of stimuli to a conscious space with a working memory able to maintain information for an arbitrary time but with limited capacity.
88

The Impact of Global Versus Local Visual Attention on Auditory Perception

Kotynski, Anne Elizabeth January 2018 (has links)
No description available.
89

Wind Noise: Its Effect on Human Audition

Nelson, William Roy 01 May 1972 (has links)
An examination was made of the acoustic characteristics of wind turbulence generated noise in a car traveling at 70 mph over smoothly paved highway with the driver's window down. The overall noise level was found to be at 112 dB SPL with the predominance of energy in the low frequencies. The study was concerned with the effects of such noise on human audition in terms of temporary threshold shift. Twenty normal hearing young adults were exposed to a tape recording of wind noise for 15 minutes. Post-exposure auditory thresholds at seven discreet frequencies were compared to pre-exposure auditory thresholds at the same seven frequencies. Threshold shift was taken as the difference between pre-exposure and post-exposure thresholds. Post-exposure thresholds were obtained immediately after exposure and at five, ten and fifteen minutes after exposure. The results of the study indicate to significant difference in the amount of threshold shift or the rate of recover based on sex. A significant difference was observed int he amount of threshold shift at different test frequencies. The rate of recovery at different test frequencies was also significantly different. Decisions of significance were made at the .01 level of confidence. The statistical tool utilized was analysis of variance.
90

Mouvement actif pour la localisation binaurale de sources sonores en robotique / Active motion for binaural localization of sound sources in robotics

Bustamante, Gabriel 05 September 2017 (has links)
Ce travail s'inscrit dans le contexte de la localisation de source sonore depuis un capteur binaural (constitué de deux microphones placés sur un élément diffusant) doté de mobilité. Un schéma de localisation "active" en trois phases est considéré : (a) estimation de primitives spatiales par une analyse court-terme du flux audio ; (b) localisation audio-motrice par assimilation de ces données et combinaison avec les ordres moteurs du capteur au sein d'un schéma d'estimation stochastique ; (c) commande en boucle fermée du mouvement du capteur de façon à améliorer la qualité de la localisation. Les recherches portent sur la définition de stratégies de "mouvement actif" constituant la phase (c). Le problème est formulé comme la maximisation d'un critère d'information défini à partir des lois de filtrage de la position relative capteur-source sur un horizon temporel glissant dans le futur (plus exactement de son espérance sur les observations qui seront assimilées sur cet horizon conditionnellement aux observations passées). Cet horizon peut être constitué du prochain instant ou des N prochains instants, ce qui donne lieu à une stratégie "one-step-ahead" ou "N-step-ahead", respectivement. Une approximation de ce critère par utilisation de la transformée "unscented" et le calcul automatique du gradient de celle-ci par exploitation des nombres duaux, permettent la détermination de la commande (en boucle fermée sur l'audio donc) à appliquer au capteur. Les résultats ont été validés par des simulations réalistes, et, pour certains, par des expérimentations sur un ensemble tête-torse anthropomorphe doté de perception binaurale et de mobilité. / This work takes place within the field of sound source localization from a binaural sensor (consisting of two microphones placed on a diffusing element) endowed with mobility. An "active" three-phase localization scheme is considered: (a) estimation of spatial primitives by a short-term analysis of the audio stream; (B) audio-motor localizatio! n by assimilation of these data and combination with the! motor commands of the sensor within a stochastic estimation scheme; (C) closed-loop control of the movement of the sensor in order to improve the quality of the location. The research focuses on the definition of "active motion" strategies constituting phase (c). The problem is formulated as the maximization over a receding horizon of an information criterion defined from the filtering pdfs of the relative sensor-to-source position (more exactly of the maximization of its expectation on the N observations that will be assimilated on this horizon conditionally to the past observations). This horizon can consist of the next time instant or the next N time instants, what gives rise to a "one-step-ahead" or "N-step-ahead" strategy, respectively. An approximation of this criterion by using the unscented transform and the automatic calculation of its gradient by using the dual numbers allow the determination of the control (therefore, in closed loop on the audio) to be applied to the sensor. The results were validated by realistic simulations and, for some of them, by experiments on an anthropomorphic head-and-torso simulator endowed with binaural perception and mobility.

Page generated in 0.0785 seconds