Ce travail s'inscrit dans le contexte de la localisation de source sonore depuis un capteur binaural (constitué de deux microphones placés sur un élément diffusant) doté de mobilité. Un schéma de localisation "active" en trois phases est considéré : (a) estimation de primitives spatiales par une analyse court-terme du flux audio ; (b) localisation audio-motrice par assimilation de ces données et combinaison avec les ordres moteurs du capteur au sein d'un schéma d'estimation stochastique ; (c) commande en boucle fermée du mouvement du capteur de façon à améliorer la qualité de la localisation. Les recherches portent sur la définition de stratégies de "mouvement actif" constituant la phase (c). Le problème est formulé comme la maximisation d'un critère d'information défini à partir des lois de filtrage de la position relative capteur-source sur un horizon temporel glissant dans le futur (plus exactement de son espérance sur les observations qui seront assimilées sur cet horizon conditionnellement aux observations passées). Cet horizon peut être constitué du prochain instant ou des N prochains instants, ce qui donne lieu à une stratégie "one-step-ahead" ou "N-step-ahead", respectivement. Une approximation de ce critère par utilisation de la transformée "unscented" et le calcul automatique du gradient de celle-ci par exploitation des nombres duaux, permettent la détermination de la commande (en boucle fermée sur l'audio donc) à appliquer au capteur. Les résultats ont été validés par des simulations réalistes, et, pour certains, par des expérimentations sur un ensemble tête-torse anthropomorphe doté de perception binaurale et de mobilité. / This work takes place within the field of sound source localization from a binaural sensor (consisting of two microphones placed on a diffusing element) endowed with mobility. An "active" three-phase localization scheme is considered: (a) estimation of spatial primitives by a short-term analysis of the audio stream; (B) audio-motor localizatio! n by assimilation of these data and combination with the! motor commands of the sensor within a stochastic estimation scheme; (C) closed-loop control of the movement of the sensor in order to improve the quality of the location. The research focuses on the definition of "active motion" strategies constituting phase (c). The problem is formulated as the maximization over a receding horizon of an information criterion defined from the filtering pdfs of the relative sensor-to-source position (more exactly of the maximization of its expectation on the N observations that will be assimilated on this horizon conditionally to the past observations). This horizon can consist of the next time instant or the next N time instants, what gives rise to a "one-step-ahead" or "N-step-ahead" strategy, respectively. An approximation of this criterion by using the unscented transform and the automatic calculation of its gradient by using the dual numbers allow the determination of the control (therefore, in closed loop on the audio) to be applied to the sensor. The results were validated by realistic simulations and, for some of them, by experiments on an anthropomorphic head-and-torso simulator endowed with binaural perception and mobility.
Identifer | oai:union.ndltd.org:theses.fr/2017TOU30211 |
Date | 05 September 2017 |
Creators | Bustamante, Gabriel |
Contributors | Toulouse 3, Danès, Patrick |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0026 seconds