Spelling suggestions: "subject:"perception sonora""
1 |
Perception du bruit extérieur d'un véhicule urbain de livraisonGeissner, Emilie 12 December 2006 (has links) (PDF)
Le but de cette étude était de mettre en évidence les évènements les plus désagréables lors de l'utilisation d'un véhicule urbain de livraison. Plus précisément, il s'agissait d'appliquer une méthode d'évaluation psycho-physique, la méthode d'évaluation continue analogique catégorielle, à l'évaluation du désagrément d'une séquence sonore de longue durée. Cette méthode consiste à demander à l'auditeur de déplacer un curseur coulissant continûment le long d'une échelle sur laquelle cinq catégories sont indiquées afin que la position du curseur représente à chaque instant sa perception. Dans une première partie, l'utilisation de la méthode pour l'évaluation d'un caractère complexe, le désagrément, a été validée sur des séquences sonores de synthèse. Dans une seconde partie, elle a été utilisée pour l'évaluation d'une séquence sonore réelle de livraison. En parallèle, une analyse des verbalisations libres des auditeurs a permis d'identifier des caractères sonores responsables de ce désagrément et de valider, en terme de désagrément, les résultats issus de l'évaluation continue. Deux autres applications ont été réalisées : la première étudiait l'influence de la boîte de vitesses (manuelle ou automatique) sur la perception du bruit en accélération d'un véhicule au démarrage. La seconde s'intéressait à la perception d'une séquence de livraison telle qu'un riverain peut l'entendre chez lui et non plus en extérieur. Dans une dernière partie, une expérience complémentaire a été menée pour mettre en évidence le lien entre évaluation continue et jugements globaux de la séquence de livraison.
|
2 |
Diagnostic et évaluation automatique de la qualité vocale à partir d'indicateurs hybrideLeman, Adrien 07 June 2011 (has links) (PDF)
Les opérateurs de télécommunications ont besoin de superviser en temps réel la qualité vocale des services qu'ils proposent. La qualité vocale peut être évaluée par tests subjectifs auprès d'utilisateurs; mais ces méthodes sont très coûteuses et peu adaptées à la supervision. Des modèles objectifs sont ainsi proposés afin de prédire la qualité vocale à moindre coût. Cette thèse propose un modèle de diagnostic et d'évaluation utilisant les informations disponibles au point de mesure : le modèle DESQHI (Diagnostic and Speech Quality using Hybrid Indicators). Il se distingue des modèles existants par deux caractéristiques principales. La première concerne la structure du cœur du modèle. Il est montré que la qualité vocale peut être représentée comme un phénomène multidimensionnel faisant intervenir trois dimensions perceptives correspondant à bruyance, codage de la parole et continuité. Cette structure permet de diagnostiquer la qualité vocale en identifiant les principales causes perceptives de sa dégradation. La deuxième caractéristique concerne le type d'indicateur utilisé pour représenter ces dimensions perceptives, à savoir l'utilisation d'indicateurs basés sur le signal et paramétriques. Les indicateurs basés sur le signal utilisent les informations numériques pour représenter les caractéristiques du signal (par exemple le rapport signal sur bruit qui donne une estimation du niveau sonore du bruit de fond). Les indicateurs paramétriques sont issus des statistiques du réseau (par exemple le pourcentage de pertes de paquets qui fournit une indication sur le niveau de discontinuité du signal de parole). L'utilisation d'indicateurs hybrides utilisant à la fois les informations du signal numérique et les statistiques du réseau permet d'améliorer les performances globales de la prédiction de la qualité vocale, comparativement aux modèles uniquement basés sur le signal (p. ex. modèle P.563) et aux modèles utilisant les indicateurs paramétriques (p. ex. modèle E).
|
3 |
Diffusion de son 3D par synthèse de champs acoustiques binauraux / 3D sound rendering with binaural fields synthesisVidal, Adrien 03 February 2017 (has links)
Ces travaux de thèse concernent la conception d’un dispositif de restitution sonore léger en salle usuelle, permettant la diffusion de signaux binauraux. La priorité du travail est la précision dans la reproduction du niveau et du timbre, avant la spatialisation du son. Afin d’assurer la compatibilité avec les signaux binauraux existants et pour proposer un système à faible nombre de canaux, la technologie transaurale est prise comme point de départ. Pour limiter la coloration introduite par la salle d’écoute, particulièrement gênante, il est proposé de placer les sources du système à proximité de l’auditeur afin de maximiser le rapport champ direct sur champ diffus. Ce placement inhabituel a plusieurs effets, parmi lesquels quatre ont été étudiés séparément : l’influence des filtres transauraux sur les sources électro-acoustiques, les variations inter-individuelles de morphologies, l’effet de salle et le placement de l’auditeur. Des tests d’écoute ont été réalisés pour une sélection de configurations, et les résultats ont permis d’implémenter des indicateurs objectifs représentatifs des réponses des auditeurs. La synthèse de ces indicateurs a permis de proposer trois configurations considérées comme optimales, et dont la combinaison pourrait être envisagée. / This work deals with the design of a 3D sound system involving a few number of loudspeaker and able to work inside any usual room, for reproducing binaural sounds. This system focuses on an accurate reproduction of perceived level and timbre, even before the sound spatialization. To ensure compatibility with binaural recordings and to achieve a system with a low number of loudspeakers, this work started from a transaural system. To avoid tone coloration induced by the listening room, the sound sources are placed close to the listener, thus maximizing the energy ratio between direct and diffuse fields. This has consequences on other aspects, four of which are considered separately: inter-individual morphological variations, demands on the electro-acoustic sources, room effect and misalignment of the listener. Some configurations have been evaluated in listening tests, and objective indicators are deduced from these results. The generalization allows to propose three configurations considered as optimal, and which might be combined.
|
4 |
Diagnostic et évaluation automatique de la qualité vocale à partir d'indicateurs hybride / Automatic speech quality evaluation and diagnostic from hybrid indicatorsLeman, Adrien 07 June 2011 (has links)
Les opérateurs de télécommunications ont besoin de superviser en temps réel la qualité vocale des services qu'ils proposent. La qualité vocale peut être évaluée par tests subjectifs auprès d'utilisateurs; mais ces méthodes sont très coûteuses et peu adaptées à la supervision. Des modèles objectifs sont ainsi proposés afin de prédire la qualité vocale à moindre coût. Cette thèse propose un modèle de diagnostic et d’évaluation utilisant les informations disponibles au point de mesure : le modèle DESQHI (Diagnostic and Speech Quality using Hybrid Indicators). Il se distingue des modèles existants par deux caractéristiques principales. La première concerne la structure du cœur du modèle. Il est montré que la qualité vocale peut être représentée comme un phénomène multidimensionnel faisant intervenir trois dimensions perceptives correspondant à bruyance, codage de la parole et continuité. Cette structure permet de diagnostiquer la qualité vocale en identifiant les principales causes perceptives de sa dégradation. La deuxième caractéristique concerne le type d’indicateur utilisé pour représenter ces dimensions perceptives, à savoir l’utilisation d’indicateurs basés sur le signal et paramétriques. Les indicateurs basés sur le signal utilisent les informations numériques pour représenter les caractéristiques du signal (par exemple le rapport signal sur bruit qui donne une estimation du niveau sonore du bruit de fond). Les indicateurs paramétriques sont issus des statistiques du réseau (par exemple le pourcentage de pertes de paquets qui fournit une indication sur le niveau de discontinuité du signal de parole). L’utilisation d’indicateurs hybrides utilisant à la fois les informations du signal numérique et les statistiques du réseau permet d’améliorer les performances globales de la prédiction de la qualité vocale, comparativement aux modèles uniquement basés sur le signal (p. ex. modèle P.563) et aux modèles utilisant les indicateurs paramétriques (p. ex. modèle E). / With increasing development of new technologies (RTC, RNIS, GSM, VoIP), tele-communication services are becoming more and more diversified. To this end, telecommunication operators need to supervise in real-time the speech quality of the services they offer. Speech quality is usually evaluated from subjective experiments.. Nevertheless, such experiments are time consuming and do not allow any supervisory control. So, accurate objective models are useful to estimate the speech quality.This thesis proposes a non-intrusive model for diagnosing and evaluating speech quality using information available at the measurement point: the DESQHI model (Diagnostic and Evaluation of Speech Quality using Hybrid Indicators). It differs from existing models in terms in two main characteristics. The first one concerns the structure of the model. It is shown that speech quality can be represented as a multidimensional phenomenon incorporating three perceptual dimensions related to noisiness, speech codec and continuity. This multidimensional structure allows for a diagnostic of speech quality based on identifying the principal features affecting speech qual-ity. The second characteristic concerns the nature of indicators (signal-based and parametric) used to represent the three perceptual dimensions. Signal-based indicators use numeric information to represent the characteristics of the signal, for example, the loudness of the speech signal. Parametric indicators are obtained from the network statistics, for example, the percentage of packet loss, which gives information about the level of the discontinuity in the speech signal. This work proposes hybrid indicators (using both signal-based and parametric metrics). It is shown that they are better speech quality predictors than existing models, either parametric only (e.g. ITU-T Recommendation G.107, also known as the E-model) or signal-based only (e.g. ITU-T Recommendation P.563 model).
|
5 |
Différences entre enceintes acoustiques : une évaluation physique et perceptiveLavandier, Mathieu 19 December 2005 (has links) (PDF)
Cette étude vise à relier les évaluations physiques et perceptives de différences de restitution du timbre par des enceintes acoustiques. Notre protocole expérimental consiste à enregistrer le champ acoustique rayonné par des enceintes dans une pièce. Ces enregistrements sont soumis à des tests d'écoute au casque, ainsi qu'à des analyses de signal. Les dissemblances objectives et perceptives obtenues sont comparées. La corrélation entre dissemblances est d'abord calculée. Nous abandonnons ensuite le critère de linéarité et prenons en compte le caractère multidimensionnel de notre perception de la reproduction sonore : les deux types de dissemblances sont soumis à une analyse multidimensionnelle, et les espaces obtenus sont comparés visuellement. Nos résultats montrent l'importance d'utiliser des modèles auditifs afin de différencier les signaux d'une manière analogue à celle des auditeurs. Des attributs objectifs décrivant deux des dimensions principales impliquées sont proposés.
|
6 |
Acoustique des salles dans les lieux d'écoute de la musique : analyse perceptive et acoustique dans les contextes réels et virtuels. / Acoustics of auditoria designed for listening to music : perceptual and acoustical analysis in real and virtual contextsEspitia Hurtado, Juan Pablo 02 February 2016 (has links)
L'objectif général de cette thèse est de contribuer à l'exploration de la qualité sonore des salles de concert à partir d'une approche centrée sur l'identification de l'expérience sensible des mélomanes. Nous montrons d'abord les limites de l'approche traditionnelle de l'évaluation perceptive, principalement centrée sur des attributs reliés à la salle ou à la musique, et définis a priori à partir des connaissances des expérimentateurs, le plus souvent acousticiens, dans les termes de leur domaine scientifique ou avec des mots dont ils pensent partager avec les sujets les mêmes significations. Puis, reprenant les trois méthodes d'exploration de l'expérience subjective -enquêtes "hors situation d'écoute" (basées sur la mémoire), questionnaires dans les salles lors de concerts, et tests d'écoute en laboratoire-, nous les avons implémentées, mais dans un cadre théorique et méthodologique explicitement positionné en psychologie et en linguistique sur l'étude du sensible comme objet psychologique autonome. De plus, pour notre approche expérimentale en laboratoire, nous avons implémenté un système de décodage paramétrique basé sur le système SIRR (spatial impulse response rendering), permettant la reproduction de champs sonores à partir de réponses impulsionnelles des salles mesurées au format Ambisonics de premier ordre. La contribution de ce travail consiste à repérer les facteurs psychologiques reliés à l'écoute d'un concert dans une salle à partir de l'objectivation de l'expérience subjective des mélomanes et de leur évaluation de la qualité acoustique de la salle, et à partir de là, établir des relations avec les mesures acoustiques des salles étudiées. / The general purpose of this thesis is to explore the sound quality of concert halls by approaching it through the listeners’ sensory experience. We first show the limitations of the traditional approach to perceptual evaluation, principally centred on attributes related to hall or music, from the knowledge of experimenters, usually acousticians, and therefore pre-defined by their scientific field, or in common language they believe is shared by the subjects in terms of use and equivalence of meaning. Then, re-using the three methods for exploring subjective experience –extra-auditory enquiries “from memory”, questionnaire surveys within auditoria for given concerts, and laboratory listening tests–, we have implemented them, but within a theoretical and methodological framework, explicitly rooted in psychology and linguistics, and respecting sensibility as an autonomous psychological object of study. Furthermore, in our experimental laboratory approach, we have implemented a parametric decoding system based on SIRR (spatial impulse response rendering), and permitting the reproduction of sound fields from first-order Ambisonics room impulse responses. The contribution of this work thus consists in identifying the psychological factors related to concert listening in a hall by objectivising the subjective experience of listeners (music-lovers) and their evaluation of the acoustic qualities of an auditorium; and in establishing relationships between the psychological factors and the acoustic measurements in the studied auditoria.
|
7 |
Caractérisation acoustique et perceptive du bruit moteur dans un habitacle automobileSciabica, Jean-Francois 19 September 2011 (has links)
L’ambiance sonore dans l’habitacle tend à être mieux maitrisée grâce au progrès de l’isolation et à l’introduction de motorisations plus silencieuses. Dans le cas des véhicules thermiques, il est désormais possible de modifier ou d’ajouter des organes au moteur pour rendre sa sonorité plus expressive et améliorer ainsi la sensation d’accélération. La synthèse sonore permet de simuler ces différents réglages du moteur et d’étudier leur ressenti. Pour être simple et efficace, cette synthèse doit donc répondre aux attentes des concepteurs sonores, par exemple donner une sonorité sportive au moteur.Le bruit dans l’habitacle est un bruit complexe puisque son timbre varie avec la dynamique du véhicule. Sa description perceptive est connue, notamment par l’emploi d’onomatopées (« ON », « AN » et « REU »), mais la caractérisation des ces descripteurs demeurent incomplètes. Il est donc difficile de manipuler les paramètres du signal lors de la synthèse pour reproduire ces attributs perceptifs dans les sons créés. Notre but est de proposer une nouvelle synthèse pour établir ce lien manquant entre perception et signal.Une expérience en simulateur de conduite étudie tout d’abord le couplage entre le ressenti acoustique et le ressenti dynamique du véhicule. Ensuite, nous cherchons à établir le lien entre la perception du bruit moteur et la synthèse par l’utilisation d’imitations vocales du bruit moteur reprenant les onomatopées « ON » et « AN ». Une modélisation du bruit dans l’habitacle est ainsi construite en s’inspirant d’un modèle source/filtre, puis testée dans deux expériences en laboratoire acoustique. Le bruit moteur peut alors être « métaphoriquement » assimilé aux cordes vocales du véhicule tandis que les résonances de l’habitacle sont considérées comme le conduit vocal. / Automotive acoustics is living a new challenge due to the introduction of new power-trains. Therefore, interior car noise is being well designed, offering new perspectives in terms of sound ambiance. The interior car noise for combustion engine cars can be modified in order to increase the comfort by producing the impression of a quiet car, or oppositely, by rendering it more expressive, the driver feels better the dynamics of the car. Currently, these sensations are produced by modifying the engine components. But a very interesting alternative is presented by sound synthesis, which gives a new dimension to sound conception. Perceptive studies and synthesis control contributes to develop this technology. Engine noise is a complex noise with a timbre varying with car dynamics, and it can be described using perceptual descriptors, like onomatopoeia (“ON”, “AN” and “REU”). However, the use of perceptive descriptors does not allow finding the link between them and the physical characteristics of engine sound, therefore there they are difficult to integrate in sound synthesis. The goal of this research is to produce a sound synthesis based on human sound perception and car dynamics. A first study was developed on a driving simulator in order to describe the relation between acoustic perception and motion perception. The next step was to establish the link between perception and synthesis by vocal imitation based on onomatopoeia “ON” and “AN” reproducing engine noise. Based on these results, a subtractive synthesis of interior car noise was further built, inspired by a source/filter model. Last, but not least, we tested the impact of engine noise and car interior resonance in two experiments in acoustic laboratory. Engine noise can be metaphorically considered as the car “vocal chords”, while the resonance of the interior of the vehicle can be considered as its “vocal tract”.
|
8 |
Rôle de la ségrégation séquentielle pour la séparation de voix concurrentesGaudrain, Etienne 10 April 2008 (has links) (PDF)
La ségrégation séquentielle n'a été que très peu étudiée avec des signaux de parole et il est donc difficile d'évaluer l'implication de ce mécanisme dans la séparation de voix concurrentes. Il est aussi difficile d'identifier les indices qui sont pertinents pour la séparation de signaux de parole, ces indices ayant surtout été étudiés isolément à l'aide de signaux très simples. L'objet de cette thèse est d'étudier les indices perceptifs impliqués dans la ségrégation séquentielle de voyelles différant par leur hauteur fondamentale. Les investigations menées montrent que les indices spectraux de hauteur jouent un rôle dans ce phénomène. En revanche, la périodicité de l'enveloppe temporelle ne semble pas constituer un indice de hauteur exploitable dans le cas de la parole. Enfin, il semble que la capacité des sujets à percevoir ces deux types d'indices ne permette pas d'expliquer l'ensemble des variations de performances des sujets dans une tâche de ségrégation séquentielle de voyelles.
|
9 |
Représentation et perception des espaces auditifs virtuelsNicol, Rozenn 30 June 2010 (has links) (PDF)
Un espace auditif virtuel (par référence à l'acronyme anglais VAS pour Virtual Auditory Space) est une scène sonore virtuelle constituée d'un ensemble de sources sonores qui n'existent que dans l'espace perceptif de l'auditeur. Cet espace est généré au moyen des technologies de spatialisation sonore (telles que : stéréophonie, technologie binaurale, Wave Field Synthesis ou Higher Order Ambisonics) qui reposent sur des modèles de représentation de la scène sonore. La modélisation est le premier aspect à étudier et concerne notamment les étapes de la captation et de la restitution de l'information spatiale. La notion de format audio spatialeé (et par la même les questions de conversion de format et de compression) est implicite. A l'autre extrémité se situe la perception de l'espace ainsi généré pour évaluer comment l'auditeur perçoit les sources sonores virtuelles. Ce mémoire ouvre une réflexion sur ces différentes problèmatiques. En complément d'un état des lieux des connaissances actuelles, deux questions sont traitées en détails. La première question porte sur les technologies de spatialisation multi haut-parleurs en se focalisant sur les technologies Wave Field Synthesis (WFS) et Higher Order Ambisonics (HOA). Il est montré quel(s) système(s) concret(s) peuvent être mis en oeuvre à partir des équations théoriques. Grâce à un formalisme unifié les convergences entre les deux technologies sont mises en évidence, pour ouvrir sur une évaluation comparée. La seconde question concerne l'application de la spatialisation sonore à des terminaux individuels (c'est à dire mono auditeur) et portables, impliquant de façon préférentielle un rendu sur casque. Il s'agit du domaine de la technologie binaurale qui consiste à reproduire les signaux acoustiques à l'entrée des conduits auditifs. Cette technologie repose principalement sur la reproduction des indices de localisation qui résultent de l'interaction des ondes acoustiques avec le corps de l'auditeur et sont par la même fortement individuels. Il est décrit comment modéliser ces indices (notamment les informations temporelles correspondant à l'Interaural Time Difference ou ITD et les informations spectrales associées aux Indices Spectraux ou IS) et comment individualiser cette modélisation.
|
10 |
Évaluation subjective de la qualité : proposition d'un système de référence pour les codecs en bande élargie / Subjective quality assessment : proposal of a reference system for Wideband codecsZango, Tiraogo Abdoulaye Yves 06 February 2013 (has links)
L'évolution des systèmes de télécommunications conduit à la conception de codecs de la parole et du son de plus en plus sophistiqués, accroissant ainsi la concurrence de l'industrie de l'audio et accordant une importance grandissante à la qualité de service. Si l'évaluation de la qualité des codecs peut s'opérer suivant des mesures objectives ou subjectives, les secondes restent les plus fiables dans la mesure où la qualité perçue par les utilisateurs est intrinsèquement subjective. Toutefois, les tests subjectifs requièrent des signaux d'ancrage, i.e. des signaux artificiels visant la reproduction des défauts perceptifs des codecs de sorte que les dégradations provoquées soient aisément contrôlables. Le système de référence actuellement normalisé par l'Union Internationale des Télécommunications est le MNRU (Modulated Noise Reference Unit) qui simule le bruit de quantification introduit par les premiers codecs en forme d'onde. L'évolution de la technologie rend aujourd'hui ce système obsolète, et il s'agit donc de concevoir un nouveau système d'ancrage plus adapté aux codecs actuels. En considérant la qualité audio comme un objet multidimensionnel, nous avons mis en évidence un espace perceptif à quatre dimensions, et ce à partir de deux approches de réduction de dimensionnalité, l'AFM (Analyse Factorielle Multiple) et la MDS 3–voies (MultiDimensional Scaling). A partir des quatre dimensions identifiées – « Réduction de la largeur de bande », « Bruit de fond », « Écho/Réverbération » et « Distorsion de la parole » –, nous avons modélisé puis validé les signaux d'ancrage des trois premières dimensions et proposé deux modèles de signaux d'ancrage pour la quatrième. / The evolution of technology led to the design of very sophisticated speech and audio codecs. Accordingly, the competition in audio devices manufacturing has increased and today the quality of service becomes crucial for telecommunications operators. Quality of codecs is assessed through objective and subjective measures, the second ones being the most reliable since the quality perceived by users is inherently subjective. Nevertheless, subjective tests require anchor signals corresponding to artificial signals, which reproduce the perceptual impairments of codecs in such a manner that the amount of degradation can be easily controlled. The reference system currently standardized by the International Telecommunication Union is the Modulated Noise Reference Unit (MNRU), which simulates the quantization noise of the first generation of waveform codecs. Due to the evolution of codecs, the MNRU system became obsolete and researchers aim at designing a new reference system of anchor signals more suited to current codecs. Assuming that speech and audio quality is multidimensional, we first identified four perceptual dimensions using two dimensionality reduction techniques – the MFA (Multiple Factor Analysis) and the 3–way MDS (MultiDimensional Scaling). From the identified dimensions, namely “Bandwidth limitation”, “Background noise”, “Echo/Reverberation” and “Speech distortion”, we succeeded in modeling and validating anchor signals for three of them and we suggested two models of anchor signals for the last one.
|
Page generated in 0.0795 seconds