• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • Tagged with
  • 4
  • 4
  • 4
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Influence des dispersions de structure sur la perception sonore

Koehl, Vincent 06 December 2005 (has links) (PDF)
Les dispersions affectant les structures fabriquées en série génèrent d'importants écarts de comportement entre des objets nominalement identiques. D'un point de vue vibro-acoustique, cette variabilité a été observée, quantifiée et ses origines ont même pu être identifiées et localisées sur certaines structures simples. Mais les effets de cette variabilité sur la perception du son émis par l'objet sont encore peu connus. Ce travail porte sur l'évaluation des effets des dispersions de structure sur l'identité sonore. Le son est aujourd'hui, à l'instar de n'importe quel composant du produit, conçu pour répondre aux attentes du client. Il se peut ainsi que l'identité sonore, résultat de cette phase de design sonore, soit elle aussi sujette à d'importantes variabilités. Dans un premier temps, la stabilité de descripteurs perceptifs utilisés classiquement pour décrire la perception de bruit intérieur d'automobiles a été évaluée sur un panel de véhicules dont les dispersions n'ont pas été contrôlées. L'évolution de l'identité sonore a ainsi été observée sur une population de produits. Puis l'étude s'est concentrée sur un système simple dont plusieurs caractéristiques physiques peuvent être finement contrôlées. Nous avons montré que la démarche par plan d'expérience fractionnaire peut être utilisée pour mesurer la contribution des facteurs et de leurs éventuelles interactions à la perception du bruit de ce système. Cette démarche a ensuite été utilisée pour un second cas, pour lequel les sons étaient synthétisés. Différentes analyses perceptives ont été menées (mesure de la similarité des objets dispersés par rapport à l'objet de référence et catégorisation libre des sons de synthèse), dont les résultats concordants ont permis de mettre en évidence les facteurs les plus influents. Cependant, une dernière expérience a montré que, malgré les dispersions pouvant affecter ces facteurs, des différences d'identité sonore peuvent être perçues sur un panel d'objets identiques mais ne conduisent pas à des confusions avec des objets nominalement différents.
2

Diagnostic et évaluation automatique de la qualité vocale à partir d'indicateurs hybride

Leman, Adrien 07 June 2011 (has links) (PDF)
Les opérateurs de télécommunications ont besoin de superviser en temps réel la qualité vocale des services qu'ils proposent. La qualité vocale peut être évaluée par tests subjectifs auprès d'utilisateurs; mais ces méthodes sont très coûteuses et peu adaptées à la supervision. Des modèles objectifs sont ainsi proposés afin de prédire la qualité vocale à moindre coût. Cette thèse propose un modèle de diagnostic et d'évaluation utilisant les informations disponibles au point de mesure : le modèle DESQHI (Diagnostic and Speech Quality using Hybrid Indicators). Il se distingue des modèles existants par deux caractéristiques principales. La première concerne la structure du cœur du modèle. Il est montré que la qualité vocale peut être représentée comme un phénomène multidimensionnel faisant intervenir trois dimensions perceptives correspondant à bruyance, codage de la parole et continuité. Cette structure permet de diagnostiquer la qualité vocale en identifiant les principales causes perceptives de sa dégradation. La deuxième caractéristique concerne le type d'indicateur utilisé pour représenter ces dimensions perceptives, à savoir l'utilisation d'indicateurs basés sur le signal et paramétriques. Les indicateurs basés sur le signal utilisent les informations numériques pour représenter les caractéristiques du signal (par exemple le rapport signal sur bruit qui donne une estimation du niveau sonore du bruit de fond). Les indicateurs paramétriques sont issus des statistiques du réseau (par exemple le pourcentage de pertes de paquets qui fournit une indication sur le niveau de discontinuité du signal de parole). L'utilisation d'indicateurs hybrides utilisant à la fois les informations du signal numérique et les statistiques du réseau permet d'améliorer les performances globales de la prédiction de la qualité vocale, comparativement aux modèles uniquement basés sur le signal (p. ex. modèle P.563) et aux modèles utilisant les indicateurs paramétriques (p. ex. modèle E).
3

Diagnostic et évaluation automatique de la qualité vocale à partir d'indicateurs hybride / Automatic speech quality evaluation and diagnostic from hybrid indicators

Leman, Adrien 07 June 2011 (has links)
Les opérateurs de télécommunications ont besoin de superviser en temps réel la qualité vocale des services qu'ils proposent. La qualité vocale peut être évaluée par tests subjectifs auprès d'utilisateurs; mais ces méthodes sont très coûteuses et peu adaptées à la supervision. Des modèles objectifs sont ainsi proposés afin de prédire la qualité vocale à moindre coût. Cette thèse propose un modèle de diagnostic et d’évaluation utilisant les informations disponibles au point de mesure : le modèle DESQHI (Diagnostic and Speech Quality using Hybrid Indicators). Il se distingue des modèles existants par deux caractéristiques principales. La première concerne la structure du cœur du modèle. Il est montré que la qualité vocale peut être représentée comme un phénomène multidimensionnel faisant intervenir trois dimensions perceptives correspondant à bruyance, codage de la parole et continuité. Cette structure permet de diagnostiquer la qualité vocale en identifiant les principales causes perceptives de sa dégradation. La deuxième caractéristique concerne le type d’indicateur utilisé pour représenter ces dimensions perceptives, à savoir l’utilisation d’indicateurs basés sur le signal et paramétriques. Les indicateurs basés sur le signal utilisent les informations numériques pour représenter les caractéristiques du signal (par exemple le rapport signal sur bruit qui donne une estimation du niveau sonore du bruit de fond). Les indicateurs paramétriques sont issus des statistiques du réseau (par exemple le pourcentage de pertes de paquets qui fournit une indication sur le niveau de discontinuité du signal de parole). L’utilisation d’indicateurs hybrides utilisant à la fois les informations du signal numérique et les statistiques du réseau permet d’améliorer les performances globales de la prédiction de la qualité vocale, comparativement aux modèles uniquement basés sur le signal (p. ex. modèle P.563) et aux modèles utilisant les indicateurs paramétriques (p. ex. modèle E). / With increasing development of new technologies (RTC, RNIS, GSM, VoIP), tele-communication services are becoming more and more diversified. To this end, telecommunication operators need to supervise in real-time the speech quality of the services they offer. Speech quality is usually evaluated from subjective experiments.. Nevertheless, such experiments are time consuming and do not allow any supervisory control. So, accurate objective models are useful to estimate the speech quality.This thesis proposes a non-intrusive model for diagnosing and evaluating speech quality using information available at the measurement point: the DESQHI model (Diagnostic and Evaluation of Speech Quality using Hybrid Indicators). It differs from existing models in terms in two main characteristics. The first one concerns the structure of the model. It is shown that speech quality can be represented as a multidimensional phenomenon incorporating three perceptual dimensions related to noisiness, speech codec and continuity. This multidimensional structure allows for a diagnostic of speech quality based on identifying the principal features affecting speech qual-ity. The second characteristic concerns the nature of indicators (signal-based and parametric) used to represent the three perceptual dimensions. Signal-based indicators use numeric information to represent the characteristics of the signal, for example, the loudness of the speech signal. Parametric indicators are obtained from the network statistics, for example, the percentage of packet loss, which gives information about the level of the discontinuity in the speech signal. This work proposes hybrid indicators (using both signal-based and parametric metrics). It is shown that they are better speech quality predictors than existing models, either parametric only (e.g. ITU-T Recommendation G.107, also known as the E-model) or signal-based only (e.g. ITU-T Recommendation P.563 model).
4

Sonie de champs acoustiques stationnaires en situation d'écoute dichotique / Loudness of stationary sound fields in dichotic listening situations

Vannier, Michaël 11 May 2015 (has links)
Dans un environnement naturel, le champ acoustique est complexe (plusieurs sources, différentes positions spatiales, acoustique du lieu,...) et l'écoute est binaurale. Le filtrage acoustique opéré par la tête, le buste et les pavillons de l'auditeur (dépendant de la direction) induit donc systématiquement des différences interaurales de temps, de niveau et de spectre. Des modèles de sonie existent et permettent de prédire la sonie des sons stationnaires dans des situations d'écoute simples (ISO-532B (1975), DIN-45631 (1990), ANSI-S3.4 (2007)). L'écoute doit être monaurale (une seule oreille) ou diotique (même son aux deux oreilles), correspondant à une source en incidence frontale en champ libre, ou en champ diffus. En revanche, ces modèles échouent pour prédire la sonie lorsque des différences interaurales importantes interviennent. La thèse s’est ainsi intéressée à la sonie des champs acoustiques stationnaires, impliquant une ou plusieurs sources, soit artificielles et spatialisées en champ libre, soit réelles dans une acoustique naturelle. De nouveaux éléments ont été apportés dans la compréhension dont l'information contenue dans les signaux reçus aux oreilles de l’auditeur est combinée pour former un unique percept de sonie binaurale dans les situations d’écoute dichotiques (gain de sommation binaural, cas de plusieurs sources, effet de la corrélation interaurale,…). D’une part, une hypothèse pour essayer d’expliquer les différences interindividuelles observées dans les stratégies de sommation binaurales a pu être testée ; la robustesse et la stabilité au cours du temps de ces stratégies individuelles a été mise en avant. D’autre part, trois principaux modèles psychophysiques de sonie binaurale (ANSI-S3.4 (2007), Moore et Glasberg (2007), Sivonen et Ellermeier (2008)) ont été testés sur l’ensemble des données expérimentales (impliquant différents niveaux de réalisme), permettant de préciser la performance et les domaines de validité respectifs de chacun de ces modèles dans des situations d’écoute fortement dichotiques. / Listening in a natural environment implies to consider complex sound fields (several sound sources, different spatial positions, reflections…) and a binaural listening configuration. As a consequence, differences in time, level and spectrum between the two at-ear signals are systematically induced by the direction-dependant physical filtering from the human head, torso and pinnae. Existing loudness models provide accurate predictions under simplified listening situations (ISO-532B (1975), DIN-45631 (1990), ANSI-S3.4 (2007)). These models have been designed to use monaural (only one ear) or diotic (same signal at the two ears) signals, equivalent to one sound source with a frontal incidence, in a free or diffuse field. However, the models fail to predict loudness when the interaural differences are large. The present document focuses on the loudness of stationary sound fields, made up of one or several, artificial or real sound sources, in a free field or in a real environment. New elements have been brought to light regarding how, in a dichotic listening situation, information is combined from the two ears to produce one unique binaural loudness percept (binaural gain, case of several sound sources, effect of interaural correlation,...). On the one hand, one hypothesis have been tested in order to try to explain the interindividual differences observed in binaural loudness summation ; the robustness and stability over time of these individual strategies have been highlighted. On the other hand, predictions from the three main psychophysical models of binaural loudness (ANSI-S3.4 (2007), Moore et Glasberg (2007), Sivonen et Ellermeier (2008)) have been compared with all of the subjective data (involving different levels of realism), which allowed us to define more accurately the domain of validity and performance of these models in highly dichotic listening situations.

Page generated in 0.1003 seconds