• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • Tagged with
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Nouvelles méthodes multi-échelles pour l'analyse non-linéaire de la parole

Khanagha, Vahid 16 January 2013 (has links) (PDF)
Cette thèse présente une recherche exploratoire sur l'application du Formalisme Microcanonique Multiéchelles (FMM) à l'analyse de la parole. Dérivé de principes issus en physique statistique, le FMM permet une analyse géométrique précise de la dynamique non linéaire des signaux complexes. Il est fondé sur l'estimation des paramètres géométriques locaux (les exposants de singularité) qui quantifient le degré de prédictibilité à chaque point du signal. Si correctement définis est estimés, ils fournissent des informations précieuses sur la dynamique locale de signaux complexes. Nous démontrons le potentiel du FMM dans l'analyse de la parole en développant: un algorithme performant pour la segmentation phonétique, un nouveau codeur, un algorithme robuste pour la détection précise des instants de fermeture glottale, un algorithme rapide pour l'analyse par prédiction linéaire parcimonieuse et une solution efficace pour l'approximation multipulse du signal source d'excitation.
2

Nouvelles méthodes multi-échelles pour l'analyse non-linéaire de la parole / Novel multiscale methods for nonlinear speech analysis

Khanagha, Vahid 16 January 2013 (has links)
Cette thèse présente une recherche exploratoire sur l'application du Formalisme Microcanonique Multiéchelles (FMM) à l'analyse de la parole. Dérivé de principes issus en physique statistique, le FMM permet une analyse géométrique précise de la dynamique non linéaire des signaux complexes. Il est fondé sur l'estimation des paramètres géométriques locaux (les exposants de singularité) qui quantifient le degré de prédictibilité à chaque point du signal. Si correctement définis est estimés, ils fournissent des informations précieuses sur la dynamique locale de signaux complexes. Nous démontrons le potentiel du FMM dans l'analyse de la parole en développant: un algorithme performant pour la segmentation phonétique, un nouveau codeur, un algorithme robuste pour la détection précise des instants de fermeture glottale, un algorithme rapide pour l’analyse par prédiction linéaire parcimonieuse et une solution efficace pour l’approximation multipulse du signal source d'excitation. / This thesis presents an exploratory research on the application of a nonlinear multiscale formalism, called the Microcanonical Multiscale Formalism (the MMF), to the analysis of speech signals. Derived from principles in Statistical Physics, the MMF allows accurate analysis of the nonlinear dynamics of complex signals. It relies on the estimation of local geometrical parameters, the singularity exponents (SE), which quantify the degree of predictability at each point of the signal domain. When correctly defined and estimated, these exponents can provide valuable information about the local dynamics of complex signals and has been successfully used in many applications ranging from signal representation to inference and prediction.We show the relevance of the MMF to speech analysis and develop several applications to show the strength and potential of the formalism. Using the MMF, in this thesis we introduce: a novel and accurate text-independent phonetic segmentation algorithm, a novel waveform coder, a robust accurate algorithm for detection of the Glottal Closure Instants, a closed-form solution for the problem of sparse linear prediction analysis and finally, an efficient algorithm for estimation of the excitation source signal.
3

Nonlinear dynamics of the voice

Neubauer, Jürgen 17 October 2005 (has links)
Die Physik der Lauterzeugung (Phonation) wurde mit Hilfe der Theorie der Nichtlinearen Dynamik untersucht. Digitale Hochgeschwindigkeitsaufnamen von Schwingungen in menschlichen und nichtmenschlichen Kehlkoepfen, digitale Bildanalyse, Signalanalyse und Modenanalyse wurden zur quantitativen Beschreibung nichtlinearer Phaenomene eingesetzt. Es wurden nichtlineare Phaenomene bei stimmkranker (pathologischer) menschlicher Lauterzeugung untersucht, wie auch in stimmgesunden Singstimmen und in Kehlkoepfen von nichtmenschlichen Saeugetieren mit Stimmlippen-Membranen. Durch Bifurkationsanalyse eines einfachen mathematischen Modells fuer Stimmlippen mit Membranen konnten beobachtete Lautmuster nichtmenschlicher Saeugetiere qualitativ "nichtlinear gefittet" werden. Die Schwerpunkte dieser Arbeit waren: 1. die Klassifikation von Lautmustern in zeitgenoessischer Vokalmusik, um Erzeugungsmechanismen fuer komplexe Stimmklaenge zu erklaeren, die im kuenstlerischen Kontext vorkommen. Im besonderen war die Rolle der Quelle-Trakt-Kopplung von Interesse; 2. Instabilitaeten in Stimmpatienten, die durch Asymmetrien in einzelnen Stimmlippen wie auch zwischen den Stimmlippen verursacht wurden; 3. dynamische Effekte von duennen, leichten und schwingenden Stimmlippen-Membranen, vertikalen Fortsaetzen der Stimmlippen bei Saeugetieren. Stimmlippen-Membrane finden sich in Kehlkoepfen von Fledermaeusen und Primaten, wo sie einerseits zur Ultraschallerzeugung verwendet werden und andererseits fuer eine grosse Lautvielfalt sorgen. Ein Stimmlippen-Membran-Modell wurde entwickelt, um dieses diverse Lautrepertoire zu reproduzieren. Dieses Modell zeigte zwei Stimmregister. Ueber die Geometry der Stimmlippen-Membrane konnte der subglottale Einsatzdruck minimiert werden und der Druckbereich fuer Phonationen vergroessert werden. Numerische Simulationen demonstrierten, dass das phaenomenologische Stimm-Membran-Modell das Lautrepertoire von Fledermaeusen und Primaten qualitativ reproduzieren konnte. / In this thesis, the physics of phonation was discussed using the theory of nonlinear dynamics. Digital high speed recordings of human and nonhuman laryneal oscillations, image processing, signal analysis, and modal analysis have been used to quantitatively describe nonlinear phenomena in pathological human phonation, healthy voices in singing, and nonhuman mammalian larynges with vocal membranes. Bifurcation analysis of a simple mathematical model for vocal folds with vocal membranes allowed a qualitative ''nonlinear fit'' of observed vocalization patterns in nonhuman mammals. The main focus of the present work was on: 1. the classification of vocalizations of contemporary vocal music to provide insight to production mechanisms of complex sonorities in artistic contexts, especially to nonlinear source-tract coupling; 2. pathological voice instabilities induced by asymmetries within single vocal folds and between vocal folds; 3. the dynamic effects of thin, lightweight, and vibrating vocal membranes as upward extensions of vocal folds in nonhuman mammals. In nonhuman mammals, vocal membranes are one widespread morphological variation of vocal folds. In bats they are responsible to produce ultrasonic echolocation calls. In nonhuman primates they facilitate the production of highly diverse vocalizations. A vocal membrane model was developed to understand the production of these complex calls. Two voice registers were found in the vocal membrane model. The vocal membrane geometry could minimize phonation onset pressure and enlarge the phonatory pressure range of the model. Numerical simulations of the model revealed instabilities that qualitatively resembled observed vocalization patterns in bats and primates.

Page generated in 0.045 seconds