Spelling suggestions: "subject:"voice -- 2analysis."" "subject:"voice -- 3analysis.""
1 |
Estelle Liebling: An exploration of her pedagogical principles as an extension and elaboration of the Marchesi method, including a survey of her music and editing for coloratura soprano and other voices.Fowler, Alandra Dean. January 1994 (has links)
Estelle Liebling (1880-1970) was a phenomenally successful voice teacher who occupies a place in the chain of succession of voice teachers devoted to the ideals of the bel canto. Turning out over seventy-five Metropolitan Opera stars over the fifty-plus year span of her teaching career, she was regarded during her lifetime as one of the most distinguished voice teachers in America. Her editions, compositions, and pedagogical writings exerted an influence on the world far exceeding the boundaries of the New York professional musical sphere in which she operated. Despite this, almost nothing has been written to date that documents her contribution to the world of singing. Much of Liebling's pedagogical outlook was derived from that of her immediate predecessor, Mathilde Marchesi, and direct comparison of Liebling's Vocal Course to Marchesi's Theoretical and Practical Vocal Method shows this relationship. Liebling herself acknowledged Marchesi's influence, but the pedagogy she espoused was by no means a carbon copy of that of Marchesi. Important differences exist, distinguishing Liebling's pedagogy as separate and individualized, a legitimate successor to the Marchesi Method. Liebling's legacy consists not only of her teaching and pedagogical writings, however. The tremendous body of vocal literature which she edited, arranged, and composed, mostly for coloratura soprano, is enough in of itself to justify her place in music history. Additionally, her catalogue work of cadenzas and ornamentation for coloratura soprano literature still stands today as the monumental work on the subject.
|
2 |
Automatic Speech Recognition for ageing voicesVipperla, Ravichander January 2011 (has links)
With ageing, human voices undergo several changes which are typically characterised by increased hoarseness, breathiness, changes in articulatory patterns and slower speaking rate. The focus of this thesis is to understand the impact of ageing on Automatic Speech Recognition (ASR) performance and improve the ASR accuracies for older voices. Baseline results on three corpora indicate that the word error rates (WER) for older adults are significantly higher than those of younger adults and the decrease in accuracies is higher for males speakers as compared to females. Acoustic parameters such as jitter and shimmer that measure glottal source disfluencies were found to be significantly higher for older adults. However, the hypothesis that these changes explain the differences in WER for the two age groups is proven incorrect. Experiments with artificial introduction of glottal source disfluencies in speech from younger adults do not display a significant impact on WERs. Changes in fundamental frequency observed quite often in older voices has a marginal impact on ASR accuracies. Analysis of phoneme errors between younger and older speakers shows a pattern of certain phonemes especially lower vowels getting more affected with ageing. These changes however are seen to vary across speakers. Another factor that is strongly associated with ageing voices is a decrease in the rate of speech. Experiments to analyse the impact of slower speaking rate on ASR accuracies indicate that the insertion errors increase while decoding slower speech with models trained on relatively faster speech. We then propose a way to characterise speakers in acoustic space based on speaker adaptation transforms and observe that speakers (especially males) can be segregated with reasonable accuracies based on age. Inspired by this, we look at supervised hierarchical acoustic models based on gender and age. Significant improvements in word accuracies are achieved over the baseline results with such models. The idea is then extended to construct unsupervised hierarchical models which also outperform the baseline models by a good margin. Finally, we hypothesize that the ASR accuracies can be improved by augmenting the adaptation data with speech from acoustically closest speakers. A strategy to select the augmentation speakers is proposed. Experimental results on two corpora indicate that the hypothesis holds true only when the amount of available adaptation is limited to a few seconds. The efficacy of such a speaker selection strategy is analysed for both younger and older adults.
|
3 |
Real-time analysis, in SuperCollider, of spectral features of electroglottographic signals / Analys i realtid, i SuperCollider, av spektrala egenskaper hos elektroglottografiska signalerJohansson, Dennis January 2016 (has links)
This thesis presents tools and components necessary to further develop an implementation of a method. The method attempts to use the non invasive electroglottographic signal to locate rapid transitions between voice registers. Implementations for sample entropy and the Discrete Fourier Transform (DFT) implemented for the programming language SuperCollider are presented along with tools necessary to evaluate the method and present the results in real time. Since different algorithms have been used, both for clustering and cycle separation, a comparison between algorithms for both of these steps has also been done. / Denna rapport presenterar verktyg och komponenter som är nödvändiga för att vidareutveckla en implementation av en metod. Metoden försöker att använda en icke invasiv elektroglottografisk signal för att hitta snabba övergångar mellan röstregister. Det presenteras implementationer för sampelentropi och den diskreta fourier transformen för programspråket SuperCollider samt verktyg som behövs för att utvärdera metoden och presentera resultaten i realtid. Då olika algoritmer har använts för både klustring och cykelseparation så har även en jämförelse mellan algoritmer för dessa steg gjorts.
|
4 |
DEFINING THE BELT VOICE: PERCEPTUAL JUDGEMENTS AND OBJECTIVE MEASURESLeBorgne, Wendy DeLeo 11 October 2001 (has links)
No description available.
|
5 |
Padrões visuais de sinais de voz aravés de técnica de análise não linear / Voice signal discrimination with nonlinear analysis techniquesDájer, Maria Eugenia 14 March 2006 (has links)
A voz tem sido objeto de estudos em diferentes áreas da ciência. Nas últimas duas décadas os pesquisadores demonstraram a presença do caos na produção de voz. O objetivo deste trabalho é estabelecer padrões visuais de sinais de voz humana através da técnica não linear de reconstrução de espaço de fase e associá-los com suas correspondentes análises auditivo perceptiva e acústica. Foram analisados sinais de voz humana de sujeitos de ambos os gêneros, na faixa etária de 19 a 39 anos. Foram gravadas as vogais sustentadas /a/, /e/ e /i/ do português do Brasil, com uma taxa de amostragem de 22.050 Hz. Os sinais foram analisados a fim de obter medidas acústicas (Jitter, Shimmer e Coeficiente de Excesso). Foi utilizada a técnica de reconstrução de espaço de fase para descrever as características de dinâmica não linear dos sinais de voz, e para análise perceptivo auditiva foi utilizada a escala RASAT. Os resultados demonstram que métodos de dinâmica não linear como a reconstrução do espaço de fase, parece ser uma técnica apropriada para análise de sinais de voz, incorporando os componentes caótico e determinístico da voz humana. É sugerido que análise da dinâmica não linear não substitui as técnicas existentes, embora possa aperfeiçoar e complementar os métodos de análise disponíveis para os profissionais da saúde, como fonoaudiólogos e otorrinolaringólogos / Human voice has been the focus of study for different areas of science. Researches in the last two decades have demonstrated the existence of chaos in human voice production. The purpose of this work is to use nonlinear dynamics techniques in the analysis of normal voices from healthy subjects and correlate them to traditional acoustic parameters as well as perceptual analysis. Human voice signals from healthy subjects, both male and female, ranging in age from 19 to 39 years old were analyzed. Sustained vowel sounds /a/, /e/ and /i/, from brazilian Portuguese were recorded at a sampling rate of 22,050 Hz and analyzed in order to obtain acoustic measures (Jitter, Shimmer and coefficient of excess EX). The phase space reconstruction technique was used to describe the nonlinear dynamic characteristics of voice signal samples. The results show, that non-linear dynamical method as phase space reconstruction seems to be a suitable technique for voice signals analysis, due to the chaotic component of the human voice. It is suggested, that non-linear dynamic analysis does not replace existing techniques instead, it may improve and complement the recent voice analysis methods available for health professionals, speech therapist and clinician
|
6 |
Medida da dispersão da periodicidade de um sinal de voz normal e voz patológica através da seção de Poincaré / Measurement of the frequency dispersion of a normal voice signal and voice pathology through the Poincaré sectionAndrade Sobrinho, Fernando Araujo de 06 May 2011 (has links)
A voz humana apresenta flutuações na frequência, amplitude e formato de onda. Esse comportamento característico pode ser estudado usando técnicas de análise não linear, além das técnicas convencionais. O objetivo desse trabalho é analisar sinais de vozes normais e patológicas (com nódulos e edemas) usando seção de Poincaré de vários trechos do espaço de fase reconstruído e calcular a dispersão em relação ao ponto médio da seção e em relação à distribuição dos pontos sobre os eixos coordenados. Essa dispersão será calculada utilizando o conceito estatístico de desvio padrão. Foram analisados 48 sinais de voz humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Foram selecionados trechos de 500m do sinal temporal nas regiões de maior estacionariedade, descartando os trechos iniciais e finais do sinal para evitar possíveis transitórios. A partir do espaço de fase bidimensional, a seção de Poincaré foi traçada em 10 trechos distintos da trajetória. Em seguida, foi gerado o espaço de fase em 3 dimensões contendo os pontos da seção. Foi feita uma rotação tridimensional dos pontos utilizando a reta tangente à trajetória de modo que a seção ficasse paralela ao plano x = O. Da seção resultante foram extraídas as componentes principais e em seguida calculado o desvio padrão da dispersão e o desvio padrão dos pontos projetados no plano em relação aos eixos coordenados (y;z). A validação da ferramenta desenvolvida para esse estudo foi realizada utilizando um sinal senoidal inserindo gradativamente Jitter e Shimmer, onde se verificou uma variação proporcional da média da dispersão. Os resultados obtidos para esse conjunto de vozes mostraram que o desvio padrão da dispersão e o desvio padrão em relação aos eixos coordenados dos pontos de vozes normais é menor do que os encontrados para vozes com edema e com nódulo. Concluiu-se que a ferramenta proposta conseguiu diferenciar vozes normais das vozes patológicas. Portanto, a ferramenta é promissora para análise e avaliação desse grupo vozes. / The human voice, normal or pathological, has fluctuations in the frequency, amplitude and waveform. This characteristic behavior can be studied using techniques of nonlinear analysis, in addition to conventional techniques. The aim of this study is to analyze signals of normal and pathological voices (with nodules and edema) using the Poincaré section of several parts of the reconstructed phase space and calculate the dispersion in relation to the midpoint of the section and in relation to the distribution of points on coordinate axes. This dispersion is calculated using the statistical concept of standard deviation. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 with nodules and 16 with Reinke\'s edema). It was selected 500m signal frames presenting good stationarity, discarding the initial and final portions of the signal to avoid possible transient. From the two-dimensional phase space, the Poincaré section was drawn on 10 different stretches of the path. It was then generated the three-dimensional phase space containing the points of the section. We conducted a three dimensional rotation of the points using the tangent to the trajectory so that the section stayed parallel to the plane. From the resulting section, principal components were extracted and then calculated the standard deviation of the dispersion and the standard deviation of the coordinate axes of the projected points of the section in the plan. The validation tool developed for this study was performed using a sinusoidal signal gradually inserting jitter and shimmer, where there was a proportional variation of the dispersion media. The results for this set of voices showed that the standard deviation of the dispersion and the standard deviation related to the coordinate axes of the points of normal voices is smaller than those found for voices with edema and nodule. It was concluded that the proposal was promising tool for analyzing and evaluating this group voices.
|
7 |
Medida da dispersão da periodicidade de um sinal de voz normal e voz patológica através da seção de Poincaré / Measurement of the frequency dispersion of a normal voice signal and voice pathology through the Poincaré sectionFernando Araujo de Andrade Sobrinho 06 May 2011 (has links)
A voz humana apresenta flutuações na frequência, amplitude e formato de onda. Esse comportamento característico pode ser estudado usando técnicas de análise não linear, além das técnicas convencionais. O objetivo desse trabalho é analisar sinais de vozes normais e patológicas (com nódulos e edemas) usando seção de Poincaré de vários trechos do espaço de fase reconstruído e calcular a dispersão em relação ao ponto médio da seção e em relação à distribuição dos pontos sobre os eixos coordenados. Essa dispersão será calculada utilizando o conceito estatístico de desvio padrão. Foram analisados 48 sinais de voz humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Foram selecionados trechos de 500m do sinal temporal nas regiões de maior estacionariedade, descartando os trechos iniciais e finais do sinal para evitar possíveis transitórios. A partir do espaço de fase bidimensional, a seção de Poincaré foi traçada em 10 trechos distintos da trajetória. Em seguida, foi gerado o espaço de fase em 3 dimensões contendo os pontos da seção. Foi feita uma rotação tridimensional dos pontos utilizando a reta tangente à trajetória de modo que a seção ficasse paralela ao plano x = O. Da seção resultante foram extraídas as componentes principais e em seguida calculado o desvio padrão da dispersão e o desvio padrão dos pontos projetados no plano em relação aos eixos coordenados (y;z). A validação da ferramenta desenvolvida para esse estudo foi realizada utilizando um sinal senoidal inserindo gradativamente Jitter e Shimmer, onde se verificou uma variação proporcional da média da dispersão. Os resultados obtidos para esse conjunto de vozes mostraram que o desvio padrão da dispersão e o desvio padrão em relação aos eixos coordenados dos pontos de vozes normais é menor do que os encontrados para vozes com edema e com nódulo. Concluiu-se que a ferramenta proposta conseguiu diferenciar vozes normais das vozes patológicas. Portanto, a ferramenta é promissora para análise e avaliação desse grupo vozes. / The human voice, normal or pathological, has fluctuations in the frequency, amplitude and waveform. This characteristic behavior can be studied using techniques of nonlinear analysis, in addition to conventional techniques. The aim of this study is to analyze signals of normal and pathological voices (with nodules and edema) using the Poincaré section of several parts of the reconstructed phase space and calculate the dispersion in relation to the midpoint of the section and in relation to the distribution of points on coordinate axes. This dispersion is calculated using the statistical concept of standard deviation. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 with nodules and 16 with Reinke\'s edema). It was selected 500m signal frames presenting good stationarity, discarding the initial and final portions of the signal to avoid possible transient. From the two-dimensional phase space, the Poincaré section was drawn on 10 different stretches of the path. It was then generated the three-dimensional phase space containing the points of the section. We conducted a three dimensional rotation of the points using the tangent to the trajectory so that the section stayed parallel to the plane. From the resulting section, principal components were extracted and then calculated the standard deviation of the dispersion and the standard deviation of the coordinate axes of the projected points of the section in the plan. The validation tool developed for this study was performed using a sinusoidal signal gradually inserting jitter and shimmer, where there was a proportional variation of the dispersion media. The results for this set of voices showed that the standard deviation of the dispersion and the standard deviation related to the coordinate axes of the points of normal voices is smaller than those found for voices with edema and nodule. It was concluded that the proposal was promising tool for analyzing and evaluating this group voices.
|
8 |
Balso daugiaparametrio tyrimo sisteminės analizės reikšmė pirminei gerklų ligų atrankai / The value of voice multidimensional assessment in screening of laryngeal disordersVegienė, Aurelija 04 September 2014 (has links)
Disertaciniame darbe ištirti gerklų ligomis sergantys ir sveiki asmenys, naudojant įvairiapusius metodus – klausimynus, akustinę analizę, balso lauko tyrimą, vaizdo laringostroboskopiją (VLS). Sukurta informaty¬viausia įvairialypių požymių sistema, padedanti spręsti apie tikimybę, kuriai gerklų ligų grupei priskirtinas tiriamasis asmuo. Sukurta originali VLS vaizdų matavimo metodika bei nustatyti svarbiausi parametrai, kurie tiksliausiai apibūdina klasifikuojamas gerklų ligų grupes. Disertacinio darbo uždaviniai: (1) nustatyti informatyviausius anamne¬zės bei demografinius faktorius, kurie leistų tiriamuosius klasifikuoti į sveiko ir patologinio balso, taip pat į gerklų ligų grupes; įvertinti šių faktorių efektyvumą pirminei gerklų ligų atrankai; (2) atlikti subjektyvią ir kompiuterinę akustinę balso analizę bei sudaryti informatyviausių balso parametrų sistemą gerklų ligų grupėms klasifikuoti; (3) atlikti ir kiekybiškai įvertinti VLS bei nustatyti kiekybinių VLS vertinimo parametrų patikimumą bei reikšmingumą klasifikuojant tiriamuosius į gerklų ligų grupes; (4) sukurti VLS paveikslų objektyvaus kiekybinio matavimo sistemą bei nustatyti VLS matavimo parametrų reikšmingumą klasifikuojant į atitinkamas gerklų ligų grupes; (5) jungiant anketinius duomenis, akustinę balso analizę, VLS vertinimo ir VLS matavimo parametrus, įvertinti gerklų ligų pirminės atrankos sistemos efektyvumą. / In this dissertation were determined the most important questionnaire statements, parameters of perceptive and acoustic voice analysis and quantitatively evaluated and measured parameters of video laryngo-stroboscopy for classification tasks of laryngeal disorders. It was established the most sensitive and specific laryngeal and voice features system discriminating normal, pathological and other voice disorders groups. It was established the original VLS measurement methodic with original parameters. The objectives of the study: (1) to determine the most important questionnaire statements, discriminating normal and pathological voice, glottal cancer and other mass lesions, nodular, diffuse, paralysis and healthy classes and to evaluate their classification efficiency for screening of laryngeal diseases; (2) to perform perceptual, acoustic, aerodynamic vocal function measurements and to determine the most sensitive and specific parameters discriminating voice groups; (3) to evaluate quantitatively parameters of VLS and to determine the sensitivity and specificity of these parameters discriminating groups of laryngeal diseases; (4) to establish the system of quantitative objective VLS measurements revealing their reliability discriminating normal and pathological voice groups; (5) to establish the most sensitive and specific laryngeal and voice features system for laryngeal diseases screening purposes.
|
9 |
Padrões visuais de sinais de voz aravés de técnica de análise não linear / Voice signal discrimination with nonlinear analysis techniquesMaria Eugenia Dájer 14 March 2006 (has links)
A voz tem sido objeto de estudos em diferentes áreas da ciência. Nas últimas duas décadas os pesquisadores demonstraram a presença do caos na produção de voz. O objetivo deste trabalho é estabelecer padrões visuais de sinais de voz humana através da técnica não linear de reconstrução de espaço de fase e associá-los com suas correspondentes análises auditivo perceptiva e acústica. Foram analisados sinais de voz humana de sujeitos de ambos os gêneros, na faixa etária de 19 a 39 anos. Foram gravadas as vogais sustentadas /a/, /e/ e /i/ do português do Brasil, com uma taxa de amostragem de 22.050 Hz. Os sinais foram analisados a fim de obter medidas acústicas (Jitter, Shimmer e Coeficiente de Excesso). Foi utilizada a técnica de reconstrução de espaço de fase para descrever as características de dinâmica não linear dos sinais de voz, e para análise perceptivo auditiva foi utilizada a escala RASAT. Os resultados demonstram que métodos de dinâmica não linear como a reconstrução do espaço de fase, parece ser uma técnica apropriada para análise de sinais de voz, incorporando os componentes caótico e determinístico da voz humana. É sugerido que análise da dinâmica não linear não substitui as técnicas existentes, embora possa aperfeiçoar e complementar os métodos de análise disponíveis para os profissionais da saúde, como fonoaudiólogos e otorrinolaringólogos / Human voice has been the focus of study for different areas of science. Researches in the last two decades have demonstrated the existence of chaos in human voice production. The purpose of this work is to use nonlinear dynamics techniques in the analysis of normal voices from healthy subjects and correlate them to traditional acoustic parameters as well as perceptual analysis. Human voice signals from healthy subjects, both male and female, ranging in age from 19 to 39 years old were analyzed. Sustained vowel sounds /a/, /e/ and /i/, from brazilian Portuguese were recorded at a sampling rate of 22,050 Hz and analyzed in order to obtain acoustic measures (Jitter, Shimmer and coefficient of excess EX). The phase space reconstruction technique was used to describe the nonlinear dynamic characteristics of voice signal samples. The results show, that non-linear dynamical method as phase space reconstruction seems to be a suitable technique for voice signals analysis, due to the chaotic component of the human voice. It is suggested, that non-linear dynamic analysis does not replace existing techniques instead, it may improve and complement the recent voice analysis methods available for health professionals, speech therapist and clinician
|
10 |
Análise de sinais de voz por padrões visuais de dinâmica vocal / Voice signal analysis using vocal dynamic visual patternsDajer, Maria Eugenia 30 July 2010 (has links)
O objetivo deste trabalho foi avaliar vozes saudáveis e com alterações patológicas aplicando análise de Padrões Visuais de Dinâmica Vocal (PVDV) em conjunto com análise acústica e análise perceptivo-auditiva. Foram avaliadas 91 vozes da vogal sustentada /a/ do português do Brasil, de sujeitos de ambos os gêneros com idades entre 21 e 88 anos. As vozes foram gravadas com taxa de amostragem de 22.050 Hz, 16 bits, mono canal e formato WAV. Foram obtidos valores de jitter, shimmer e freqüência fundamental. Para análise perceptivo-auditiva foram avaliadas rugosidade, soprosidade, tensão e instabilidade. Para descrever a dinâmica dos sinais de voz dos PVDV foi utilizada a técnica de reconstrução de espaço de fase e foram analisados qualitativamente os parâmetros de loops, regularidade e convergência de traçados. Foram aplicados testes estatísticos paramétricos e não paramétricos. Os resultados demonstram que jitter apresenta uma correlação negativa com loop, regularidade e convergência dos traçados; e que shimmer tem correlação negativa com convergência e loops. As características de rugosidade e soprosidade estão correlacionadas negativamente com os três parâmetros dinâmicos. A análise qualitativa dos PVDV é uma técnica promissora, por considerar os componentes caótico e determinístico da voz. É sugerido que não substitui as técnicas existentes, embora possa aperfeiçoar e complementar os métodos usados por profissionais fonoaudiólogos e otorrinolaringologistas. / The aim of this research was to analyze healthy and pathologic voices using Vocal Dynamic Visual Patterns (VDVP) in combination with acoustical and perceptual analysis. Ninety one voice signals of sustained vowel /a/ from Brazilian Portuguese, from male and female patients, were analyzed using acoustical analysis, perceptual analysis and Vocal Dynamic Visual Patterns (VDVP) analysis. All voice samples were quantized in amplitude with 16 bits and recorded in mono-channel WAV format. The sampling frequency was 22050 Hz. Acoustical values for jitter, shimmer and fundamental frequency were obtained. Roughness, breathiness, strain and irregularity were analyzed for perceptual analysis. Phase space reconstruction technique was performed in order to describe the voice signal nonlinear characteristics by Vocal Dynamic Visual Patterns. Results showed negative correlation for jitter and the 3 dynamic parameters, as well as, for shimmer with convergence and loops. Roughness and breathiness were negative correlated with dynamical parameters. Vocal Dynamic Visual Pattern analysis is a promising technique for voice evaluation; including voice chaotic and deterministic components. It is suggested that visual pattern analysis do not replace the existing voice analysis techniques, although it complements and improves the voice evaluation methods available for speech therapist and laryngologists.
|
Page generated in 0.068 seconds