Global ETD Search

1	Detekce nemocí pomocí analýzy hlasu / Voice Analysis for Detection of Diseases Chytil, Pavel January 2008 (has links) Tato disertační práce je zaměřena na analýzu řečového signálu za učelem detekce nemocí ovlivňujících strukturu hlasových orgánů, obzvláště těch, které mění strukturální character hlasivek. Poskytnut je přehled současných technik. Dále jsou popsány zdroje použitých nahrávek pro zdravé a nemocné mlučí. Hlavním učelem této disertační práce je popsat vypočetní postup k odhadu parametrů modelu hlasového zdroje, které umožní následnou detekci a klasifikaci nemocí hlasivek. Poskytujeme detailní popis analýzy řečových signálů, které mohou být odvozeny z parametrických modelů hlasivek.
2	Estimação do sinal glotal para padrões acústicos de doenças da laringe / not available Guerra, Aparecida de Cássia 03 May 2005 (has links) Muitas pesquisas tem sido feitas em processamento digital de sinais (PDS) na tentativa de se avaliar o sinal de fala para diagnosticar doenças da laringe. Medidas acústicas têm sido propostas de forma a avaliar indiretamente o trato glotal por meio do sinal de voz coletado através de microfone convencional. Para isso, o modelo paramétrico Liljencrants-Fant (LF) foi desenvolvido para representar o sinal glotal em condições normais e patológicas. Tais parâmetros apresentam vantagens sobre medidas acústicas por possuírem características fisiológicas reais das pregas vocais. Assim, podendo ser empregados para identificação de doenças da laringe. Além da estimação dos parâmetros LF, no domínio do tempo (parâmetros T), a forma de onda da derivativa glotal também pôde ser quantificada através dos parâmetros identificados na literatura por parâmetros R (Rd, Ra, Rk e Rg), parâmetros quocientes Q (SQ, OQ, CQ, AQ e NAQ), parâmetros B1 e B2 que são as extensões de bandas do pulso derivativo LF, e o parâmetro ece, que relaciona os parâmetros &#946 e Ta. Os parâmetros B1 e B2 e ece apesar de serem propostos na literatura, não são encontrados resultados diferentes a essas duas medidas. Os resultados mostraram que os parâmetros B não foram confiáveis na discriminação entre as vozes, por outro lado, o parâmetro ece mostrou-se ser opção na discriminação entre as vozes normais, nódulo e Reinke. O objetivo deste trabalho é direcionar a atenção sobre o sinal glotal, estimando-o automaticamente mediante técnicas de PDS aplicadas ao sinal de fala, visando extrair parâmetros que identifiquem as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições fisiológicas do movimento das pregas vocais. Com um nível de confiança de 95%, o parâmetro de primeira ordem (TRp) é efetivo na discriminação do Edema de Reinke, porém mostrou-se ineficaz na detecção do nódulo. Em relação ao parâmetro de ordem superior, conclui-se que o TRs é um excelente detetor de vozes patológicas (nódulo e Edema de Reinke), porém não é capaz de discriminar as patologias. / Many researches has been conducted in digital signal processing (DSP) atempting to evaluate the physiological conditions of larynx. Acoustical parameters have been proposed to evaluate the glotal tract from voice signal. One technique proposed is the Liljencrants-Fant model (LF) developed to represent normal and pathologic conditions of the larynx. Those parameters compare favourably as far as real physiologic characteristic of vocal folds is concerned. So, a primary use of the model is the larynx pathologic identification. Beyond LF parameters estimation, (T parameters in the time domain), the waveform of glotal pulse derivative also can be quantified through, R parameters (Rd, Ra, Rk and Rg), quocient parameters (SQ, OQ, CQ, AQ and NAQ), B parameters (B1 and B2) that are band extension of the LF glotal pulse derivative and the ece parameter that in fact, is a relationship between &#946 and Ta. Although proposed in the literature, no results are found, related to B and ece parameters. Our founds show that B parameters do not present good results in voice discrimination, however, ece parameter seems to be good option to discriminate normal voice, nodulo and Reinke edema. The main purpose of this work is to estimate the glotal signal from the voice signal using DSP techniques in order to obtain parameters that identifies the physiological larynx condition. In order to estimate the shape of return phase of glotal pulse, twoparameters have been proposed in this work. The first one evaluates the pulse (TRp, in other words, the first order component of the return phase. The second is responsible to evaluate superior orders components of the return phase (TRs), i.e, the non-linear component of the glotal pulse. With 95% of confidence level, TRp is effective in Reinke edema discrimination however it is inefficient for nodule e dection. By the other hand, the TRs parameter works well to detect pathologic voice however is unable to discriminated them. Digital signal processing Glottal derivative pulse-model Glottal pulse LF model Modelo LF Pregas vocais Processamento digital de voz Pulso derivativo glotal-modelo Pulso glotal Sinal de voz Vocal folds Voice signal
3	Modelo de produção da voz baseado na biofísica da fonação. ROCHA, Raissa Bezerra. 24 August 2018 (has links) Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-08-24T15:00:51Z No. of bitstreams: 1 RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5) / Made available in DSpace on 2018-08-24T15:00:51Z (GMT). No. of bitstreams: 1 RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5) Previous issue date: 2017-03-20 / CNPq / A busca por novos modelos que representem a biofísica da fonação da voz é importante em aplicações que incluem o processamento do sinal de voz por representar uma ferramenta no conhecimento de característica dos locutores. Esta tese de doutorado apresenta uma nova abordagem para a teoria fonte-filtro de geração de voz, mais precisamente sons sonoros, que realiza a modelagem da voz por meio de três subsistemas independentes: fonte de excitação, trato vocal e radiação dos lábios e narinas. Trata-se de um modelo em que a geração da voz é feita por meio de filtros lineares e invariantes ao deslocamento no tempo e que leva em consideração a física da fonação, a partir da característica cicloestacionária do sinal de voz, proveniente do comportamento de vibração das cordas vocais. É sugerido que a frequência de oscilação das cordas vocais é dada em função da massa e comprimento delas, e que seu valor é alterado principalmente pela tensão longitudinal aplicada a elas. No modelo proposto para geração da voz, o movimento vibratório das cordas vocais é modelado por meio de um de gerador de trem de impulsos cicloestacionário, controlado por um sinal de tensão obtido a partir da forma de onda do sinal de voz. É realizada toda a análise matemática que abrange o novo modelo para a excitação glotal, apresentando-se uma expressão matemática da densidade espectral de potência do sinal que excita a glote, bem como para o sinal de voz, cujos parâmetros podem ser ajustados para emular patologias na glote. Além disso, apresenta-se a análise no domínio da frequência do pulso glotal usado. Para analisar o desempenho do modelo proposto, testes com locução foram realizados e os resultados indicam que o modelo proposto se ajusta bem a geração da voz. / The search for new models that represent the biophysics of voice phonation is important for applications that include voice signal processing because it represents a tool for getting to know the characteristics of the speakers. This doctoral thesis presents a new proposal for the source-filter theory of voice production, more precisely related to voiced sounds, that performs the voice modelling using three independent subsystems: the excitation source, the vocal tract, the lip and nostrils radiation system. It is a proposal for a model to generate voice using linear and time-invariant systems, and takes into account the phonation physics and the cyclestationarity characteristics of the voice signal, related to the vibrational behavior of the vocal cords. The model suggests that the frequency oscillation of the vocal folds is a function of the mass and length, but controlled by the longitudinal tension applied to them. In the proposed voice generation model, the vibratory movement of the vocal cords is modeled by a cyclestationary train of impulses, controlled by a tension signal obtained from the voice signal waveform. A mathematical analysis encompassing the new model for glottal excitation is accomplished by presenting a mathematical expression of the signal power spectral density which excites the glottis, as well as the voice signal, whose parameters can be adjusted to emulate pathologies in the glottis. Moreover, the analysis of the utilized glottal pulse in the frequency domain is presented. To analyze the performance of the proposed model, tests with locutions were done and the results indicate that the proposed model adjusts well to voice generation. Engenharia Elétrica Modelo de Geração de Voz Pulso Glotal de Liljencrants-Fant Voice Production Model Glottal Pulse of Liljencrants-Fant Power Spectral Density of Voice Signal
4	Estimação do sinal glotal para padrões acústicos de doenças da laringe / not available Aparecida de Cássia Guerra 03 May 2005 (has links) Muitas pesquisas tem sido feitas em processamento digital de sinais (PDS) na tentativa de se avaliar o sinal de fala para diagnosticar doenças da laringe. Medidas acústicas têm sido propostas de forma a avaliar indiretamente o trato glotal por meio do sinal de voz coletado através de microfone convencional. Para isso, o modelo paramétrico Liljencrants-Fant (LF) foi desenvolvido para representar o sinal glotal em condições normais e patológicas. Tais parâmetros apresentam vantagens sobre medidas acústicas por possuírem características fisiológicas reais das pregas vocais. Assim, podendo ser empregados para identificação de doenças da laringe. Além da estimação dos parâmetros LF, no domínio do tempo (parâmetros T), a forma de onda da derivativa glotal também pôde ser quantificada através dos parâmetros identificados na literatura por parâmetros R (Rd, Ra, Rk e Rg), parâmetros quocientes Q (SQ, OQ, CQ, AQ e NAQ), parâmetros B1 e B2 que são as extensões de bandas do pulso derivativo LF, e o parâmetro ece, que relaciona os parâmetros &#946 e Ta. Os parâmetros B1 e B2 e ece apesar de serem propostos na literatura, não são encontrados resultados diferentes a essas duas medidas. Os resultados mostraram que os parâmetros B não foram confiáveis na discriminação entre as vozes, por outro lado, o parâmetro ece mostrou-se ser opção na discriminação entre as vozes normais, nódulo e Reinke. O objetivo deste trabalho é direcionar a atenção sobre o sinal glotal, estimando-o automaticamente mediante técnicas de PDS aplicadas ao sinal de fala, visando extrair parâmetros que identifiquem as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições fisiológicas do movimento das pregas vocais. Com um nível de confiança de 95%, o parâmetro de primeira ordem (TRp) é efetivo na discriminação do Edema de Reinke, porém mostrou-se ineficaz na detecção do nódulo. Em relação ao parâmetro de ordem superior, conclui-se que o TRs é um excelente detetor de vozes patológicas (nódulo e Edema de Reinke), porém não é capaz de discriminar as patologias. / Many researches has been conducted in digital signal processing (DSP) atempting to evaluate the physiological conditions of larynx. Acoustical parameters have been proposed to evaluate the glotal tract from voice signal. One technique proposed is the Liljencrants-Fant model (LF) developed to represent normal and pathologic conditions of the larynx. Those parameters compare favourably as far as real physiologic characteristic of vocal folds is concerned. So, a primary use of the model is the larynx pathologic identification. Beyond LF parameters estimation, (T parameters in the time domain), the waveform of glotal pulse derivative also can be quantified through, R parameters (Rd, Ra, Rk and Rg), quocient parameters (SQ, OQ, CQ, AQ and NAQ), B parameters (B1 and B2) that are band extension of the LF glotal pulse derivative and the ece parameter that in fact, is a relationship between &#946 and Ta. Although proposed in the literature, no results are found, related to B and ece parameters. Our founds show that B parameters do not present good results in voice discrimination, however, ece parameter seems to be good option to discriminate normal voice, nodulo and Reinke edema. The main purpose of this work is to estimate the glotal signal from the voice signal using DSP techniques in order to obtain parameters that identifies the physiological larynx condition. In order to estimate the shape of return phase of glotal pulse, twoparameters have been proposed in this work. The first one evaluates the pulse (TRp, in other words, the first order component of the return phase. The second is responsible to evaluate superior orders components of the return phase (TRs), i.e, the non-linear component of the glotal pulse. With 95% of confidence level, TRp is effective in Reinke edema discrimination however it is inefficient for nodule e dection. By the other hand, the TRs parameter works well to detect pathologic voice however is unable to discriminated them. Modelo LF Pregas vocais Processamento digital de voz Pulso derivativo glotal-modelo Pulso glotal Sinal de voz Digital signal processing Glottal derivative pulse-model Glottal pulse LF model Vocal folds Voice signal
5	Určování stresu z řečového signálu / Stress recognition from speech signal Staněk, Miroslav January 2016 (has links) Předložená disertační práce se zabývá vývojem algoritmů pro detekci stresu z řečového signálu. Inovativnost této práce se vyznačuje dvěma typy analýzy řečového signálu, a to za použití samohláskových polygonů a analýzy hlasivkových pulsů. Obě tyto základní analýzy mohou sloužit k detekci stresu v řečovém signálu, což bylo dokázáno sérií provedených experimentů. Nejlepších výsledků bylo dosaženo pomocí tzv. Closing-To-Opening phase ratio příznaku v Top-To-Bottom kritériu v kombinaci s vhodným klasifikátorem. Detekce stresu založená na této analýze může být definována jako jazykově i fonémově nezávislá, což bylo rovněž dokázáno získanými výsledky, které dosahují v některých případech až 95% úspěšnosti. Všechny experimenty byly provedeny na vytvořené české databázi obsahující reálný stres, a některé experimenty byly také provedeny pro anglickou stresovou databázi SUSAS.

1

Page generated in 0.0587 seconds