Return to search

Redução de ruído em sinais de voz no domínio wavelet

Made available in DSpace on 2014-06-11T19:30:51Z (GMT). No. of bitstreams: 0
Previous issue date: 2005-02-01Bitstream added on 2014-06-13T20:00:56Z : No. of bitstreams: 1
duarte_maq_dr_ilha.pdf: 2208096 bytes, checksum: 7daf91683010b0f39c715c9cc1ded5d8 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Neste trabalho é feito um estudo sobre os métodos de redução de ruído aditivo em sinais de voz baseados em wavelets e, através deste estudo, propõe-se um novo método de redução de ruído em sinais de voz no domínio wavelet. O princípio básico da maioria dos métodos de redução de ruído baseados em wavelets é a determinação e aplicação de um limiar, que permite bons resultados para sinais contaminados por ruído branco, mas não são eficientes no processamento de sinais contaminados por ruído colorido, que é o tipo de ruído mais comum em situações reais. Nesses métodos, o limiar, geralmente, é calculado nos intervalos de silêncio e aplicado em todo o sinal. Os coeficientes no domínio wavelet são comparados com este limiar e aqueles que estão abaixo deste valor são eliminados, fazendo assim uma aplicação linear deste limiar. Esta eliminação acaba causando descontinuidades no tempo e na freqüência no sinal processado. Além disso, a forma com que o limiar é calculado pode degradar os trechos de voz do sinal processado, principalmente nos casos em que o limiar depende fortemente da última janela do último trecho de silêncio. O método proposto neste trabalho também é baseado em corte por limiar, mas em vez de uma aplicação linear do limiar, ele faz uma aplicação não-linear, o que evita as descontinuidades causadas por outros algoritmos. O limiar é calculado nos trechos de silêncio e não depende apenas da última janela do último trecho de silêncio, mas sim de todas as janelas, já que este limiar é uma média de todos os limiares calculados neste trecho. Isto faz com que a redução do ruído seja mais uniforme e introduza menos distorções no sinal processado. Além disso, nos trechos de voz ainda é calculado um novo limiar que também será usado, em conjunto com o limiar calculado no silêncio. Isto faz com que a energia da janela que... . / In this work a study of additive noise reduction in speech based on wavelets is presented and, based on this study a new noise reduction method in speech in the wavelet domain is proposed. The basic idea of most methods of noise reduction based on wavelets is the determination and application of a threshold, that produces good results for signals contaminated by white noise, but they are not very efficient in processing signals contaminated by colored noise, which is more common in real situations. In those methods, the threshold, generally, is calculated in the silence intervals and applied to the whole signal. The coefficients in the wavelet domain are compared with this threshold and those that are below this value are eliminated, making a linear application of this threshold. This elimination causes discontinuities in time and frequency of the processed signal. Besides, the way that the threshold is computed can degrade the voice segments of the processed signal, principally when the threshold depends strongly on the last window of the last silence segment. The proposed method in this work is also based in thresholding, but, instead of a linear application of the threshold, it makes a non-linear application, which avoids the discontinuities caused by other algorithms. The threshold is calculated in the silence segments and is not dependent only on the last window of the last silence segment, but of all the windows, since this threshold is an average of all thresholds calculated in this segment. It makes noise reduction more uniform and introduces less distortion in the processed signal. Besides, in the voice segments a new threshold is calculated that will be also used with the threshold calculated in the silence. It makes that the energy of the window that is being processed is also considered. This way, it is... (Complete abstract, click electronic address below).

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unesp.br:11449/100369
Date01 February 2005
CreatorsDuarte, Marco Aparecido Queiroz [UNESP]
ContributorsUniversidade Estadual Paulista (UNESP), Alvarado, Francisco Villarreal [UNESP], Filho, Jozué Vieira [UNESP]
PublisherUniversidade Estadual Paulista (UNESP)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatxvii, 105 f.
SourceAleph, reponame:Repositório Institucional da UNESP, instname:Universidade Estadual Paulista, instacron:UNESP
Rightsinfo:eu-repo/semantics/openAccess
Relation-1, -1, -1

Page generated in 0.0027 seconds