Made available in DSpace on 2016-08-17T14:52:52Z (GMT). No. of bitstreams: 1
Edil James de Jesus Nascimento.PDF: 2709948 bytes, checksum: c8bf5634508e47328bd033c4d323f9c0 (MD5)
Previous issue date: 2004-04-02 / The human hearing system is capable to accomplish different tasks that would be
useful in engineering applications. One of them is the ability to separate sound sources,
allowing the listener to "focus" a single sound source in a noisy environment. Great
investments have been made in the development of technologies applied to the voice
recognition by machines in real environment. For that, different techniques of processing
computational have been proposed, for reduction of the ambient noise and improvement of
the signal desired in complex acoustic environment (cocktail party). The model of the human
hearing system motivates those techniques in their different phases.
In this work, we developed an algorithm to improve the processing speech signal
based on the binaural hearing model. After receiving the mixed signals, for two microphones,
the algorithm increases the intelligibility of the signal of larger energy of one of the receivers.
Using two speakers and considering that each one is closer of one of the microphones, we
made use of the concepts of lateral inhibition and binaural masking, to recover the signal of
speech of larger energy of one of the receivers.
The algorithm was developed in platform matlab and it was compared with another
without use the lateral inhibition in the recovery of the desired signal. The results, appraised
through the calculation of the relative error and of the scale MOS, showed that the use of the
lateral inhibition in the recovery of the signal, improves the relative error between the desired
signal and the recovered signal and consequently the quality of the recovered signal. / O sistema auditivo humano é capaz de realizar diferentes tarefas que seriam úteis em
aplicações de engenharia. Uma delas é a habilidade de separar fontes sonoras, permitindo a
um ouvinte focar uma única fonte sonora em um ambiente ruidoso. Grandes investimentos
têm sido feitos no desenvolvimento de tecnologias aplicadas ao reconhecimento de voz, por
meio de máquinas, em ambientes reais. Para isso, diferentes técnicas de processamento
computacional têm sido propostas para a redução do ruído ambiente e melhoramento do sinal
desejado em ambiente acústico complexo (cocktail party). Essas técnicas são motivadas pelo
modelo do sistema auditivo humano em suas diferentes fases.
Neste trabalho, desenvolvemos um algoritmo para melhorar o processamento de um
sinal de fala baseado no modelo auditivo binaural. Após receber os sinais misturados, por dois
microfones, o algoritmo aumenta a inteligibilidade do sinal de maior energia de um dos
receptores. Utilizando dois oradores e considerando que cada um está mais próximo de um
dos receptores, fizemos uso dos conceitos de inibição lateral e mascaramento binaural, para
recuperar o sinal de fala de maior energia de um dos receptores.
O algoritmo foi desenvolvido sob a plataforma matlab e comparado com um outro
sem a utilização da inibição lateral na recuperação do sinal desejado. Os resultados, avaliados
através do cálculo do erro relativo e da escala MOS, mostraram que a utilização da inibição
lateral na recuperação do sinal, melhora o erro relativo entre o sinal desejado e o sinal
recuperado e conseqüentemente a qualidade do sinal recuperado.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2:tede/355 |
Date | 02 April 2004 |
Creators | Nascimento, Edil James de Jesus |
Contributors | BARROS FILHO, Allan Kardec Duailibe |
Publisher | Universidade Federal do Maranhão, PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET, UFMA, BR, Engenharia |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFMA, instname:Universidade Federal do Maranhão, instacron:UFMA |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds