Return to search

Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor

Orientadores: Nestor Jorge Becerra Yoma, João Marcos Travassos Romano / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-26T19:51:20Z (GMT). No. of bitstreams: 1
Pegoraro_TarcianoFacco_M.pdf: 4134390 bytes, checksum: e90e8c4e7489b314016b2bfc3ed43482 (MD5)
Previous issue date: 2000 / Resumo: A voz é uma característica biométrica e, além das informações fonético-lingüísticas detectadas e classificadas pelos sistemas de reconhecimento de voz, também carrega informações que podem ser empregadas em tarefas de reconhecimento de locutor. Entretanto, sistemas de reconhecimento de voz e locutor sofrem uma sensível queda em seu desempenho na presença de ruído, tanto aditivo quanto convolucional. Esta dissertação mostra os estágios da implementação de um Sistema de Verificação de Locutor (SVL) e testes com algoritmos de robustez a ruído geralmente empregados em Sistemas de Reconhecimento de Voz. É realizado um breve estudo sobre a influência do ruído sobre a tecnologia de verificação de locutor e sobre as técnicas de robustez. Para os experimentos com o SVL são utilizadas três técnicas convencionais (subtração espectral (SS), a normalização da média cepstral (CMN), Log-RASTA) e um método de modelamento de duração de estados (MDE) com restrições temporais, recentemente proposto. Como verificado em reconhecimento de voz, todas estas técnicas também forneceram um bom desempenho para o SVL em questão. O ruído convolucional é quase que totalmente cancelado por CMN ou Log-RASTA, e o ruído aditivo tem sua influência bastante reduzida principalmente com o emprego conjunto de SS e MDE com truncamento simples. Com a presença de ambos os ruídos, SS, Log-RASTA e MDE com truncamento simples conjuntamente reduziram em até 87% a taxa de erros iguais. Verifica-se também que a presença de CMN e principalmente Log-RASTA reduz significativamente a variabilidade do limiar de decisão. A pesar dos resultados aqui apresentados mostrarem um importante avanço, a robustez de sistemas de reconhecimento de voz e de locutor a ruídos interferentes ainda são um problema complexo, e é o principal empecilho enfrentado em aplicações práticas reais / Abstract: The speech carries linguistic information that can be classified by speech recognition systems, and also information related to the speaker's characteristics, which is employed by speaker recognition methods. However, speech and speaker recognition tasks have the performance strongly degraded by noise environments, and this dissertation presents the results of experiments with a speaker verification system combined with noise robust algorithms usually used in speech recognition. Three conventional techniques were tested (spectral subtraction (SS), cepstral mean subtraction (CMN) and RAST A filtering) and a method for state duration modeling with temporal restrictions (MDE) that has recently been proposed. Firstly, an introduction to acoustic pattern matching algorithms is presented, and the speaker verification system employed in this dissertation is briefly described. Secondly, noise robust techniques are analyzed and discussed. Finally, these techniques are tested in the speaker verification system to cancel both additive and convolution noise, and the combinations of the noise robust methods are evaluated and compared. This dissertation shows that the techniques here addressed can give a high improvement in a speaker verification system, although the noise robustness of speech and speaker recognition systems is still a complex topic and the main problem to be addressed to make successful real applications of this technology / Mestrado / Mestre em Engenharia Elétrica

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259689
Date26 July 2018
CreatorsPegoraro, Tarciano Facco
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Romano, João Marcos Travassos, 1960-, Becerra Yoma, Nestor Jorge, Yoma, Nestor Jorge Becerra, Romano, João Marcos Travassos, Ling, Lee Luan, Portugheis, Jaime, Miranda, Maria
Publisher[s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format101p. : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds