Orientador: João Marcos Travassos Romano / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-19T03:38:55Z (GMT). No. of bitstreams: 1
BecerraYoma_NestorJorge_M.pdf: 4281211 bytes, checksum: 50437f9963c4004d71fc5db8cda87c30 (MD5)
Previous issue date: 1993 / Resumo: Esta dissertação objetiva o estudo e implementação das técnicas mais comumente utilizadas em reconhecimento de palavras isoladas, numa abordagem analítica e crítica. Neste sentido, os dois primeiros capítulos foram dedicados à apresentação dos métodos de parametrização e de reconhecimento de padrões acústicos, utilizando um certo rigor matemático, tendo sempre em vista as aplicações. A seguir, foram comparadas três técnicas de parametrização (coeficientes LPC, LPC-cepstral e Mel-cepstral) no que diz respeito à capacidade de assimilar características intra-locutor e inter-locutor, e quanto à robustez em relação ao ruído interferente. Para implementar estes testes comparativos foi sugerido o algoritmo DTW (método determinístico) que compara diretamente duas elocuções eliminando as diferenças temporais entre elas. Por último, foi descrita a implementação de um reconhecedor automático de dígitos independente do locutor empregando a técnica HMM (método estocástico) com modelamento por palavra e parametrização Mel-cepstral / Abstract: In this work, the most commonly used techniques employed in speech recognition for isolated words were studied and implemented. Initially the parametrization and acoustic pattern recognition methods were discussed. In the discussion, we not only maintained the mathematical formalism as suggested in the literature but also sought the easy way for the practical implementation of these techniques.
Three parametrization techniques, namely LPC,LPC-cepstral and Mel cepstral coefficients, were compared with respect to the assimilation capability of speaker-dependent and independent features, and noise robustness. Particularly, the DTW technique (deterministic analysis) was used for these comparative tests, which is capable of eliminating the time difference between two elocutions. A speaker independent digit recognizer was implemented employing the HMM techniques (stochastic analysis) with word modelling and Mel-cepstral coefficients / Mestrado / Mestre em Engenharia Elétrica
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/261458 |
Date | 22 November 1993 |
Creators | Becerra Yoma, Nestor Jorge |
Contributors | UNIVERSIDADE ESTADUAL DE CAMPINAS, Romano, João Marcos Travassos, 1960-, Romano, João Marcos Travassos |
Publisher | [s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 1v. (varias paginações) : il., application/pdf |
Source | reponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0018 seconds