Return to search

Rede neural para reconhecimento adaptativo de fonemas ruidosos

Orientador: Marcio Luiz de Andrade Netto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T05:39:47Z (GMT). No. of bitstreams: 1
Graciarena_Martin_M.pdf: 12012337 bytes, checksum: f8b1660fd6fbf146c9c94eb63f38e664 (MD5)
Previous issue date: 1998 / Resumo: No presente trabalho é proposta a incorporação de um mecanismo adaptativo, o fIltro de Kalman, ao modelo tradicional de neurônio dando por resultado um modelo que chamamos Neurônio de Reconhecimento Adaptativo, especificamente destinado ao
reconhecimento ruidoso de padrões. O objetivo do modelo é a classificação da estimação do padrão limpo realizado pelo filtro de Kalman, a partir de suas observações ruidosas. Se estende naturalmente o modelo proposto a uma rede de neurônios que chamamos Rede Neural de Reconhecimento Adaptativo. Estudaremos também desde o ponto de vista teórico suas propriedades e o aplicaremos à classificação de padrões ruidosos e de séries temporais no problema XOR. As experiências foram feitas com o objetivo de estudar a robustez do mecanismo proposto frente ao problema de desemparelhamento de condição. Este pode resumir-se como os problemas que surgem com os sistemas de reconhecimento quando têm que reconhecer padrões em condições diferentes às presentes nos padrões de treinamento. Em todos os problemas de reconhecimento estudados, o treinamento das redes neurais é feito com exemplos não ruidosos. A proposta que se apresentará está incluída dentro dos classificadores robustos. Isto é, propõe mecanismos para que o classificador seja robusto à distorção ruidosa dos padrões. Isto em contraposição à estratégia clássica de filtrar o ruído na etapa das
características (chamadas características invariantes) e evitar que passem ao classificador. Mas o grande problema desta aproximação é que o classificador não é robusto ao ruído, portanto, em níveis de distorção onde as características não possam filtrar todo o ruído, existirá um erro no classificador. Aplicaremos o modelo proposto para a classificação de fonemas ruidosos. Para tal
fim a proposta é utilizar três diferentes arquiteturas. Estas diferem entre si na forma de extração do padrão de características do sinal de voz. A primeira implica em análise através de um banco de fIltros digitais onde os fIltros de Kalman estimam os valores médios da energia de saída de cada filtro.A segunda implica no uso de um modelo de predição linear extraído pelo filtro de Kalman diretamente do sinal de voz, onde os padrões a serem reconhecidos são os coeficientes de predição linear. A terceira é uma melhora sobre a
anterior, onde se classifica o ângulo dos coeficientes de predição linear. Para esta última arquitetura apresentamos o fundamento teórico de onde foi extraída. Junto com a proposta de dois índices de reconhecimento especificamente destinados a aplicações de voz, as arquiteturas propostas são primeiro comparadas no reconhecimento ruidoso de vogais espanholas afetadas por ruído branco gaussiano em diversas relações sinal - ruído e também no reconhecimento ruidoso de palavras, junto com os modelos Hidden Markov Models (HMM). A partir dos resultados encontrados no reconhecimento de palavras com a melhor arquitetura, foi proposta uma Rede Invariante. Esta tem a propriedade de ser robusta à compressão e dilatação dos padrões, que é a alteração sofrida pelos coeficientes de predição linear na presença do ruído. Esta é a rede que, juntamente com os coeficientes de predição linear foi a que melhor desempenho teve no reconhecimento ruidoso de palavras / Mestrado / Mestre em Engenharia Elétrica

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259558
Date22 July 1998
CreatorsGraciarena, Martin
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Andrade Netto, Marcio Luiz de, 1947-, Netto, Marcio Luiz de Andrade
Publisher[s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format1v. (varias paginações) : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0153 seconds