Spelling suggestions: "subject:"reconhecimento automática dda voz"" "subject:"reconhecimento automática daa voz""
1 |
Etiquetagem automática de sinais de falaCoelho, Luís Filipe Martins Pinto January 2005 (has links)
Tese de mestr.. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2005
|
2 |
Modulo frontal para um sistema de reconhecimento automatico de vozVieira, Maurilio Nunes 19 January 1990 (has links)
Orientador : Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-14T03:56:40Z (GMT). No. of bitstreams: 1
Vieira_MaurilioNunes_M.pdf: 7214227 bytes, checksum: 5d821ba794641f130f8a003d9d242b40 (MD5)
Previous issue date: 1989 / Resumo: Este trabalho descreve o desenvolvimento do software para o Módulo Frontal de um Sistema de Reconhecimento Automático de Voz para operação na faixa de 0-4 kHz. O Módulo FrontaI , ou Processador Acústico, é responsável pela extração de traços a caracterização dos diversos sons da fala. O sinal de voz sofre uma filtragem passa-baixas com
corte em 3,4 kHz, é amostrado a 8,0 kHz e quantizado em 12 bits. As análises são feitas em quadros de 25 ms, deslocados a um passo de 5 ms, obtendo-se uma série de parâmetros, como o número de cruzamentos por zero, o período de pitch para os intervalos sonoros, a energia em diversas faixas de freqüência do espectro LPC (Linear Predictive Coding) e a freqüência, amplitude e largura de faixa dos três primeiros formantes. O quadro é classificado em uma dentre sete categorias:
silêncio, fricativo surdo, fricativo sonoro, oclusão sonora, vocálico, coarticulação eu indefinido. Esta última categoria
inclui segmentos que não podem ser confiavelmente classificados em nenhuma das outras categorias. A classificação é independente do locutor / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
3 |
Rede neural para reconhecimento adaptativo de fonemas ruidososGraciarena, Martin 22 July 1998 (has links)
Orientador: Marcio Luiz de Andrade Netto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T05:39:47Z (GMT). No. of bitstreams: 1
Graciarena_Martin_M.pdf: 12012337 bytes, checksum: f8b1660fd6fbf146c9c94eb63f38e664 (MD5)
Previous issue date: 1998 / Resumo: No presente trabalho é proposta a incorporação de um mecanismo adaptativo, o fIltro de Kalman, ao modelo tradicional de neurônio dando por resultado um modelo que chamamos Neurônio de Reconhecimento Adaptativo, especificamente destinado ao
reconhecimento ruidoso de padrões. O objetivo do modelo é a classificação da estimação do padrão limpo realizado pelo filtro de Kalman, a partir de suas observações ruidosas. Se estende naturalmente o modelo proposto a uma rede de neurônios que chamamos Rede Neural de Reconhecimento Adaptativo. Estudaremos também desde o ponto de vista teórico suas propriedades e o aplicaremos à classificação de padrões ruidosos e de séries temporais no problema XOR. As experiências foram feitas com o objetivo de estudar a robustez do mecanismo proposto frente ao problema de desemparelhamento de condição. Este pode resumir-se como os problemas que surgem com os sistemas de reconhecimento quando têm que reconhecer padrões em condições diferentes às presentes nos padrões de treinamento. Em todos os problemas de reconhecimento estudados, o treinamento das redes neurais é feito com exemplos não ruidosos. A proposta que se apresentará está incluída dentro dos classificadores robustos. Isto é, propõe mecanismos para que o classificador seja robusto à distorção ruidosa dos padrões. Isto em contraposição à estratégia clássica de filtrar o ruído na etapa das
características (chamadas características invariantes) e evitar que passem ao classificador. Mas o grande problema desta aproximação é que o classificador não é robusto ao ruído, portanto, em níveis de distorção onde as características não possam filtrar todo o ruído, existirá um erro no classificador. Aplicaremos o modelo proposto para a classificação de fonemas ruidosos. Para tal
fim a proposta é utilizar três diferentes arquiteturas. Estas diferem entre si na forma de extração do padrão de características do sinal de voz. A primeira implica em análise através de um banco de fIltros digitais onde os fIltros de Kalman estimam os valores médios da energia de saída de cada filtro.A segunda implica no uso de um modelo de predição linear extraído pelo filtro de Kalman diretamente do sinal de voz, onde os padrões a serem reconhecidos são os coeficientes de predição linear. A terceira é uma melhora sobre a
anterior, onde se classifica o ângulo dos coeficientes de predição linear. Para esta última arquitetura apresentamos o fundamento teórico de onde foi extraída. Junto com a proposta de dois índices de reconhecimento especificamente destinados a aplicações de voz, as arquiteturas propostas são primeiro comparadas no reconhecimento ruidoso de vogais espanholas afetadas por ruído branco gaussiano em diversas relações sinal - ruído e também no reconhecimento ruidoso de palavras, junto com os modelos Hidden Markov Models (HMM). A partir dos resultados encontrados no reconhecimento de palavras com a melhor arquitetura, foi proposta uma Rede Invariante. Esta tem a propriedade de ser robusta à compressão e dilatação dos padrões, que é a alteração sofrida pelos coeficientes de predição linear na presença do ruído. Esta é a rede que, juntamente com os coeficientes de predição linear foi a que melhor desempenho teve no reconhecimento ruidoso de palavras / Mestrado / Mestre em Engenharia Elétrica
|
4 |
Detector de voz para sistemas de interpolação digitalYamamoto, Jose Sindi 19 July 2018 (has links)
Orientador: Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia de Campinas / Made available in DSpace on 2018-07-19T03:53:37Z (GMT). No. of bitstreams: 1
Yamamoto_JoseSindi_M.pdf: 3092955 bytes, checksum: 42950eba7a21a08b996582c0962226c6 (MD5)
Previous issue date: 1982 / Resumo: Neste trabalho são apresentadas algumas estratégias para a discriminação do sinal de voz do ruído, aplicáveis aos detectores de voz para sistemas de interpolação digital. Para a definição destas estratégias, são feitos estudos comparativos entre as características dos sinais de voz e do ruído presente nas linhas telefônicas, tais como número médio de cruzamentos de zero, variação de envoltória, etc. Adicionalmente, é apresentada a implementação de um detectar digital de voz para o sistema de interpolação de voz por ora denominado "MCP-60" , que está sendo desenvolvido nos laboratórios de Eletrônica & Comunicações da Faculdade de Engenharia da Universidade Estadual de Campinas, bem como os resultados dos testes de desempenho realizados / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
5 |
Reconhecimento automatico de palavras isoladas : estudo e aplicação dos metodos deterministico e estocasticoBecerra Yoma, Nestor Jorge 22 November 1993 (has links)
Orientador: João Marcos Travassos Romano / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-19T03:38:55Z (GMT). No. of bitstreams: 1
BecerraYoma_NestorJorge_M.pdf: 4281211 bytes, checksum: 50437f9963c4004d71fc5db8cda87c30 (MD5)
Previous issue date: 1993 / Resumo: Esta dissertação objetiva o estudo e implementação das técnicas mais comumente utilizadas em reconhecimento de palavras isoladas, numa abordagem analítica e crítica. Neste sentido, os dois primeiros capítulos foram dedicados à apresentação dos métodos de parametrização e de reconhecimento de padrões acústicos, utilizando um certo rigor matemático, tendo sempre em vista as aplicações. A seguir, foram comparadas três técnicas de parametrização (coeficientes LPC, LPC-cepstral e Mel-cepstral) no que diz respeito à capacidade de assimilar características intra-locutor e inter-locutor, e quanto à robustez em relação ao ruído interferente. Para implementar estes testes comparativos foi sugerido o algoritmo DTW (método determinístico) que compara diretamente duas elocuções eliminando as diferenças temporais entre elas. Por último, foi descrita a implementação de um reconhecedor automático de dígitos independente do locutor empregando a técnica HMM (método estocástico) com modelamento por palavra e parametrização Mel-cepstral / Abstract: In this work, the most commonly used techniques employed in speech recognition for isolated words were studied and implemented. Initially the parametrization and acoustic pattern recognition methods were discussed. In the discussion, we not only maintained the mathematical formalism as suggested in the literature but also sought the easy way for the practical implementation of these techniques.
Three parametrization techniques, namely LPC,LPC-cepstral and Mel cepstral coefficients, were compared with respect to the assimilation capability of speaker-dependent and independent features, and noise robustness. Particularly, the DTW technique (deterministic analysis) was used for these comparative tests, which is capable of eliminating the time difference between two elocutions. A speaker independent digit recognizer was implemented employing the HMM techniques (stochastic analysis) with word modelling and Mel-cepstral coefficients / Mestrado / Mestre em Engenharia Elétrica
|
6 |
Sistema de notificação e reconhecimento automático de entidades em conteúdos audiovisuaisOliveira, João Carlos Loureiro de Jesus January 2008 (has links)
Estágio realizado na ClusterMedia Labs / Tese de mestrado integrado. Engenharia Informática e Computação. Faculdade de Engenharia. Universidade do Porto. 2008
|
7 |
Reconhecimento de orador em dois segundosMendes, Diana Rocha January 2011 (has links)
Tese de mestrado integrado. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2011
|
8 |
Reconhecimento automático de fala com processamento simultâneo de características acústicas e visuaisMoura, António Afonso de Abreu e January 2005 (has links)
Tese de mestrado. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2005
|
9 |
Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutorPegoraro, Tarciano Facco 26 July 2018 (has links)
Orientadores: Nestor Jorge Becerra Yoma, João Marcos Travassos Romano / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-26T19:51:20Z (GMT). No. of bitstreams: 1
Pegoraro_TarcianoFacco_M.pdf: 4134390 bytes, checksum: e90e8c4e7489b314016b2bfc3ed43482 (MD5)
Previous issue date: 2000 / Resumo: A voz é uma característica biométrica e, além das informações fonético-lingüísticas detectadas e classificadas pelos sistemas de reconhecimento de voz, também carrega informações que podem ser empregadas em tarefas de reconhecimento de locutor. Entretanto, sistemas de reconhecimento de voz e locutor sofrem uma sensível queda em seu desempenho na presença de ruído, tanto aditivo quanto convolucional. Esta dissertação mostra os estágios da implementação de um Sistema de Verificação de Locutor (SVL) e testes com algoritmos de robustez a ruído geralmente empregados em Sistemas de Reconhecimento de Voz. É realizado um breve estudo sobre a influência do ruído sobre a tecnologia de verificação de locutor e sobre as técnicas de robustez. Para os experimentos com o SVL são utilizadas três técnicas convencionais (subtração espectral (SS), a normalização da média cepstral (CMN), Log-RASTA) e um método de modelamento de duração de estados (MDE) com restrições temporais, recentemente proposto. Como verificado em reconhecimento de voz, todas estas técnicas também forneceram um bom desempenho para o SVL em questão. O ruído convolucional é quase que totalmente cancelado por CMN ou Log-RASTA, e o ruído aditivo tem sua influência bastante reduzida principalmente com o emprego conjunto de SS e MDE com truncamento simples. Com a presença de ambos os ruídos, SS, Log-RASTA e MDE com truncamento simples conjuntamente reduziram em até 87% a taxa de erros iguais. Verifica-se também que a presença de CMN e principalmente Log-RASTA reduz significativamente a variabilidade do limiar de decisão. A pesar dos resultados aqui apresentados mostrarem um importante avanço, a robustez de sistemas de reconhecimento de voz e de locutor a ruídos interferentes ainda são um problema complexo, e é o principal empecilho enfrentado em aplicações práticas reais / Abstract: The speech carries linguistic information that can be classified by speech recognition systems, and also information related to the speaker's characteristics, which is employed by speaker recognition methods. However, speech and speaker recognition tasks have the performance strongly degraded by noise environments, and this dissertation presents the results of experiments with a speaker verification system combined with noise robust algorithms usually used in speech recognition. Three conventional techniques were tested (spectral subtraction (SS), cepstral mean subtraction (CMN) and RAST A filtering) and a method for state duration modeling with temporal restrictions (MDE) that has recently been proposed. Firstly, an introduction to acoustic pattern matching algorithms is presented, and the speaker verification system employed in this dissertation is briefly described. Secondly, noise robust techniques are analyzed and discussed. Finally, these techniques are tested in the speaker verification system to cancel both additive and convolution noise, and the combinations of the noise robust methods are evaluated and compared. This dissertation shows that the techniques here addressed can give a high improvement in a speaker verification system, although the noise robustness of speech and speaker recognition systems is still a complex topic and the main problem to be addressed to make successful real applications of this technology / Mestrado / Mestre em Engenharia Elétrica
|
10 |
Implementação em tempo real de um sistema de reconhecimento de digitos conectadosAndreão, Rodrigo Varejão 27 July 2018 (has links)
Orientador: Luis Geraldo Pedroso Meloni / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-27T10:50:47Z (GMT). No. of bitstreams: 1
Andreao_RodrigoVarejao_M.pdf: 575648 bytes, checksum: c5a9a006fcd82bdc9f8503d29e5146e8 (MD5)
Previous issue date: 2001 / Mestrado
|
Page generated in 0.0827 seconds