Global ETD Search

1	Processamento do sinal de voz para o diagnóstico diferencial de alterações laríngeas Zwetsch, Iuberi Carson January 2006 (has links) Made available in DSpace on 2013-08-07T18:53:25Z (GMT). No. of bitstreams: 1 000388874-Texto+Parcial-0.pdf: 361292 bytes, checksum: 3b1a052f934e1c542258b1e39862e2eb (MD5) Previous issue date: 2006 / This work deals with the development processing technique of signals that uses as principle the Cepstral Analysis of the voice signal for the development of a recognition system to vocal folds diseases, to be getting at to alternative for the habitually used techniques. The objective is getting a efficient and reliable voice analysis system, that it provides tool auxiliary in the diagnostic and therapeutical process, interchanging areas of the health as medicine and fonoaudiology with engineering, to improve the applicability in the attainment and manipulation of the common data of this subject to these professions. After a revision of the considered important topics, for the agreement of the signal voice analysis, an implementation in two stages is carried through: signals analysis with the Cepstral technique, and after, another stage where Cepstrais characteristics joined of each disease are identified so that if it gets of diseases recognition standards. At the first phase, the vocal folds diseases acoustic signals are separate in groups, where previously the diagnosis through endoscopic examination of 61 individuals was gotten, all adults, being diagnosised as 17 presenting vocal fold cyst, 9 with vocal fold ridge, 8 with vocal fold polyp, 5 with Reinke edema, 9 with nodules and 13 normal ones. These diseases represent most of the patient diagnostics who consult with complaints of hoarseness in the doctor's offices of the otorrinolaringologists. The method of signal processing used was the Cepstral analysis as comparison parameter between the alterations of each disease and the isolation of the signal significant characteristics for the application in the identification methods. In the stage of identification it was carried through the characteristics separation and the diseases classification in a way that was possible to be gotten a diagnosis protocol. With the technique applied in this work and the similarity of the voices signals gotten standards, it was possible to get an automatic recognition of the disease with high identification tax (89%). The project of vocal folds disease identification is, therefore, capable to discriminate, of efficient form, the disease from its characteristics presented acoustics, independently of the patient sex and small variations in the disease and the signal acquisition satisfying what it is considered in this work. / Este trabalho trata do desenvolvimento de técnica de processamento de sinais que usa como princípio a Análise Cepstral do sinal da voz para o desenvolvimento de um sistema de reconhecimento de alterações das pregas vocais, visando obter alternativas para as técnicas habitualmente usadas. O objetivo é obter um sistema de análise de voz eficiente, que proporcione ferramenta auxiliar no processo diagnóstico e terapêutico, intercambiando áreas da saúde como medicina e fonoaudiologia com a engenharia, para aprimorar a aplicabilidade na obtenção e manipulação dos dados deste tema em comum a estas profissões. Após uma revisão dos tópicos considerados importantes, para o entendimento de análise do sinal da voz, é realizada uma implementação em duas etapas: uma de análise dos sinais com a técnica Cepstral e após, outra etapa onde as características Cepstrais encontradas em cada caso são identificadas para que se obtenha padrões de reconhecimento das alterações laríngeas. Na primeira fase os sinais acústicos das alterações vocais são separados em grupos, onde previamente se obteve o diagnóstico exame endoscópico de 61 pessoas, todos adultos, sendo diagnosticados como 17 apresentando cisto de prega vocal, 9 com sulco de prega vocal, 8 com pólipo de prega vocal, 5 com edema de Reinke, 9 com nódulos e 13 normais. As alterações laríngeas em estudo representam a maior parte dos diagnósticos dos pacientes que consultam com queixas de rouquidão nos consultórios dos otorrinolaringologistas. [23] O método de processamento do sinal utilizado foi o de análise Cepstral como parâmetro de comparação entre os achados de cada alteração laríngea e o isolamento das características significativas do sinal para a aplicação nos métodos de identificação. Na etapa de identificação foram realizadas a separação das características e a classificação das alterações laríngeas de uma maneira que foi possível ser obtido um protocolo de diagnóstico. Com a técnica aplicada neste trabalho e a similaridade dos padrões obtidos dos sinais das vozes, foi possível obter um reconhecimento automático das alterações laríngeas com taxa de identificação elevada (89 %). O projeto de identificação das alterações das pregas vocais é, portanto, capaz de discriminar, de forma eficiente, as alterações laríngeas a partir das suas características acústicas apresentadas, independentemente do sexo do paciente e de pequenas variações na alteração laríngea e na obtenção do sinal satisfazendo o que é proposto neste trabalho. ENGENHARIA ELÉTRICA RECONHECIMENTO DE VOZ (INFORMÁTICA) PROCESSAMENTO DE SINAIS
2	Análise de um sistema de reconhecimento de voz baseado em fonemas. Carlos Toshinori Ishi 00 December 1998 (has links) Esta tese de Mestrado apresenta um estudo do comportamento de fonemas da língua portuguesa para sistemas de reconhecimento de voz baseados em fonemas. dentro desse vasto campo de pesquisa, é dada ênfase à análise para segmentação de voz contínua em categorias fonéticas, baseada em medidas de energia, informação espectral e informação de sonoridade do segmento. Durante a análise dos resultados dos trabalhos de segmentação, notou-se que na fala coloquial da língua portuguesa, há forte tendência a pronunciar na forma surda (ou seja, sem vibração das cordas vocais) as vogais presentes em sílabas átonas postônicas, e que isto causava uma mudança de comportamento nos fonemas oclusivos /p/ e /t/, quando seguidos por essas vogais surdas. Assim, esta tese também abordará a tarefa de reconhecimento de fonemas oclusivos surdos quando seguidos de uma reda neural, resultando em uma boa taxa de reconhecimento. Reconhecimento de voz Processamento de sinais Redes neurais Fala Computação Engenharia eletrônica
3	Modelo de rede neuronal aplicado ao reconhecimento de fonemas vocálicos presentes em um vocabulário de comando Plínio Almeida Barbosa 01 October 1990 (has links) Procurando contornar problemas inerentes às abordagens cognitiva e estatística em reconhecimento de voz, propõe-se a utilização de uma rede neuronal. Implementou-se um modelo simples de rede neuronal para o reconhecimento de alguns fonemas vocálicos pertencentes a um vocabulário de comando. O treinamento da rede foi feito com elocuções provindas de quatro locutores. Um conjunto distinto de locutores forneceu dados aplicados à entrada da rede para a realização dos testes. Em relação a outros sistemas de reconhecimento, a utilização da rede neuronal apresenta as vantagens de ser um algoritmo iterativo simples, mostrando pra o caso aplicado um comportamento estável e com possibilidades de aprendizagem para distinguir entre novas realizações de fonemas. A rede neuronal caracteriza-se pelo esforço necessário para o estabelecimento de sua estrutura e processo de aprendizagem. Concluída esta fase, a realização das funções de classificação e reconhecimento é imediata. Inteligência artificial Reconhecimento de padrões Reconhecimento de voz Redes neurais Telecomunicações Computação
4	Estudo de um modelo para reconhecimento de voz baseado em discriminação acústico-fonética Rafael Michelin Laboissiére 01 September 1988 (has links) Alguns aspectos relevantes da comunicação homem-máquina por meio da fala são discutidos neste trabalho, propondo-se uma abordagem estatística ao problema de reconhecimento de voz. Neste contexto, é proposto um modelo para discriminação dos elementos acústico-fonéticos presentes no sinal de voz, denominado decodificador fonético. A estrutura básica do modelo é uma cadeia de Markov, formada segundo algumas evidências linguísticas. A descrição matemática do modelo, compostas pelos algoritmos de estimação de verossimilhança e de estimação dos parâmetros do modelo, é apresentada. Foram realizadas simulações com uma linguagem artificial, criada de forma a testar a capacidade de decodificação acústico-fonética do modelo, onde observou-se um bom desempenho na segmentação do sinal de voz em elementos acústico-fonéticos básicos. Inteligência artificial Reconhecimento de voz Processamento de sinais Reconhecimento de padrões Computação Telecomunicações
5	Redução do erro de classificação de redes neurais aplicada ao reconhecimento de fonemas multilocutor Alexandre Girardi 01 January 1992 (has links) Neste trabalho foi desenvolvida uma camada de pre-processamento derivada de uma expansão de uma estrutura clássica de rede neural sem realimentação, que utiliza como algoritmo de treinamento o método de retropropagação do erro, aplicada ao reconhecimento de fonemas multilocutor. Esta camada de pré-processamento atua de forma que a rede possa determinar automaticamente o melhor conjunto de dados de entrada da rede, baseados em faixas de frequências, através dos erros propagados pela própria rede, de forma que esta não convirja para uma melhor classificação dos fonemas de entrada. Foram testadas para esse fim algumas estratégias associadas ao treinamento envolvido nesta camada de pré-processamento. Os experimentos condiziram ao desenvolvimento de uma estratégia capaz de reduzir o erro de classificação em média em 10% em relação ao obtido sem sua utilização. Redes neurais Reconhecimento de padrões Reconhecimento de voz Inteligência artificial Computação
6	Análise de funções de erro em sistemas de codificação LPC Hani Camille Yehia 01 November 1993 (has links) A estimação dos coeficientes preditores, em sistemas de codificação de voz baseados em LPC, e realizada través de minimização do valor esperado de uma função do erro de predição. Normalmente utiliza-se uma função quadrática, pois com isso minimiza-se a energia do erro de predição, alem de ser possível uma solução analítica para o problema. Entretanto, não e necessariamente verdade que a minimização da energia do erro de predição esteja associada a maximização do fator de qualidade (ponderado pela curva de resposta do ouvido humano) do sinal decodificado. Neste trabalho, funções de erro alternativas são analisadas e, a seguir, a possibilidade de se adotar um erro de predição relativo e testada. Os resultados obtidos indicam que, apesar do erro quadrático apresentar um bom desempenho quando comparado as funções de erro alternativas, a utilização de um erro de predição relativo pode ser útil em algumas situações. Telecomunicações Reconhecimento de voz Predição Transmissão do som Engenharia eletrônica Computação
7	Máquinas de tradução aplicada à comunicação em tempo real para desenvolvimento distribuído de software Duarte, Tiago da Silveira January 2014 (has links) Made available in DSpace on 2014-12-06T01:01:18Z (GMT). No. of bitstreams: 1 000463519-Texto+Completo-0.pdf: 1845086 bytes, checksum: dea8d1ebf4d1c816a35b958ede396328 (MD5) Previous issue date: 2014 / The globalization allows companies to seek partnership for global project development in other countries. The domain of spoken English is considered one of the main reasons for the success of countries such as Ireland and India in global software development. However, A. T Kearney consultancy estimates that Brazil has only 5,4% of population fluent in English, and this is an important challenge that makes difficult the growth of geographically distributed software development in the country. In order to reduce the barriers posed by language differences, studies have been conducted to assess how machine translation can be used in the context of global software development in order to minimize or overcome such barriers. The goal of this research was in this context and aimed to study how speech translation can be used in global software development projects. In this research we first executed studies related to speech recognition and machine translation areas and identified available technologies for translation and speech recognition. After having identified these technologies, a simulation study was planned and executed in order to evaluate one of the identified technologies. The purpose of this study was to understand the feasibility of the available technology for speech recognition and translation for Brazilian Portuguese. The findings of the simulation indicate that Google technologies for speech recognition and translation for Brazilian Portuguese have adequate accuracy and could be used to create a complete machine translation in this language. / O aumento da globalização possibilita que mais empresas busquem parcerias para execução de projetos em outros países. O domínio do idioma inglês, por exemplo, é considerado um dos principais fatores para o sucesso de alguns países como Irlanda e Índia em desenvolvimento global de software. Entretanto, a consultoria A. T Kearney estima que o Brasil tem apenas 5,4% da população fluente em inglês, e isto acaba se tornando um desafio para o desenvolvimento de software com equipes distribuídas geograficamente com integrantes que não dominam o mesmo idioma. Com o objetivo de reduzir as barreiras impostas pela diferença de idioma, estudos têm sido conduzidos para avaliar de que forma máquinas de tradução podem ser utilizadas em um contexto de Desenvolvimento Distribuído de Software, a fim de minimizar ou transpor tais barreiras. O tema desta pesquisa está inserido neste contexto e teve como objetivo estudar como máquinas de tradução podem ser utilizadas em projetos de desenvolvimento distribuído de software. Inicialmente foram realizados estudos na área de reconhecimento de voz e máquina de tradução, visando identificar tecnologias de tradução e reconhecimento de voz disponíveis. As tecnologias foram estudadas e foi então proposto um estudo de simulação com uma destas tecnologias, para avaliar se ela poderia ser utilizada para compor um tradutor de voz para o idioma português brasileiro. Por fim, os resultados da simulação levantaram indícios de que as tecnologias do Google para reconhecimento de voz no idioma português e para tradução do português para o inglês possuem níveis adequados de precisão e poderiam ser utilizadas no desenvolvimento de uma máquina de tradução de voz para o idioma português. INFORMÁTICA RECONHECIMENTO DE VOZ (INFORMÁTICA) TRADUÇÃO AUTOMÁTICA ENGENHARIA DE SOFTWARE
8	Redução de ruído para sistemas de reconhecimento de voz utilizando subespaços vetoriais. / Noise reduction for speech recognition systems using vector subspaces. SANTOS JÚNIOR, Gutemberg Gonçalves dos. 20 August 2018 (has links) Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-20T20:10:09Z No. of bitstreams: 1 GUTEMBERG GONÇALVES DOS SANTOS JÚNIOR - DISSERTAÇÃO PPGEE 2009..pdf: 2756190 bytes, checksum: 5812d37f7ad4c18eb26e9672d4890812 (MD5) / Made available in DSpace on 2018-08-20T20:10:09Z (GMT). No. of bitstreams: 1 GUTEMBERG GONÇALVES DOS SANTOS JÚNIOR - DISSERTAÇÃO PPGEE 2009..pdf: 2756190 bytes, checksum: 5812d37f7ad4c18eb26e9672d4890812 (MD5) Previous issue date: 2009-05-08 / O estabelecimento de uma interface de comunicação através da voz entre seres humanos e computadores vem sendo perseguido desde o início da era da computação. Nesta direção, diversos avanços foram realizados nas últimas seis décadas, permitindo o uso comercial de aplicações com reconhecimento de voz nos dias atuais. Entretanto, fatores como ruídos, reverberações, distorções entre outros, comprometem o desempenho desses sistemas ao reduzir a taxa de acerto quando submetidos a ambientes adversos. Assim, o estudo de técnicas que diminuam os efeitos desses problemas é de grande valia e vem ganhando destaque nas últimas décadas. O trabalho apresentado nesta dissertação tem como objetivo a redução dos problemas referentes aos ruídos característicos de ambientes automotivos, tornando os sistemas de reconhecimento de voz utilizados nesses ambientes mais robustos. Dessa forma, o controle de funcionalidades não-críticas de um automóvel, ou seja, funcionalidades que não coloquem em risco a vida do usuário como tocadores de música e ar condicionado, pode ser realizado através de comandos de voz. O sistema proposto é baseado numa etapa de pré-processamento do sinal de voz através do método de subespaços vetoriais. O desempenho deste método está diretamente relacionado com as dimensões (linhas× colunas) das matrizes representativas do sinal de entrada. Levando isso em consideração, a decomposição ULLV, apesar de se tratar de uma aproximação do método de subespaços vetoriais, foi utilizada por oferecer uma menor complexidade computacional quando comparada a métodos tradicionais baseados na decomposição SVD. O sistema de reconhecimento de voz Julius foi o escolhido para o estudo de caso por se tratar de um sistema desenvolvido em código livre que oferece um alto desempenho. Um banco de dados de voz com 44800 amostras foi gerado com o modelo de um ambiente automotivo. Por ﬁm, a robustez do sistema foi avaliada e comparada com um método tradicional de redução de ruído chamado subtração espectral. / The establishment of a speech-based communication interface between humans and computers has been pursued since the beginning of the computer era. Several studies have been made over the last six decades in order to accomplish this interface, making possible commercial use of speech recognition applications. However, factors such as noise, reverberation, distortion among others degrades the performance of these systems. Thus, reducing their success rate when operating in adverse environments. With this in mind, the study of techniques to reduce the impact of these problems is of a great value and has gained prominence in recent decades. The work presented in this dissertation aims to reduce problems related to noise encountered in an automotive environment, improving the speech recognition system robustness. Thus,controlofnon-critical features of a car, such as CD player and air conditioning, can be performed through voice commands. The proposed system is based on a speech signal preprocessing step using the signal subspace method. Its performance is related to the size (lines× columns) of the matrices that represents the input signal. Therefore, the ULLV decomposition was used because it oﬀers a lower computational complexity compared to traditional methods based on SVD decomposition. The speech recognizer Julius is an open source software that oﬀers high performance and was the chosen one for the case study. A noisy speech database with 44800 samples was generated to model the automotive environment. Finally, the robustness of the system was evaluated and compared with a traditional method of noise reduction called spectral subtraction. Ciência da Computação. Sistemas de reconhecimento de voz Redução de ruído - sistema de voz Subespaços vetoriais Processamento de sinais de voz Voz e tecnologia Reconhecimento de voz Ruídos de ambientes automotivos Decomposição ULLV Voice Recognition Systems Processing of voice signals
9	Reconhecimento automático do locutor com redes neurais pulsadas. / Automatic speaker recognition using pulse coupled neural networks. Timoszczuk, Antonio Pedro 22 March 2004 (has links) As Redes Neurais Pulsadas são objeto de intensa pesquisa na atualidade. Neste trabalho é avaliado o potencial de aplicação deste paradigma neural, na tarefa de reconhecimento automático do locutor. Após uma revisão dos tópicos considerados importantes para o entendimento do reconhecimento automático do locutor e das redes neurais artificiais, é realizada a implementação e testes do modelo de neurônio com resposta por impulsos. A partir deste modelo é proposta uma nova arquitetura de rede com neurônios pulsados para a implementação de um sistema de reconhecimento automático do locutor. Para a realização dos testes foi utilizada a base de dados Speaker Recognition v1.0, do CSLU Center for Spoken Language Understanding do Oregon Graduate Institute - E.U.A., contendo frases gravadas a partir de linhas telefônicas digitais. Para a etapa de classificação foi utilizada uma rede neural do tipo perceptron multicamada e os testes foram realizados no modo dependente e independente do texto. A viabilidade das Redes Neurais Pulsadas para o reconhecimento automático do locutor foi constatada, demonstrando que este paradigma neural é promissor para tratar as informações temporais do sinal de voz. / Pulsed Neural Networks have received a lot of attention from researchers. This work aims to verify the capability of this neural paradigm when applied to a speaker recognition task. After a description of the automatic speaker recognition and artificial neural networks fundamentals, a spike response model of neurons is tested. A novel neural network architecture based on this neuron model is proposed and used in a speaker recognition system. Text dependent and independent tests were performed using the Speaker Recognition v1.0 database from CSLU Center for Spoken Language Understanding of Oregon Graduate Institute - U.S.A. A multilayer perceptron is used as a classifier. The Pulsed Neural Networks demonstrated its capability to deal with temporal information and the use of this neural paradigm in a speaker recognition task is promising. neural networks pulse coupled neural networks reconhecimento de voz redes neurais redes neurais pulsadas speaker recognition
10	Processamento do sinal de voz para o diagn?stico diferencial de altera??es lar?ngeas Zwetsch, Iuberi Carson 31 October 2006 (has links) Made available in DSpace on 2015-04-14T13:56:20Z (GMT). No. of bitstreams: 1 388874.pdf: 361292 bytes, checksum: 3b1a052f934e1c542258b1e39862e2eb (MD5) Previous issue date: 2006-10-31 / Este trabalho trata do desenvolvimento de t?cnica de processamento de sinais que usa como princ?pio a An?lise Cepstral do sinal da voz para o desenvolvimento de um sistema de reconhecimento de altera??es das pregas vocais, visando obter alternativas para as t?cnicas habitualmente usadas. O objetivo ? obter um sistema de an?lise de voz eficiente, que proporcione ferramenta auxiliar no processo diagn?stico e terap?utico, intercambiando ?reas da sa?de como medicina e fonoaudiologia com a engenharia, para aprimorar a aplicabilidade na obten??o e manipula??o dos dados deste tema em comum a estas profiss?es. Ap?s uma revis?o dos t?picos considerados importantes, para o entendimento de an?lise do sinal da voz, ? realizada uma implementa??o em duas etapas: uma de an?lise dos sinais com a t?cnica Cepstral e ap?s, outra etapa onde as caracter?sticas Cepstrais encontradas em cada caso s?o identificadas para que se obtenha padr?es de reconhecimento das altera??es lar?ngeas. Na primeira fase os sinais ac?sticos das altera??es vocais s?o separados em grupos, onde previamente se obteve o diagn?stico exame endosc?pico de 61 pessoas, todos adultos, sendo diagnosticados como 17 apresentando cisto de prega vocal, 9 com sulco de prega vocal, 8 com p?lipo de prega vocal, 5 com edema de Reinke, 9 com n?dulos e 13 normais. As altera??es lar?ngeas em estudo representam a maior parte dos diagn?sticos dos pacientes que consultam com queixas de rouquid?o nos consult?rios dos otorrinolaringologistas.[23] O m?todo de processamento do sinal utilizado foi o de an?lise Cepstral como par?metro de compara??o entre os achados de cada altera??o lar?ngea e o isolamento das caracter?sticas significativas do sinal para a aplica??o nos m?todos de identifica??o. Na etapa de identifica??o foram realizadas a separa??o das caracter?sticas e a classifica??o das altera??es lar?ngeas de uma maneira que foi poss?vel ser obtido um protocolo de diagn?stico. Com a t?cnica aplicada neste trabalho e a similaridade dos padr?es obtidos dos sinais das vozes, foi poss?vel obter um reconhecimento autom?tico das altera??es lar?ngeas com taxa de identifica??o elevada (89 %). O projeto de identifica??o das altera??es das pregas vocais ?, portanto, capaz de discriminar, de forma eficiente, as altera??es lar?ngeas a partir das suas caracter?sticas ac?sticas apresentadas, independentemente do sexo do paciente e de pequenas varia??es na altera??o lar?ngea e na obten??o do sinal satisfazendo o que ? proposto neste trabalho ENGENHARIA EL?TRICA RECONHECIMENTO DE VOZ (INFORM?TICA) PROCESSAMENTO DE SINAIS CNPQ::ENGENHARIAS

Search results