Global ETD Search

11	Redução de ruídos em sinais de voz utilizando uma função de ganhos adaptativa para o filtro de Wiener Silva, Luiz Felipe da January 2011 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica. / Made available in DSpace on 2012-10-26T07:46:25Z (GMT). No. of bitstreams: 1 301279.pdf: 1226847 bytes, checksum: 0cb0c2277bd8cd20a78359b2dd08d11a (MD5) / Muitas técnicas de redução de ruído, especialmente a filtragem de Wiener, sofrem com a introdução de ruído musical e distorção do sinal de voz em SNRs baixas devido às suas funções ganho rígidas. Neste trabalho propomos uma modificação do filtro de Wiener paramétrico para enfatizar as contribuições espectrais nas regiões do espectro que são importantes para inteligibilidade. Isto é feito definindo um parâmetro adaptativo que é uma função do pitch. Medidas objetivas e testes estatísticos são usados para avaliar a qualidade subjetiva e inteligibilidade do sinal de voz. Os resultados indicam que o algoritmo proposto resulta na melhora da inteligibilidade e redução do ruído musical do sinal de voz processado, comparado com o filtro de Wiener convencional. / Many existing speech enhancement techniques, especially Wiener filtering, suffer from introducing annoying musical noise and speech distortion in low SNR due to their rigid gain functions. In this work we propose a modification to the parametric Wiener filter that emphasizes the spectral contributions in spectral regions which are important for intelligibility. This is done by defining an adaptive parameter that is a function of the pitch. Objective measures and statistical tests are used to assess subjective speech quality and intelligibility. The results indicate that the proposed algorithm results in speech intelligibility improvement and in musical noise reduction, as compared to the conventional Wiener filter. Engenharia eletrica Wiener, Filtragem de Estatistica Entonação (Fonética) Reconhecimento automatico da voz Ruido
12	Desenvolvimento de um protótipo de aplicativo móvel para conversão de voz em texto e texto em voz, orientado ao apoio à comunicação de deficientes auditivos Furlan, Andreson Luís January 2016 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Campus Araranguá, Programa de Pós-Graduação em Tecnologias da Informação e Comunicação, Araranguá, 2016 / Made available in DSpace on 2017-06-27T04:05:38Z (GMT). No. of bitstreams: 1 345870.pdf: 3060639 bytes, checksum: 8d6e7b45db7468b1d1e33d776589fde7 (MD5) Previous issue date: 2016 / A deficiência auditiva atinge milhões de pessoas no Brasil. Os surdos adotam como língua para a comunicação a Língua Brasileira de Sinais. Entretanto, a maior parte da população desconhece a Língua Brasileira de Sinais, dificultando a comunicação entre o deficiente auditivo e a população ouvinte. Dado o problema em questão e após a discussão com intérpretes da Língua Brasileira de Sinais, o presente trabalho construiu um modelo e um protótipo de aplicativo de conversão de voz em texto e texto em voz para auxiliar a comunicação de deficientes auditivos bilíngues com as pessoas desconhecedoras da Língua de Sinais. Para auxiliar a superar as limitações de qualquer deficiência, a área de tecnologia assistiva, contribui desenvolvendo tecnologias que melhoram a vida das pessoas com deficiência. O protótipo foi desenvolvido para a plataforma Android, utilizando o conceito de aplicação híbrida, reconhecimento de voz e leitura e reprodução de texto. O protótipo então foi divulgado via redes sociais para todo o Brasil. Posteriormente foram coletados os feedbacks dos usuários quanto ao seu funcionamento e sugestões de melhorias. Os comentários demonstraram que o protótipo auxilia na comunicação de deficientes auditivos e ouvintes, aumentando a acessibilidade das pessoas com esta deficiência, mas que requer aprimoramentos de design e reconhecimento de fala on-line. Com base na análise dos dados e o retorno positivo dos usuários, entende-se que o protótipo demonstrou estar adequado para o problema em questão, contribuindo com uma nova tecnologia assistiva voltada aos deficientes auditivos.<br> / Abstract : Hearing deficiency affects millions of people in Brazil. Deaf people adopt the Brazilian Sign Language as their language of communication. However, most of the population is unaware of the Brazilian Sign Language, making it difficult to communicate between the hearing deficiency and the population. Given the problem in question and after the discussion with interpreters of the Brazilian Language of Signals, the present work constructed a model and a prototype of application of conversion of voice into text and text in voice to aid the communication of bilingual deaf people with the unknown people of Sign Language. To help overcome the limitations of any disability, the area of assistive technology contributes by developing technologies that improve the lives of people with disabilities. The prototype was developed for the Android platform, using the concept of hybrid application, speech recognition and reading and text reproduction. The prototype was then released via social networks throughout Brazil. Later, feedback was collected from the users regarding their operation and suggestions for improvements. The comments showed that the prototype assists in the communication of hearing and hearing impaired people, increasing the accessibility of people with this deficiency, but requiring online speech recognition and design enhancements. Based on the data analysis and the positive feedback from the users, it is understood that the prototype proved to be adequate for the problem in question, contributing with a new assistive technology aimed at the hearing deficiency. Perda auditiva Acessibilidade Equipamentos de Autoajuda Reconhecimento automatico da voz
13	A utilização do Microsoft Speech SDK para o reconhecimento de voz Bernardi, Yuri Ademir January 2003 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnologico. Programa de Pós-Graduação em Engenharia de Produção / Made available in DSpace on 2012-10-20T11:20:04Z (GMT). No. of bitstreams: 1 227346.pdf: 1266542 bytes, checksum: 024bef5b204e7abba3e5328642db3926 (MD5) / A necessidade do ser humano por novos meios de comunicação, tanto entre seus semelhantes, quanto na relação do homem com a máquina, nos traz novos desafios. Este trabalho avalia o "kit" da Microsoft de reconhecimento de fala. Esta ferramenta propõe facilidades para projetos que necessitam utilizar o reconhecimento de voz. Neste estudo são abordados vários conceitos, podendo assim o leitor ter uma boa conceituação sobre os tópicos descritos. Os principais assuntos relacionados na revisão bibliográfica são o reconhecimento de padrões, inteligência artificial e a voz. Finalmente apresenta-se o Microsoft Speech SDK e suas características. Após são apresentadas as avaliações e conclusões obtidas sobre o uso da ferramenta utilizada. The human being need for new communication means so much among its fellow creatures as in the relationship man machine this brings us new challenges. This work evaluates the kit of Microsoft of speech recognition. This tool proposes means for projects that need to use the voice recognition. In this study several concepts are approached, being able to not like this the reader to have a good concept on the described topics. The main subjects related in the bibliographical revision are the recognition of patterns, artificial intelligence and the voice. Finally it introduces it Microsoft Speech SDK and its characteristics. After healthy presented the evaluations and conclusions obtained on the use of the used tool. Engenharia de produção Voz Reconhecimento automatico da voz Inteligencia artificial Reconhecimento de padrOes Redes neurais (Computação)
14	Técnicas de processamento de sinais para alteração de parâmetros prosódicos aplicadas a um sistema de conversão texto-fala para a lingua portuguesa falada no Brasil Pacheco, Fernando Santana January 2001 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica. / Made available in DSpace on 2012-10-18T14:32:01Z (GMT). No. of bitstreams: 0 / Sistemas de conversão texto-fala têm como objetivo a transformação de um texto com vocabulário irrestrito em uma mensagem falada. Esse processo consiste de duas etapas básicas. Na primeira, técnicas de processamento lingüístico realizam a extração de uma representação simbólica dos parâmetros acústicos a partir do texto de entrada. A representação simbólica é transformada em sinal de fala através de técnicas de processamento de sinais. Um dos métodos de síntese de fala é o de concatenação de segmentos de fala previamente gravados. No entanto, para conferir maior naturalidade à fala sintetizada, faz-se necessário alterar de forma dinâmica os parâmetros prosódicos (pitch, duração e energia) dos segmentos durante a operação de síntese. O presente trabalho apresenta o desenvolvimento de uma técnica baseada em análise/ressíntese LPC com excitação residual para alteração de parâmetros prosódicos. O objetivo é aplicá-la a um sistema de conversão texto-fala baseado em síntese concatenativa para a língua portuguesa falada no Brasil. Nesta técnica, simples operações de cópia e corte são realizadas no sinal de resíduo, permitindo a alteração do pitch. A alteração da duração é efetuada eliminando ou copiando quadros inteiros de análise. Essa técnica apresenta uma carga computacional reduzida, possibilitando a implementação em tempo real. Análises objetivas e testes perceptuais preliminares mostraram um bom desempenho da técnica. Engenharia eletrica Processamento de sinais Reconhecimento automatico da voz Reconhecimento de padrOes Fala - Inteligibilidade Sistemas de processamento da fala Sintese da voz
15	Extensão artificial de largura de banda para sinais de fala em telefonia usando classificação fonética Silva, Ênio dos Santos January 2016 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2016. / Made available in DSpace on 2016-09-20T04:11:19Z (GMT). No. of bitstreams: 1 340510.pdf: 2334420 bytes, checksum: 667c596d97abea07fd998f77f31b8441 (MD5) Previous issue date: 2016 / Este trabalho de pesquisa apresenta uma nova estratégia para implementar sistemas de extensão artificial de largura de banda (artificial bandwidth extension- ABWE) para sinais de fala aplicados à rede pública (convencional) de telefonia (public switched telephone network - PSTN). Especificamente, aqui é proposta uma estratégia baseada em classificação fonética visando representar satisfatoriamente segmentos de fala com energia concentrada em altas frequências, superando outros resultados apresentados na literatura. Para tal,técnicas de seleção de atributos aplicadas a sinais de fala de banda limitada são investigadas, aprimorando a classificação em grupos fonéticos abrangentes (broad group phonetic - BGP) com ênfase na discriminação de fonemas pertencentes ao grupo fonético fricativo. Adicionalmente, neste trabalho é discutida a integração do sistema de ABWE proposto em sistemas de reconhecimento automático de fala (automatic speech recognition - ASR) para o português brasileiro aplicados à PSTN. Particularmente, visando o aprimoramento de ASR em PSTN, as etapas de extração de atributos do sinal da fala e a etapa de construção do modelo acústico são desenvolvidas baseadas em sinais sintéticos de banda larga (wideband - WB) estimados a partir do realce de sinais de banda estreita (narrowband - NB) usando ABWE. Os resultados obtidos apresentam realce na qualidade subjetiva dos sinais de fala reconstruídos e ganho no desempenho do ASR, confirmando a eficácia das estratégias propostas neste trabalho de pesquisa.<br> / Abstract: This research work presents a new strategy for implementing artificial bandwidth extension (ABWE) systems for speech signals applied to the public switched telephone network (PSTN). Specifically, a strategy based on phonetic classification is proposed here aiming to represent speech segments with concentrated energy at high frequencies, out performing other approaches from the open literature. In this context, feature selection techniques applied to limited band width speech signals are investigated, improving thebroad group phonetic (BGP) classification with an emphasis on discriminationof phonemes belonging to the fricative phonetic group. In addition, the integration of the proposed ABWE approach in automatic speech recognition(ASR) systems for Brazilian Portuguese applied to the PSTN is also discussed. Particularly, in order to improve PSTN ASR systems, synthetically estimated wide band (WB) signals, from the narrow band (NB) enhancement by ABWE, are used to obtain more discriminating attributes of speech signals as well as for achieving better performance of acoustic models (AM). Theobtained results show an enhancement in the quality of reconstructed speech signals with very good performance in ASR systems, confirming the effectivenessof the proposed strategies in this research work. Engenharia elétrica Fonética Classificação Fala Codificação Mineração de dados (Computação) Reconhecimento automatico da voz

Page generated in 0.0991 seconds