• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 10
  • 1
  • Tagged with
  • 12
  • 12
  • 9
  • 8
  • 4
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

EXTRAÇÃO DE SINAIS DE VOZ EM AMBIENTES RUIDOSOS POR DECOMPOSIÇÃO EM FUNÇÕES BASES ESTATISTICAMENTE INDEPENDENTES / EXTRATION OF VOICE SIGNALS IN NOISY ENVIRONMENTS FOR DECOMPOSITION IN FUNCTIONS STATISTICAL INDEPENDENT BASES

Abreu, Natália Costa Leite 11 December 2003 (has links)
Made available in DSpace on 2016-08-17T14:52:55Z (GMT). No. of bitstreams: 1 Natalia Costa Leite Abreu.pdf: 841490 bytes, checksum: 00ff55b62f0819b502a66a2304564bf4 (MD5) Previous issue date: 2003-12-11 / The constant search for the improvement and strengthening of the relationship between humans and machines turning it more natural is common place. Consequently, the recognition of speech will turn, easier and practical the handling of equipments supplied with the capacity to understand the human speech. In this sense and with the use of the available knowledge information in the literature as how the human brain processes informations, some suggested methods try to simulate this ability in the computer, especially devoted to the extraction of a speech signal of mixed sounds, attempting, for example to increase the recognition and comprehension rate. The extraction of speech can be obtained by measures of a single-channel or multiple the channels. In order to extract the speech in a single channel, it is proposed here to use the speech characteristics introducing the concept of efficient codification, that tries to imitate the way the auditory cortex gets information using the method of Independent Component Analysis (ICA), getting the basis functions of the input signals and retrieving the estimated signal even when we add interferences to it. Our simulations also prove the efficiency of our method against reverberation effects and the recovery of speech signal by the handling of basis function of other speech signals. This technique can be used efficiently both to extract a single speech, as well as highlighting new ways of approaching the speech/speaker recognition problem. / A constante busca para aperfeiçoar e estreitar o relacionamento entre homens e máquinas, tornando-o mais natural, não é nenhuma novidade. Conseqüentemente, o reconhecimento da voz possibilitará uma manipulação mais fácil e prática de equipamentos dotados com a capacidade de compreender a fala humana. Neste sentido e utilizando-se dos conhecimentos disponíveis na literatura de como o cérebro humano processa informações, alguns métodos propostos procuram simular computacionalmente essa habilidade, voltados principalmente à extração de um sinal de voz de uma mistura de sons, na tentativa de, por exemplo, aumentar a taxa de reconhecimento e inteligibilidade. A extração da voz pode ser obtida usando medidas de um único ou múltiplos canais. Para extrair uma voz em um único canal, propomos usar as características da voz pelo conceito de codificação eficiente, que procura imitar o modo como o córtex auditivo trata as informações, utilizando-se da técnica de Análise de Componentes Independentes (ICA), obtendo as funções bases dos sinais de entrada e recuperando o sinal estimado, mesmo quando são adicionadas interferências. Através de simulações comprovamos também a eficiência da técnica usada, primeiro, na recuperação de um sinal de voz com a utilização das funções bases de outro sinal e, segundo, frente a efeitos de reverberação. Esta técnica pode ser usada para extrair uma única fala eficazmente, como também prenuncia um modo novo de chegar ao problema de reconhecimento da fala/orador.
12

Reconhecimento de fala contínua para o Português Brasileiro em sistemas embarcados. / Continuous speech recognition for Brazilian Portuguese in embedded systems.

SILVA, Daniella Dias Cavalcante da. 30 July 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-07-30T21:22:20Z No. of bitstreams: 1 DANIELLA DIAS CAVALCANTE DA SILVA - TESE PPGEE 2011..pdf: 21267862 bytes, checksum: 34609e6f0c5b3d3d5dbe954562ec3132 (MD5) / Made available in DSpace on 2018-07-30T21:22:20Z (GMT). No. of bitstreams: 1 DANIELLA DIAS CAVALCANTE DA SILVA - TESE PPGEE 2011..pdf: 21267862 bytes, checksum: 34609e6f0c5b3d3d5dbe954562ec3132 (MD5) Previous issue date: 2011-12 / Com o advento da tecnologia, as máquinas predominam em quase todos os cenários do cotidiano das pessoas, sejam essas máquinas computadores, eletrodomésticos, dispositivos portáteis, etc. Com isso, nada melhor do que dotá-las com a capacidade de percepção e compreensão da voz humana, que é a forma mais simples, natural e eficaz do ser humano expressar seus pensamentos. Apesar de muitas pesquisas na área de Processamento Digital de Sinais de Voz (PDSV) terem permitido o desenvolvimento de sistemas de Reconhecimento de Faia bastante eficientes, requisitos de processamento ainda dificultam a implementação desses sistemas em dispositivos com pequeno poder computacional, como celulares, palmtops e eíetrodomésticos. Para permitir a implementação de sistemas de Reconhecimento de Faia nesse contexto, alguns trabalhos sacrificam a eficiência no processo de reconhecimento em nome da redução do tamanho físico e de exigências computacionais. Assim, a busca por modelagens acústicas e linguísticas othnizadas, associadas ao uso de bases de dados representativas, pode levar a ura compromisso entre desempenho do sistema em termos de taxas de reconhecimento e exigências computacionais impostas por sistemas embarcados. O objetivo principal deste trabalho consiste na modelagem da arquitetura de um sistema de reconhecimento de fala contínua para o português brasileiro, utilizando Modelos Ocultos de Markov, de forma a possibilitar sua implementação em um sistema embarcado com recursos computacionais limitados. A fim de selecionar a configuração que melhor atenda esse objetivo, foram realizados experimentos e análises, de modo a identificar possíveis adaptações, a partir de simplificações matemáticas e redução de parâmetros nas etapas do processo de reconhecimento. Em todo lho, foi considerada a relação entre a taxa de reconhecimento e o custo computacional. A arquitetura do sistema embarcado desenvolvida e o seu processo de modelagem, incluindo os experimentos, as análises e os seus respectivos resultados, serão apresentados e discutidos no decorrer deste documento. / WIth the advent of technology, machines predominate in aímost ali seenarios of everyday life. The possibiiity of performing human-maehine comniunication through speech makes this interact.ion easier and more productive. However, processing requirements still difficult tlíe implementation oF systems for automatic continuous speech recognition on devices with low computational power sucJi as mobile phones, palmtops and appliances. To allow the implementation of speech recognition systems in this context. some works sacrifice efficiency in the recognition process for redueing the chip area and computational requirements. For this purpose, it becomes necessary to research for optimized acoustic and language modeling, associated with use of representative databases, looking for a good compromise between recognitioa vaies and compuiational demands imposed by embedded systems. The main goai of this work is to model the architecture of a system for continuous speech recognition Brazilian Portuguese, in order to enable its implementation in an embedded system with limited computtng resources. In order to select the setting that best nieets this goal, experiments and analysis were performed. The purpose of these was to identify possible adaptations, from mathematical simpiifícations and reduction of parameters in the steps of the recognition process. During the deveiopinent of this work, the relationship between recognition rate and computational cost was considered. The embedded system architecture developed and its modeling process, including experiments. analysis and their results will be presented and díscussed thxoughout this document.

Page generated in 0.1253 seconds