Spelling suggestions: "subject:"processamento dde sala"" "subject:"processamento dde fala""
1 |
Inteligibilidade acustica de salas avaliada por um indice simplificado de transmissão de falaViveiros, Elvira Barros January 1990 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnologico / Made available in DSpace on 2016-01-08T16:19:38Z (GMT). No. of bitstreams: 1
81186.pdf: 2586918 bytes, checksum: 52a1f83726cd19a2053fd8d78b31b95e (MD5)
Previous issue date: 1990 / O objetivo deste estudo é apresentar a implantação de uma metodologia de avaliação de inteligibilidade acústica de salas, através do processamento digital de sinais, incluindo indiretamente os parâmetros subjetivos que influenciam a qualificação de um ambiente. A técnica adotada baseia-se no índice de Transmissão de Fala, derivação de um conceito ótico: a Função Transferência de Modulação. A composição do sinal de excitação que simula a fala humana e à análise do sinal de resposta do ambiente são apresentados. Entre outros aspectos, verificam-se os resultados experimentais comparativamente ao modelo teórico e a outra técnica clássica de avaliação de inteligibilidade, bem como as limitações do método.
|
2 |
Sistema de conversão texto-fala para a lingua portuguesa utilizando a abordagem de sintese por regrasGomes, Leandro de Campos Teixeira 15 July 1998 (has links)
Orientador: Jose Geraldo Chiquito / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-23T20:16:10Z (GMT). No. of bitstreams: 1
Gomes_LeandrodeCamposTeixeira_M.pdf: 7657405 bytes, checksum: e4cae4f7fef2aeaa666c6f598c0c24bb (MD5)
Previous issue date: 1998 / Resumo: Neste trabalho encontra-se descrito o sistema de conversão texto-fala para o português do Brasil desenvolvido no Laboratório de Processamento de Sinais da Faculdade de Engenharia Elétrica e de Computação da Unicamp. O sistema recebe como entrada um texto genérico em português e produz em sua saída o sinal de fala correspondente. O processo de conversão texto-fala divide-se em três etapas básicas, cada uma englobando vários módulos: Processamento de texto: pré-processamento, classificação gramatical, divisão silábica e transcrição ortográfico-fonética. Processamento prosódico: determinação de fronteiras prosódicas, geração de contornos de entonação e geração de durações de segmentos. Processamento de sinal: síntese do sinal de fala utilizando o sintetizador de formantes de Klatt. Os módulos de processamento prosódico empregam dados de duração e entonação extraídos de elocuções naturais, ajustando-os às particularidades do texto de entrada com base em informações provenientes do classificador gramatical. A abordagem de síntese por regras é utilizada para a geração dos parâmetros de controle do sintetizador. Uma linguagem e um compilador específicos foram criados para a descrição das regras de síntese. Embora não tenham sido realizadas avaliações formais da qualidade do sistema, testes informais indicaram um bom desempenho geral em termos de inteligibilidade e naturalidade / Abstract: This work contains a description of the text-to-speech conversion system for the Portuguese of Brazil developed at the Signal Processing Laboratory of the Electrical and Computer Engineering School of Unicamp. The system receives as input a generic text in Portuguese and produces as output the corresponding speech signal. The text-to-speech conversion process is divided into three basic steps, each one including several modules: Text processing: preprocessing, grammatical classification, syllabic division and orthographic-phonetic transcription. Prosodic processing: determination of prosodic boundaries, generation of intonation patterns and generation of segmental durations. Signal processing: synthesis of the speech signal using the Klatt formant synthesizer. The prosodic processing modules use duration and intonation data extracted from natural utterances, adjusting them to the particularities of the input text on the basis of information provided by the grammatical classifier. The synthesis-by-rule approach is used for generating the synthesizer control parameters. A specific language and a compiler have been created for the description of the synthesis rules. A1thoughformal evaluations of the system quality have not been made, informal tests have indicated a good general performance in terms of intelligibility and naturalness / Mestrado / Mestre em Engenharia Elétrica
|
3 |
Transformada Wavelet na detecção de patologias da laringe / Wavelet Transform in the detection of pathologies of the larynxCarvalho, Raphael Torres Santos 03 1900 (has links)
CARVALHO, R. T. S. Transformada Wavelet na detecção de patologias da laringe. 2012. 63 f. Dissertação (Mestrado em Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2012. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2013-01-18T12:18:52Z
No. of bitstreams: 1
2012_dis_rtscarvalho.pdf: 1627176 bytes, checksum: e767247f38c5b5bf6ff8e72debd59101 (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2013-02-08T18:03:25Z (GMT) No. of bitstreams: 1
2012_dis_rtscarvalho.pdf: 1627176 bytes, checksum: e767247f38c5b5bf6ff8e72debd59101 (MD5) / Made available in DSpace on 2013-02-08T18:03:25Z (GMT). No. of bitstreams: 1
2012_dis_rtscarvalho.pdf: 1627176 bytes, checksum: e767247f38c5b5bf6ff8e72debd59101 (MD5)
Previous issue date: 2012-03 / The amount of non-invasive methods of diagnosis has increased due to the need for simple, quick and painless tests. Due to the growth of technology that provides the means for extraction and signal processing, new analytical methods have been developed to help the understanding of analysis of the complexity of the voice signals. This dissertation presents a new idea to characterize signals of healthy and pathological voice based on one mathematical tools widely known in the literature, Wavelet Transform (WT). The speech data were used in this work consists of 60 voice samples divided into four classes of samples: one from healthy individuals and three from people with vocal fold nodules, Reinke’s edema and neurological dysphonia. All the samples were recorded using the vowel /a/ in Brazilian Portuguese. The obtained results by all the pattern classifiers studied indicate that the proposed approach using WT is a suitable technique to discriminate between healthy and pathological voices, since they perform similarly to or even better than classical technique, concerning recognition rates. / A quantidade de métodos não invasivos de diagnóstico tem aumentado devido à necessidade de exames simples, rápidos e indolores. Por conta do crescimento da tecnologia que fornece os meios necessários para a extração e processamento de sinais, novos métodos de análise têm sido desenvolvidos para compreender a complexidade dos sinais de voz. Este trabalho de dissertação apresenta uma nova ideia para caracterizar os sinais de voz saudável e patológicos baseado em uma ferramenta matemática amplamente conhecida na literatura, a Transformada Wavelet (WT). O conjunto de dados utilizado neste trabalho consiste de 60 amostras de vozes divididas em quatro classes de amostras, uma de indivíduos saudáveis e as outras três de pessoas com nódulo vocal, edema de Reinke e disfonia neurológica. Todas as amostras foram gravadas usando a vogal sustentada /a/ do Português Brasileiro. Os resultados obtidos por todos os classificadores de padrões estudados mostram que a abordagem proposta usando WT é uma técnica adequada para discriminação entre vozes saudável e patológica, e apresentaram resultados similares ou superiores a da técnica clássica quanto à taxa de reconhecimento.
|
4 |
Síntese de fala em português brasileiro baseada em modelos ocultos de MarkovFrancisco Soares de Souza, Carlos 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:55:58Z (GMT). No. of bitstreams: 2
arquivo2336_1.pdf: 1261229 bytes, checksum: 95035af35c94363c8e59a5bd6cf8bc31 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / O avanço da tecnologia nos conduz a uma relação cada vez mais próxima a computadores
e outros dispositivos eletrônicos. Juntos a este avanço dos equipamentos está a evolução
das interfaces humano-maquina que auxiliam nesta relação nem sempre agradável. Assim
sendo, o desenvolvimento de sistemas que têm como objetivo tornar esta comunicação
mais natural e agradável tem estado em foco, e dentre estes, os sistemas de processamento
de fala são excelentes opções, pois permitem esta interação com equipamentos através da
fala, como na comunicação humana tradicional. Atualmente, tanto o reconhecimento de
fala quanto a síntese já se fazem presentes no dia-a-dia, como reconhecedores de palavras
no pré-atendimento de call centers de empresas, ou fala sintética para se comunicar com
o usuário em equipamentos de navegação GPS, leitores de mensagens de celular e e-mail,
dentre outros. O uso de modelos ocultos de Markov em processamento de fala tem
alcançado excelentes resultados, primeiramente em reconhecimento, onde foram suas
primeiras aplicações e as que obtiveram maior destaque, e atualmente também em síntese,
superando inclusive aspectos negativos de outras abordagens, como a necessidade de uma
extensa base de dados de unidades fonéticas para obter bons resultados. Esta dissertação
apresenta o desenvolvimento de um sintetizador de fala para o idioma português falado
no Brasil, baseado em modelos ocultos de Markov. Este trabalho aborda a construção de
um algoritmo de determinação da sílaba tônica de palavras, um algoritmo de conversão
de grafemas em fonemas, e um algoritmo de separação silábica de palavras transcritas
foneticamente. Por conseguinte, apresenta a técnica e suas características aplicadas à
síntese de fala
|
5 |
Algoritmos de busca em codificadores ACELPBarbosa, Lucas de Melo Jorge 02 August 2018 (has links)
Orientador : Luis Geraldo Pedroso Meloni / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-02T20:28:03Z (GMT). No. of bitstreams: 1
Barbosa_LucasdeMeloJorge_M.pdf: 8368296 bytes, checksum: 0c54599ec087e39cfac51d1bf88b6374 (MD5)
Previous issue date: 2002 / Resumo: Esse trabalho apresenta uma revisão do processo de codificação de voz baseado em predição linear com excitação por códigos (CELP), assim como um estudo sistemático e aprofundado dos algo ritmos de busca utilizados em dicionários de multi-pulsos algébricos, que caracterizam os codificadores ACELP. Além do estudo de diversos tipos de algoritmos de busca existentes, propõe-se aqui um novo método, denominado de busca seqüencial de posições. Os algoritmos de busca são descritos com uma notação homogênea e representados através de pseudo-códigos. Além disso, são feitas análises dos algoritmos no que diz respeito à complexidade e à qualidade de voz através da inserção dos mesmos nos codificadores G.729 e GSM-AMR, que pertencem respectivamente aos organismos de padronização ITU-T e ETSI. As medidas levantadas mostram que, quando comparado com os algoritmos de busca adotados pelas padronizações atuais de codificação de voz, a busca seqüencial de posições requer um esforço computacional consideravelmente menor, ao custo apenas de uma pequena degradação na qualidade perceptual da voz codificada. Ainda no âmbito da redução do tempo gasto no processo de busca nos dicionários algébricos, este trabalho também apresenta uma análise do impacto da implementação otimizada dos algoritmos de busca no desempenho do codificador como um todo, questão que surge com a utilização de processadores digitais de sinais modernos com alto nível de paralelismo / Abstract: This work presents a review of the code-excited linear predictive (CELP) voice coding scheme, and a detailed and structured study of the search algorithms for algebraic multipulse codebooks (ACELP). In addition to the study of the current algorithms, this work also proposes a new search method, named as position-sequential search. Throughout this work the search algorithms are described using a common notation and represented by pseudo-codes. The computational complexity and perceptual quality of the search algorithms have been measured by the use of the ITU-T G.729 and the ETSI GSM-AMR speech coding standards. The implementations showed that in comparison to standard search procedures the position-sequential search causes only a slight degradation in voice quality, whereas providing a significant reduction in computational complexity. In the sense of reducing the time spent in the search process, this work also analyzes the impact of the optimized implementation of search algorithms on the global performance of the coding process. This question arises in algorithm implementations in modern digital signal processors with a high level of parallelism / Mestrado / Mestre em Engenharia Elétrica
|
6 |
Codec ADPCM a 16 Kbit/s com quantização de arvoreFerreira, Flavia Martinho 13 July 2018 (has links)
Orientador: Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-13T23:28:32Z (GMT). No. of bitstreams: 1
Ferreira_FlaviaMartinho_M.pdf: 5997236 bytes, checksum: 8cfcb96e40a496ced77278a1546b6b84 (MD5)
Previous issue date: 1990 / Resumo: Neste trabalho é descrito um codec ADPCM à taxa de 16 kbit/s que emprega codificação/quantização de árvore e técnicas que permitem a redução da perceptibilidade do ruído de reconstrução, especificamente pós-filtragem e filtragem de ponderação de ruído. A motivação do trabalho reside na obtenção de um codec a 16 kbit/s com atraso e qualidade subjetiva compatíveis para aplicação telefônica, mediante a utilização da estrutura do codec ADPCM a 32 kbit/s padronizado pelo CCITT (Recomendação G.721). O bom desempenho subjetivo obtido para tal codec conduziu à redução da taxa de bits de 16 para 9.6 kbit/s. O atraso do algoritmo é 2 ms / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
7 |
Aplicação do processamento homomorfico na codificação de voz e baixas taxasOliveira, Paulo Cesar Dantas 27 March 1992 (has links)
Orientadores: Amauri Lopes, Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-14T04:23:33Z (GMT). No. of bitstreams: 1
Oliveira_PauloCesarDantas_M.pdf: 4479793 bytes, checksum: dc1dfe285816cd128cb02d73963a555f (MD5)
Previous issue date: 1992 / Resumo: Este trabalho traz uma análise da aplicação da técnica da Deconvolução Homom6rfica na Codificação de Voz a Baixas Taxas. A partir desta técnica é possível obter o cepstrum complexo da resposta impulsiva do filtro digital representativo dos efeitos combinados do Pulso Glótico, do Trato Vocal e da Impedância de Irradiação, segundo o modelo tradicional de produção de sinais de voz. A transmissão de algumas amostras do cepstrum complexo permite a realização de uma estimativa da resposta impulsiva do filtro, a qual, ao ser convoluída com um sinal de excitação adequado, permite reconstruir o sinal de voz no receptor. Com base na análise anterior, são realizadas simulações de Sistemas Homom6rficos de Codificação de Voz, operando a taxas em torno de 4,8 e 9.0 kbits/s. O desempenho destes sistemas é avaliado através de testes subjetivos e comparado ao desempenho de um Sistema de Codificação de Voz baseado na Análise LPC convencional. Este trabalho traz também um estudo sobre a técnica da Predição Homomórfica que combina a Deconvolução Homom6rfica com a Análise Preditiva Linear. Esta técnica possibilita a redução da taxa de transmissão em Sistemas Homom6rficos de Fase Mista, além da oportunidade de avaliação dos efeitos da Análise LPC quando aplicada diretamente sobre a resposta impulsiva do Trato Vocal / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
8 |
Codificadores parametricos de sinais de voz com excitação multi-pulsoCustodio, Ricardo Felipe January 1990 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina. Centro Tecnologico / Made available in DSpace on 2012-10-16T03:01:58Z (GMT). No. of bitstreams: 0Bitstream added on 2016-01-08T16:40:42Z : No. of bitstreams: 1
80717.pdf: 1984200 bytes, checksum: 5b3f369129e63bd74414b9f5ad68edd6 (MD5) / Neste trabalho é apresentado um estudo e algumas considerações a respeito da implementação de codificadores de sinais de voz com predição linear e excitação multi-pulso (MPELPC). Para o projeto do preditor é proposta a utilização "melhor" filtro preditor para a excitação multi-pulso, ao invés da utilização do clássico filtro só pólos. É mostrado, através de tabelas contendo resultados de diversas simulações que a utilização do "melhor" filtro preditor melhora a relação sinal-ruído da voz gerada. Para a determinação da excitação e proposta uma nova técnica com menor complexidade computacional do que a proposta por Singhal & Atal. São mostrados os resultados obtidos nas diversas simulações comparando os dois métodos.
|
9 |
Detecção e tratamento de cliques naturais em bancos de fala visando síntese concatenativa de alta qualidadeNicodem, Monique Vitório January 2006 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica. / Made available in DSpace on 2012-10-22T18:54:17Z (GMT). No. of bitstreams: 1
223937.pdf: 2922286 bytes, checksum: 0cb58a7fc98709ea8f7148c1ca88f811 (MD5)
|
10 |
Implementação em tempo real de um sistema de reconhecimento de digitos conectadosAndreão, Rodrigo Varejão 27 July 2018 (has links)
Orientador: Luis Geraldo Pedroso Meloni / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-27T10:50:47Z (GMT). No. of bitstreams: 1
Andreao_RodrigoVarejao_M.pdf: 575648 bytes, checksum: c5a9a006fcd82bdc9f8503d29e5146e8 (MD5)
Previous issue date: 2001 / Mestrado
|
Page generated in 0.1203 seconds