Spelling suggestions: "subject:"modificador dde voz"" "subject:"modificador dee voz""
1 |
Implementação de um codificador de voz padronizado em DSPSeara Júnior, Rui January 2000 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. / Made available in DSpace on 2012-10-17T19:53:09Z (GMT). No. of bitstreams: 0Bitstream added on 2014-09-25T18:14:38Z : No. of bitstreams: 1
172438.pdf: 2165929 bytes, checksum: d3c2732960f82340496089f55d6cb1bc (MD5) / Neste trabalho, é proposta uma implementação de um codificador de voz padronizado em DSP. Foi escolhido como padrão de codificação o da recomendação G.723.1 do ITU-T. Esse padrão opera com duas taxa de compressão (5.3 e 6.3 kbits/s) e foi desenvolvido para utilização principalmente em aplicações para Internet. A família de DSPs adotada foi a ADSP-21XX da Analog Devices, que tem como principal característica operação em ponto fixo com precisão de 16 bits e baixo custo. Dentre as principais características da implementação proposta, pode-se destacar a flexibilidade, robustez, eficiência, baixo custo e capacidade de instanciação. Esta solução possui um alto grau de competitividade com outras soluções semelhantes disponíveis no mercado.
|
2 |
Técnicas eficientes de identificação automática de locutores / Efficient automatic speaker identification techniquesD’Almeida, Frederico Quadros January 2009 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2009. / Submitted by Allan Wanick Motta (allan_wanick@hotmail.com) on 2010-04-01T14:43:12Z
No. of bitstreams: 1
2009_FredericoQuadrosDAlmeida.pdf: 1732276 bytes, checksum: e57b64ff73a3bbefb4a4673bcc025322 (MD5) / Approved for entry into archive by Lucila Saraiva(lucilasaraiva1@gmail.com) on 2010-04-02T00:36:42Z (GMT) No. of bitstreams: 1
2009_FredericoQuadrosDAlmeida.pdf: 1732276 bytes, checksum: e57b64ff73a3bbefb4a4673bcc025322 (MD5) / Made available in DSpace on 2010-04-02T00:36:42Z (GMT). No. of bitstreams: 1
2009_FredericoQuadrosDAlmeida.pdf: 1732276 bytes, checksum: e57b64ff73a3bbefb4a4673bcc025322 (MD5)
Previous issue date: 2009 / Os sistemas de identificação automática de locutor têm despertado crescente interesse científico atualmente. A aplicação de novas formas de modelagem da voz dos locutores tem melhorado de modo significativo a robustez desses sistemas a ruído, tornando sua aplicação prática viável em situações reais nas quais não se dispõe de áudio de boa qualidade. Contudo, essa crescente qualidade na modelagem e a consequente melhora no desempenho dos sistemas de identificação têm promovido, como efeito colateral, o aumento no custo computacional das tarefas de identificação. Em muitas situações, seja pelo grande número de locutores a serem testados, seja pela necessidade de uma resposta rápida do sistema, esse custo elevado torna proibitiva a aplicação efetiva das ferramentas de identificação automática de locutor. Neste trabalho são propostas, implementadas, avaliadas e validadas novas técnicas que buscam reduzir significativamente o custo computacional associado a tarefas de identificação automática de locutores sem, contudo, afetar o desempenho do sistema no que concerne às taxas de identificações corretas. Os métodos apresentados exploram características próprias dos modelos multicondicionais de mistura de gaussianas (GMM Gaussian Mixture Models), modelagem comumente aplicada nos sistemas de identificação de locutores robustos a variações na qualidade do áudio questionado. O foco principal das novas técnicas apresentadas é reduzir o número de componentes gaussianas a serem calculadas no processo de identificação, o que possibilita a consequente redução do custo computacional. Os resultados obtidos com as técnicas introduzidas neste trabalho demonstram que é possível obter reduções superiores a 90% no custo computacional das tarefas de identificação de locutores sem afetar o desempenho do sistema.
__________________________________________________________________________________ ABSTRACT / Automatic speaker identification systems are a very attractive research field currently. The application of new voice modeling techniques have significantly increased the noise robustness of the systems, making it possible to develop practical applications suited to real audio conditions, where one cannot guarantee high audio quality. However, these advances in voice modeling and the consequent improvement on the identification have caused, as a side effect, a relevant increas on the computational cost of the task. In many situations, the large number of speakers in the database or the need for a fast identification makes it prohibitive to accept this much elevated cost of the new modeling schemes. On this work, new techniques to reduce significantly the computational effort associated with automatic speaker identification tasks without affecting the system identification performance are presented, implemented, evaluated and validated. The presented methods explore some characteristics typical of the multiconditional Gaussian Mixture Models (GMM), a very commonly used modeling technique on noise robust speaker identification systems. The main goal of the new presented techniques is to reduce the number of gaussian components to be calculated during the speaker identification process, so that its computational cost is minimized. Results show that, by using a combination of the novel techniques, it is possible to surpass a 90% reduction on the effort of a speaker identification task without affecting the system performance.
|
3 |
Avaliação objetiva de qualidade de sinais de audio e vozBarbedo, Jayme Garcia Arnal 03 August 2018 (has links)
Orientador : Amauri Lopes / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-03T22:16:31Z (GMT). No. of bitstreams: 1
Barbedo_JaymeGarciaArnal_D.pdf: 1813668 bytes, checksum: b972408599d5379c21b8538d5886086c (MD5)
Previous issue date: 2004 / Doutorado
|
4 |
Algoritmos para redução da taxa de bits em codificadores CELPYamamoto, Jose Sindi 26 November 1993 (has links)
Orientador : Fabio Violaro / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-18T21:21:19Z (GMT). No. of bitstreams: 1
Yamamoto_JoseSindi_D.pdf: 6170550 bytes, checksum: 2f8b718e4f35404a1a7a8aeda634f580 (MD5)
Previous issue date: 1993 / Resumo: Neste trabalho, novos algoritmos de quantização vetorial dos coeficientes LPC e do sinal de excitação, aplicáveis à codificadores de voz do tipo CELP, foram desenvolvidos e avaliados através de testes subjetivos formais. Uma combinação destes algoritmos quando incorporada em um codificador CELP convencional, melhora significativamente a qualidade do sinal de voz sintetizado, obtendo-se uma boa qualidade mesmo a uma taxa tão baixa quanto 3,55 kbit/s. Adicionalmente, alguns dos algoritmos tem-se mostrado vantajosos na implementação de codificadores de voz de baixo atraso. Assim, codificadores de voz CELP à taxa de 6,8 kbit/s e atraso de 5 ms foram também implementados e avaliados formalmente em termos de qualidade subjetiva / Abstract: Not informed. / Doutorado / Eletrônica, Microeletrônica e Optoeletrônica / Doutor em Engenharia Elétrica
|
5 |
Avaliação objetiva de qualidade de codecs de voz na faixa de telefoniaBarbedo, Jayme Garcia Arnal 28 July 2018 (has links)
Orientador : Amauri Lopes / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-28T10:51:12Z (GMT). No. of bitstreams: 1
Barbedo_JaymeGarciaArnal_M.pdf: 2313757 bytes, checksum: 43753b13181790455554b3eae99b08de (MD5)
Previous issue date: 2001 / Mestrado
|
6 |
Algoritmos de busca em codificadores ACELPBarbosa, Lucas de Melo Jorge 02 August 2018 (has links)
Orientador : Luis Geraldo Pedroso Meloni / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-02T20:28:03Z (GMT). No. of bitstreams: 1
Barbosa_LucasdeMeloJorge_M.pdf: 8368296 bytes, checksum: 0c54599ec087e39cfac51d1bf88b6374 (MD5)
Previous issue date: 2002 / Resumo: Esse trabalho apresenta uma revisão do processo de codificação de voz baseado em predição linear com excitação por códigos (CELP), assim como um estudo sistemático e aprofundado dos algo ritmos de busca utilizados em dicionários de multi-pulsos algébricos, que caracterizam os codificadores ACELP. Além do estudo de diversos tipos de algoritmos de busca existentes, propõe-se aqui um novo método, denominado de busca seqüencial de posições. Os algoritmos de busca são descritos com uma notação homogênea e representados através de pseudo-códigos. Além disso, são feitas análises dos algoritmos no que diz respeito à complexidade e à qualidade de voz através da inserção dos mesmos nos codificadores G.729 e GSM-AMR, que pertencem respectivamente aos organismos de padronização ITU-T e ETSI. As medidas levantadas mostram que, quando comparado com os algoritmos de busca adotados pelas padronizações atuais de codificação de voz, a busca seqüencial de posições requer um esforço computacional consideravelmente menor, ao custo apenas de uma pequena degradação na qualidade perceptual da voz codificada. Ainda no âmbito da redução do tempo gasto no processo de busca nos dicionários algébricos, este trabalho também apresenta uma análise do impacto da implementação otimizada dos algoritmos de busca no desempenho do codificador como um todo, questão que surge com a utilização de processadores digitais de sinais modernos com alto nível de paralelismo / Abstract: This work presents a review of the code-excited linear predictive (CELP) voice coding scheme, and a detailed and structured study of the search algorithms for algebraic multipulse codebooks (ACELP). In addition to the study of the current algorithms, this work also proposes a new search method, named as position-sequential search. Throughout this work the search algorithms are described using a common notation and represented by pseudo-codes. The computational complexity and perceptual quality of the search algorithms have been measured by the use of the ITU-T G.729 and the ETSI GSM-AMR speech coding standards. The implementations showed that in comparison to standard search procedures the position-sequential search causes only a slight degradation in voice quality, whereas providing a significant reduction in computational complexity. In the sense of reducing the time spent in the search process, this work also analyzes the impact of the optimized implementation of search algorithms on the global performance of the coding process. This question arises in algorithm implementations in modern digital signal processors with a high level of parallelism / Mestrado / Mestre em Engenharia Elétrica
|
7 |
Aplicação do processamento homomorfico na codificação de voz e baixas taxasOliveira, Paulo Cesar Dantas 27 March 1992 (has links)
Orientadores: Amauri Lopes, Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-14T04:23:33Z (GMT). No. of bitstreams: 1
Oliveira_PauloCesarDantas_M.pdf: 4479793 bytes, checksum: dc1dfe285816cd128cb02d73963a555f (MD5)
Previous issue date: 1992 / Resumo: Este trabalho traz uma análise da aplicação da técnica da Deconvolução Homom6rfica na Codificação de Voz a Baixas Taxas. A partir desta técnica é possível obter o cepstrum complexo da resposta impulsiva do filtro digital representativo dos efeitos combinados do Pulso Glótico, do Trato Vocal e da Impedância de Irradiação, segundo o modelo tradicional de produção de sinais de voz. A transmissão de algumas amostras do cepstrum complexo permite a realização de uma estimativa da resposta impulsiva do filtro, a qual, ao ser convoluída com um sinal de excitação adequado, permite reconstruir o sinal de voz no receptor. Com base na análise anterior, são realizadas simulações de Sistemas Homom6rficos de Codificação de Voz, operando a taxas em torno de 4,8 e 9.0 kbits/s. O desempenho destes sistemas é avaliado através de testes subjetivos e comparado ao desempenho de um Sistema de Codificação de Voz baseado na Análise LPC convencional. Este trabalho traz também um estudo sobre a técnica da Predição Homomórfica que combina a Deconvolução Homom6rfica com a Análise Preditiva Linear. Esta técnica possibilita a redução da taxa de transmissão em Sistemas Homom6rficos de Fase Mista, além da oportunidade de avaliação dos efeitos da Análise LPC quando aplicada diretamente sobre a resposta impulsiva do Trato Vocal / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
8 |
Metodologias de avaliação de algoritmos de codificação de vozCampos Neto, Simão Ferraz de 18 July 2018 (has links)
Orientador : Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-18T09:44:29Z (GMT). No. of bitstreams: 1
CamposNeto_SimaoFerrazde_M.pdf: 20723569 bytes, checksum: ad0310962696bfdd2343afe3f2947cb3 (MD5)
Previous issue date: 1993 / Resumo: .Neste trabalho são apreseetados diversos aspectos relacionados à avaliação da qualidade subjetiva e objetiva de algoritmos de codificação de voz, como metodologia de testes, infra-estrutura, descrição de algoritmos de referência e de
medidas objetivas. Este trabalho é importante por fornecer subsídios para a implementação de metodologias efetivas que garantam a qualidade de codificadorcs do sinal de voz quando utilizados na rede telefônica. Após a parte tutorial deste
trabalho, analisam-se os resultados de um dos testes subjetivos para a língua portuguesa realizados durante a padronização da hoje Recomendação CCITT G.728 e os resultados de medidas objetivas de qualidade, bem como a sua capacidade de estimar a qualidade subjetiva / Abstract: Not informed. / Mestrado / Mestre em Engenharia Elétrica
|
9 |
Uma abordagem para análise de desempenho de fluxos VoIP em redes de serviços diferenciadosZuchowski Filho, Edmundo 2010 October 1914 (has links)
O presente trabalho apresenta uma análise de viabilidade do emprego de um fluxo de
controle sintético VoIP para inferir sobre a performance de fluxos individuais de um fluxo
agregado pertencente a um EF PHB em uma rede de serviços diferenciados. A abordagem
proposta visa estabelecer através de simples verificação de performance quanto ao
atendimento do SLA relacionado a alguns requisitos do fluxo VoIP. Os resultados poderão ser
utilizados para alimentar especificações e requisitos para o projeto de ferramentas, por
exemplo, para capacitar atividades de planejamento e ações de gerência de rede. O tráfego
VoIP foi classificado como homogêneo (todos os pacotes do fluxo são criados pelo mesmo
tipo de codec) e como heterogêneo (pacotes originados por mais de um tipo de codec) durante
a realização dos experimentos. Os experimentos verificaram a hipótese de que a performance
do fluxo de controle possa ser relacionada de alguma forma com a performance dos fluxos
individuais de um fluxo agregado sob as suposições e métricas definidas. As métricas retardo,
jitter e perda de pacotes foram estimadas por simulação tanto para o tráfego homogêneo
quanto para o tráfego heterogêneo, em diversas condições de carga controlada. Os resultados
permitem concluir quanto a viabilidade da abordagem para estimar o retardo e com limitações
de confiança, quanto ao jitter, dependendo do tipo de tráfego (heterogêneo) e tipo de codec. / This work presents a viability analysis of the use of a synthetic VoIP control flow to
infer about the performance of individual flows of a flow aggregate belonging to an EF PHB
in a DiffServ network. The proposed approach aims to establish a simple performance
verification of SLA accomplishment related to the some of the VoIP flow requirements. The
results should be used to feed requirements specifications for tool design, for example, to
capacity planning activities and management actions. We classify the VoIP traffic as
homogeneous (all flow packets created by a same codec type) and heterogeneous (packets
originated from more than one codec type) to carry out the experiments. The experiments
checked the hypothesis that the control flow performance can be somehow related to the
performance of individual flows of a flow aggregate under the agreed assumptions and
metrics. The metrics one-way delay, jitter and packet loss were evaluated by simulation for
both homogeneous and heterogeneous traffic at several network-controlled load. The results
let us conclude about the viability of the approach to evaluate one-way delay and with
confidence limitations, also the jitter, depending on the traffic type (heterogeneous) and codec type.
|
10 |
Otimização dos codificadores VSELP e EFR por refinamento na modelagem autoregressivaFantini, Irene Heleonora Seda Pinto 27 July 2018 (has links)
Orientador : Luis Geraldo Pedroso Meloni / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-27T18:00:38Z (GMT). No. of bitstreams: 1
Fantini_IreneHeleonoraSedaPinto_M.pdf: 422802 bytes, checksum: 2af12bc93454d9bc1a63115a843727ee (MD5)
Previous issue date: 2000 / Mestrado
|
Page generated in 1.9679 seconds