• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 54
  • 4
  • 2
  • Tagged with
  • 60
  • 35
  • 19
  • 13
  • 13
  • 13
  • 11
  • 11
  • 10
  • 9
  • 9
  • 9
  • 8
  • 8
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Síntese de sons musicais baseada na transformada de Karhunen-Loève / not available

Ynoguti, Carlos Alberto 10 March 1995 (has links)
Tradicionalmente, a técnica de síntese aditiva com funções base de Fourier é a que tem apresentado melhores resultados no que diz respeito à qualidade dos sons gerados. Entretanto, a carga computacional imposta por esta técnica é extremamente alta, dificultando assim a sua implementação em tempo real. Substituindo as funções de Fourier por outras mais complexas, derivadas das técnicas estatísticas de Karhunen-Loève, consegue-se uma redução na quantidade de operações necessárias. Neste trabalho foi estudado e implementado em microcomputador um modelo de síntese aditiva baseada em análise utilizando a transformada de Karhunen-Loève. / Traditionally, the Fourier based aditive synthesis is the method that have achieved the best results concerning to the quality of the generated sounds. However, the computacional load imposed by this technique is extremely high, difliculting its real time implementation. Substituting the Fourier functions by another set of more complex functions, derived from the Karhunen-Loève statistical techniques, one achieves a reduction on the amount of the necessary operations so as to viabilize its real time implementation.
12

Localização do locutor em ambiente de videoconferência utilizando sinal de áudio e vídeo

Blauth, Dante Augusto 25 March 2010 (has links)
Made available in DSpace on 2015-03-05T14:01:49Z (GMT). No. of bitstreams: 0 Previous issue date: 25 / Hewlett-Packard Brasil Ltda / A localização do locutor ativo em ambientes de videoconferência traz benefícios importantes, como transmitir apenas o sinal relativo a este locutor, reduzindo a quantidade de informações trafegadas na rede, eliminar ruídos indesejados e ainda possibilitar focar a câmera no locutor. Embora essa tarefa não seja inovadora, ainda está sendo aperfeiçoada, visto que ambientes reais de videoconferência possuem ruído, problemas de iluminação, etc., o que torna o objetivo mais difícil de ser alcançado de maneira satisfatória. O presente trabalho apresenta uma metodologia para localização do locutor ativo em videoconferência, utilizando o sinal de áudio capturado por um arranjo de microfones e o sinal de vídeo capturado por uma web-câmera. No tratamento do sinal de vídeo, utiliza-se um algoritmo para detecção de faces, que é modificado para para diminuir seu custo computacional. O sinal de áudio é processado no domínio de frequência, utilizando-se o algoritmo SRP-PHAT para localizar a fonte sonora. A fusão dos dois
13

Detecção de réplicas em evidências de áudio usando um esquema adaptativo de audio fingerprinting

Távora, Rodrigo Gurgel Fernandes 10 October 2017 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2018-03-14T19:20:01Z No. of bitstreams: 1 2017_RodrigoGurgelFernandesTávora.pdf: 2499230 bytes, checksum: 872d779c73e9332c7489050b67768913 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2018-03-27T12:21:32Z (GMT) No. of bitstreams: 1 2017_RodrigoGurgelFernandesTávora.pdf: 2499230 bytes, checksum: 872d779c73e9332c7489050b67768913 (MD5) / Made available in DSpace on 2018-03-27T12:21:32Z (GMT). No. of bitstreams: 1 2017_RodrigoGurgelFernandesTávora.pdf: 2499230 bytes, checksum: 872d779c73e9332c7489050b67768913 (MD5) Previous issue date: 2018-03-27 / Este trabalho aborda o problema de autenticação passiva de áudio e objetiva propor um método automático para detecção de edições fraudulentas produzidas através da replica- ção de trechos curtos de sinal dentro de uma mesma evidência de áudio. O método proposto é baseado em um esquema adaptativo de Audio Fingerprinting. Diversos sistemas de Audio Fingerprinting existentes são analisados, e, conforme os requisitos estipulados para a aplicação forense, de elevada robustez e usabilidade, uma abordagem de Audio Fingerprinting binária baseada na distribuição do espectro de Fourier é escolhida. Um sistema adaptativo é proposto, o qual é ajustado teoricamente e empiricamente para cada evidência de áudio. As simulações mostram uma robustez do método contra distorções no domínio do tempo e da frequência. A capacidade de discriminar áudios correspondentes a um mesmo texto e diferenciá-los de réplicas também é analisada. Novas modificações são propostas, como o emprego de um critério de dupla detecção, e o sistema final obtido demonstrou ser aplicável a áudios de longa duração e robusto contra mascaramentos por inserção de ruído. / This work addresses the problem of passive audio authentication and aims to propose an automatic method to detect forgeries produced by the replication of an audio signal within the same audio evidence. The proposed method uses an adaptive Audio Fingerprinting system. Several existing systems are analyzed, and, according to the de_ned requirements of usability and robustness against masking distortions, an adaptive binary Audio Fingerprinting scheme based on the Fourier spectrum distribution is chosen. An adaptive system is proposed, which is theoretically and empirically adjusted for each audio evidence. Simulations show that the designed system is robust against time and frequency-domain distortions. The power to discriminate repeated text speech and distinguish it from audio replicas is also analyzed. Further adjustments are suggested, such as the use of a double detection criteria, and the _nal scheme was able to detect short replicas, distorted by noise insertion, even within long audio evidences
14

Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor / Applying base value of fundamental frequency via MVKD in forensic speaker comparison

Silva, Ronaldo Rodrigues da 13 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-01-20T15:21:13Z No. of bitstreams: 1 2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Approved for entry into archive by Ruthléa Nascimento(ruthleanascimento@bce.unb.br) on 2017-03-22T16:52:27Z (GMT) No. of bitstreams: 1 2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Made available in DSpace on 2017-03-22T16:52:27Z (GMT). No. of bitstreams: 1 2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Comparação forense de locutor (CFL) é utilizada como uma abordagem complementar na confirmação da autoria de um crime. A metodologia mais difundida mundialmente neste tipo de exame se baseia em análises perceptuais e acústicas. Uma das medidas acústicas mais utilizadas em CFL é a frequência fundamental (F0). O parâmetro acústico F0 é robusto em áudios de baixa qualidade e é independente do conteúdo das falas, o que o torna um parâmetro interessante de ser utilizado nas análises forenses. Além disso, o algoritmo de extração de F0 apresenta baixa complexidade computacional. Neste trabalho, propõe-se analisar o poder discriminante da medida de longo termo da frequência fundamental nomeada valor de base de F0, que em trabalhos recentes tem se mostrado menos sujeita a variações associadas ao conteúdo, ao estilo da fala, ao canal utilizado na gravação, além de exigir uma menor quantidade de material para obter uma medida estável em comparação a outras medidas de longo termo, como a média aritmética e o desvio padrão. Foi avaliado o ganho de poder discriminante ao combinar a medida do valor de base de F0 a outras medidas de longo termo de F0 usualmente utilizadas na área forense por meio de uma abordagem que aplica a estatística de densidade do núcleo de multivariáveis, do inglês Multivariate Kernel-Density (MVKD). Os testes foram realizados utilizando um corpus composto de gravações de áudios de falantes masculinos do português brasileiro contendo 60 segundos de produções vozeadas e obteve-se uma Taxa de Erro Igual, do inglês Equal Error Rate (EER)de 13 %, superando pesquisas recentes. / Forensic Speaker Comparisons (FSC) are applied as a complementary approach to con rm the authorship of a crime. The methodology most used in FSC is based on perceptual and acoustic analysis. One of the most frequent measures in FSC is the fundamental frequency F0. The acoustic parameter F0 is robust in low audio quality regardless of the speech content, which is very important to the forensic area. Moreover, its algorithm has a low computational complexity. In this work, we propose to analyze the discriminatory power of the long-term fundamental frequency parameter named baseline of the F0. This parameter is more stable considering the speech content and style, the recording channel and needs less audio quantity to extract a reliable measure compared to other F0 parameters, as arithmetic mean and the standard deviation which are the most used parameters in the forensic area. The discriminant gain improvement obtained combining the baseline of the F0 and other long-term fundamental frequency measures was addressed using the statistics of the Multivariate Kernel-Density (MVKD). The experiments were done using a brasilian portuguese male recording corpus containing 60 seconds of voiced speech each sample. We show that our proposed approach achieves an Equal Error Rate (EER) of 13 % outperforming recent researches.
15

Síntese de sons musicais baseada na transformada de Karhunen-Loève / not available

Carlos Alberto Ynoguti 10 March 1995 (has links)
Tradicionalmente, a técnica de síntese aditiva com funções base de Fourier é a que tem apresentado melhores resultados no que diz respeito à qualidade dos sons gerados. Entretanto, a carga computacional imposta por esta técnica é extremamente alta, dificultando assim a sua implementação em tempo real. Substituindo as funções de Fourier por outras mais complexas, derivadas das técnicas estatísticas de Karhunen-Loève, consegue-se uma redução na quantidade de operações necessárias. Neste trabalho foi estudado e implementado em microcomputador um modelo de síntese aditiva baseada em análise utilizando a transformada de Karhunen-Loève. / Traditionally, the Fourier based aditive synthesis is the method that have achieved the best results concerning to the quality of the generated sounds. However, the computacional load imposed by this technique is extremely high, difliculting its real time implementation. Substituting the Fourier functions by another set of more complex functions, derived from the Karhunen-Loève statistical techniques, one achieves a reduction on the amount of the necessary operations so as to viabilize its real time implementation.
16

Caminhos para inclusão: uma reflexão sobre áudio-descrição no teatro infanto-juvenil

Nóbrega, Andreza 31 January 2012 (has links)
Submitted by Amanda Silva (amanda.osilva2@ufpe.br) on 2015-04-10T13:07:30Z No. of bitstreams: 2 AndrezaNobrega.pdf: 1330420 bytes, checksum: aef4230c89158a6d71d9b61962384854 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-04-10T13:07:30Z (GMT). No. of bitstreams: 2 AndrezaNobrega.pdf: 1330420 bytes, checksum: aef4230c89158a6d71d9b61962384854 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2012 / Sesc Pernambuco / A presente pesquisa analisou as contribuições da áudio-descrição para a recepção e fruição do espetáculo teatral por espectadores com deficiência visual, examinando os relatos das informações visuais captadas, refletindo em que nível elas são imprescindíveis para usufruir de produtos artísticos e assim, caminhar em direção à inclusão cultural, educacional e social da pessoa com deficiência. De cunho qualitativo, este estudo recorreu à criação de um caso significativo em que se evidencia a acessibilidade comunicacional para pessoa com deficiência visual, caso este que fora aplicado o recurso da áudiodescrição no espetáculo “Nem Sempre Lila” direcionado à infância e juventude, com sua posterior análise, por meio de uma entrevista individual, visando identificar elementos visuais captados pelo usuários da áudio-descrição. A análise revelou que a recepção e fruição do espetáculo por meio da áudiodescrição se torna muito mais significativa, ao passo que os sujeitos se relacionam com os diversos elementos da teatralidade (cenário, figurino, movimentação cênica, iluminação, maquiagem) que influenciam a forma de sentir e receber a obra, empoderando-os para que possam emitir seu posicionamento crítico enquanto espectador, que é aspecto importante para a área do teatro-educação. Além de confirmarem os benefícios do recurso, os sujeitos deste estudo expressaram o sentimento de acolhimento ao serem reconhecidos e valorizados enquanto ser humano participante de ações comuns a todos, como ir ao teatro.
17

Avaliação de voz sobre IP em redes Peer-to-Peer

Silva, Auristela Maria da January 2005 (has links)
Made available in DSpace on 2014-06-12T16:01:05Z (GMT). No. of bitstreams: 2 arquivo7156_1.pdf: 2405287 bytes, checksum: 63f88801321ea61b8de43e420495d1b8 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2005 / A tecnologia de Voz sobre IP (VoIP) nasceu da necessidade da convergência das redes de telefonia e dados, aproveitando uma infra-estrutura de alcance mundial, a Internet. Esta tecnologia traz como vantagem a redução dos custos telefônicos, além da possibilidade de agregar novos serviços à telefonia. A tecnologia de Voz sobre IP é o resultado da pesquisa em busca de novas soluções tecnológicas, numa área que movimenta milhões em dólares, a área de telecomunicações, podendo se tornar um fenômeno na Internet, assim como os aplicativos de e-mails e mensagens instantâneas. Muitas iniciativas de projetos de VoIP têm surgido nos últimos anos. Dentre essas iniciativas temos o Skype, um aplicativo VoIp de grande sucesso. O Skype é um aplicativo de VoIP que usa a tecnologia peer-to-peer (P2P) híbrida, chamando atenção pela qualidade de transmissão da voz. O Skype é uma empresa de telefonia virtual, oferecendo chamadas telefônicas gratuitas entre computadores no mundo inteiro. Possui, ainda, as soluções SkypeIn e SkypeOut para o acesso a Rede Pública de Telefonia. Outra iniciativa de aplicativos na tecnologia VoIP é o XVoice. O XVoice foi um dos resultados do Grupo de Trabalho GT-P2P da Rede Nacional de Pesquisa (RNP), sendo projetado para avaliar o tráfego de voz na rede da RNP. O levantamento de requisitos para desenvolver o XVoice demandou um estudo aprofundado sobre o Skype e os protocolos e codecs que são utilizados em aplicações de Voz sobre IP. O XVoice é um aplicativo VoIP que usa a tecnologia peer-to-peer pura. Peer-to-peer é um modelo de comunicação no qual cada nó tem as mesmas capacidades e responsabilidades, e ambos podem iniciar uma sessão de comunicação, contrastando com o modelo cliente/servidor. O objetivo deste trabalho é avaliar os aplicativos de VoIP Skype e XVoice, descrevendo a metodologia e ferramentas utilizadas nesta avaliação. Na avaliação realizada neste trabalho, observou-se que os aplicativos Skype e XVoice possuem desempenhos similares, conforme mostrado nos resultados obtidos
18

Estilo de interação de objeto de aprendizagem de áudio digital na plataforma Amadeus mobile

Ferreira Sobrinho Júnior, João 31 January 2011 (has links)
Made available in DSpace on 2014-06-12T16:01:19Z (GMT). No. of bitstreams: 2 arquivo7606_1.pdf: 2563063 bytes, checksum: 2ee37a679e242b8742869391f22a0fa9 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / As primeiras formas de ensino foram aos poucos in°uenciadas com o aparecimento da internet. Através da internet, se desenvolveu a educação à distância on-line que ofereceu novas possibilidades para a dissemina»c~ao do ensino, dentre elas o móbile learning (m-learning). A flexibilidade e mobilidade advinda do m-learning enseja a utilização de ferramentas dinâmicas e motivadoras para o aprendizado, nesse contexto os objetos de aprendizagem encaixam-se perfeitamente. Esta dissertação apresenta a utilização de objeto de aprendizagem em áudio digital, como estilo de interação no móbile learning da plataforma Amadeus. O método utilizado para se alcançar a meta proposta foi baseada em pesquisa qualitativa e quantitativa, obtidas por meio dos questionários COLLES e ATTLS, além de um texto colaborativo, aplicados em duas turmas de teste através de um curso na Plataforma Amadeus Mobile. Se concluiu com o estudo, a satisfação dos alunos e a ciência da utilização de áudio digital em ambiente mobile para o ensino-aprendizagem
19

Auralização em ambientes audiovisuais imersivos. / Auralization in immersive audiovisual environments.

Faria, Regis Rossi Alves 28 June 2005 (has links)
Nos últimos anos os avanços em áudio multicanal e sistemas envolventes despertaram um grande interesse pelas técnicas para a auralização de campos sonoros espaciais, capazes de recriar ambientações acústicas com grande realismo, envolvendo o ouvinte completamente. Um estudo sobre as tecnologias e soluções para áudio espacial mostrou que a construção de auralizadores envolve quatro blocos funcionais fundamentais. Mas, embora existam muitas técnicas e ferramentas disponíveis, não há uma arquitetura integradora para produção de áudio espacial que permita ao desenvolvedor selecionar as técnicas que deseja e montar uma solução com um grau de refinamento arbitrário que atenda a seus requisitos. Apresenta-se uma arquitetura modular aberta em quatro camadas para produção de áudio espacial em ambientes audiovisuais imersivos. Como estudo de caso, aborda-se a implementação de um auralizador Ambisonics para a CAVERNA Digital. Verifica-se que a auralização pode fornecer a correta perspectiva acústica do ambiente virtual necessária para uma percepção mais realista do espaço, e que a abordagem aberta para se implementar sistemas de áudio 2D/3D apresenta vantagens. Os resultados da implementação são apresentados e discutidos. Como conclusões, identificam-se desafios na implementação e os trabalhos futuros. / Recent advances in multichannel audio and surround systems have contributed to an increasing interest for spatial sound field auralization, capable of delivering acoustic ambience with great realism, and surrounding listener completely. A study on technologies and solutions for spatial sound has shown that building auralizators involve four major functional blocks, but, although there are many techniques and tools available, there is not an integration architecture for spatial audio production which permits developers to select their favorite techniques, and build a solution with an arbitrary refinement level, as wished. It is presented a four level modular open architecture for spatial audio production in immersive audiovisual environments. As a case study, an Ambisonics auralizator is implemented for the CAVERNA Digital CAVE. It is verified that auralization can deliver the correct acoustical perspective for the virtual environment necessary for a more realistic perception of space, and that an open approach presents advantages in 2D/3D audio systems design. Implementation results are presented and discussed. As conclusions, challenges and future works are presented.
20

Performances musicais distribuídas através de Internet residencial / Network music performance over the residential Internet

Tomiyoshi, Marcio Masaki 27 May 2013 (has links)
A ideia de se permitir que diversos músicos possam interagir remotamente utilizando-se de redes de computadores não é nova, mas nunca se popularizou. O que antes era limitado tecnologicamente devido às condições disponibilizadas por conexões de internet pela linha telefônica, hoje apresenta-se muito mais viável tecnicamente com a massicação da internet de banda larga, seja por cabo ou por tecnologias DSL. Apesar disso, encontrar um ambiente virtual em que a performance musical pareça completamente natural para o músico é uma das maiores diculdades nesta área. Embora a latência obtida na conexão entre computadores esteja vinculada principalmente à distância entre os usuários e à qualidade do serviço oferecido pelos provedores de internet, outros aspectos, como a largura de banda, podem ser controlados pelo software. Para lidar com as limitações de largura de banda no acesso à internet disponíveis comercialmente, um método de compactação de áudio eciente e que alie baixa latência algorítmica com alta qualidade sonora é imprescindível. Para evitar que atrasos muito grandes na transmissão do áudio impossibilitem uma interação musical entre os participantes, uma técnica em que a própria resposta sonora do instrumento seja atrasada localmente torna-se uma alternativa válida na busca de um ambiente para performances musicais via rede. Esta dissertação busca apresentar uma alternativa exível e de fácil utilização para que a realização de performances musicais distribuídas por usuários caseiros seja possível, mesmo que estes não tenham acesso a redes dedicadas para tal nalidade. / The idea of allowing several musicians to interact remotely using computer networks is not new but it never became popular. What was once technologically limited because of the conditions available through dial up internet connections is now much more technically feasible with the massication of the broadband internet, whether by cable or by DSL technologies. In spite of that, nding a place where the music performance feels completely natural to the musicians is still one of the biggest challenges in this area. Even though the latency obtained in the connection between computers is mainly linked to the distance between users and to the quality of the service oered by internet providers, others aspects, like the network bandwidth, can be controlled by software. To deal with the limitations on the internet bandwidth commercially available, an ecient audio coding method that has both low algorithmic latency and high sound quality becomes essential. To avoid letting large audio transmission delays make it impossible for players to have a real musical interaction, a technique where the musical instruments own feedback is locally delayed represents a viable alternative in search of a favorable environment for network music performances. This project aims to oer a exible and easy-to-use alternative so that it is possible for home users to be part of network music performances even if they do not have access to networks dedicated to this end.

Page generated in 0.0232 seconds