• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Detecção de atividade vocal utilizando recorrência

Pereira, Danilo Mendes Rodrigues January 2018 (has links)
Orientador: Prof. Dr. Filipe Ieda Fazanaro / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2018. / A detecção de atividade de voz é um problema importante em muitas aplicações de fala/áudio, incluindo codificação e reconhecimento automático de fala; vários algoritmos foram propostos na literatura explorando diferentes métricas de sinais (como a energia do sinal). Neste trabalho, é apresentada uma metodologia alternativa para detecção de atividade vocal (VAD) de um discurso ou sinal de áudio com base nas informações fornecidas pelos gráficos de recorrência do sinal. O método proposto foi capaz de classificar corretamente sinais limpos e com baixos níveis de ruído, apresentando desempenho próximo ao algoritmo incluído no codec G.729, que é comumente usado em aplicativos de Voz sobre IP (VoIP). / Voice activity detection is an important problem in many speech/audio applications, including coding and automatic speech recognition; several algorithms have been proposed in the literature to explore different signal metrics (such as signal energy). In this work, an alternative methodology for the Voice Activity Detection (VAD) of a discourse or audio signal is presented based on the information provided by the signals¿ recurrence plots. The proposed method was able to correctly classify clean signals and with low levels of noise, obtained performance similar to the algorithm included in the G.729 codec, which is commonly used in VoIP applications.

Page generated in 0.0206 seconds