Spelling suggestions: "subject:"gravações dde audio"" "subject:"gravações dde radio""
1 |
Detecção robusta de adulteração em áudio explorando a forma analítica e o subespaço do sinais interferentes da rede elétrica / Audio tampering robust detection exploiting the analytical form and signal subspace of electric network interfering signalsReis, Paulo Max Gil Innocencio 05 July 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-08-24T20:05:58Z
No. of bitstreams: 1
2016_PauloMaxGilInnocencioReis.pdf: 4145799 bytes, checksum: a906f484de27e45624aa85a6eefd6cdd (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2016-11-04T16:35:53Z (GMT) No. of bitstreams: 1
2016_PauloMaxGilInnocencioReis.pdf: 4145799 bytes, checksum: a906f484de27e45624aa85a6eefd6cdd (MD5) / Made available in DSpace on 2016-11-04T16:35:53Z (GMT). No. of bitstreams: 1
2016_PauloMaxGilInnocencioReis.pdf: 4145799 bytes, checksum: a906f484de27e45624aa85a6eefd6cdd (MD5) / Arquivos de áudio digital são uma importante fonte de vestígios e evidências relacionadas aos mais diversos crimes e conflitos. Seja por meio de gravações devidamente autorizadas pela autoridade judicial ou por gravações realizadas por um dos interlocutores em um diálogo, tais arquivos têm o potencial de serem determinantes em importantes decisões, uma vez que prestam-se a, via de regra, esclarecer algum aspecto da realidade dos fatos. Dessa forma, a autenticação dessa fonte de prova é uma tarefa muitas vezes necessária e crítica, porém ainda sujeita a muitos desafios. Com o objetivo de identificar edições em arquivos de áudio propõe-se uma técnica para detecção automática de adulterações em gravações de áudio por meio da constatação de variações anormais na frequência de oscilação de sinais interferentes da rede elétrica (ENF), eventualmente incorporados em um registro de áudio questionado. Variações anormais na ENF podem ocorrer como resultado de transições abruptas de fase decorrentes de inserções ou supressões de segmentos de áudio realizados durante o processo de edição. Dessa forma, propõe-se o estimador de ENF ESPRIT-Hilbert em conjunto com um detector de outliers baseado na curtose amostral da estimada ENF, do inglês ESPRIT-Hilbert ENF estimator in conjunction with an outlier detector based on the sample kurtosis of the estimated ENF (SPHINS). A técnica utiliza conjuntamente um estimador baseado na frequência instantânea obtida via transformada de Hilbert, e outro baseado na técnica ESPRIT. Calcula-se a curtose amostral das estimativas da ENF como medida do grau de anomalia da ENF, compondo-se um vetor de características que é aplicado a um classificador de máquinas de vetores de suporte (SVM), devidamente treinado a partir de uma base de dados conhecida para indicar a presença de edições. O método proposto tem seus resultados validados utilizando uma base de dados que contém 100 gravações telefônicas autorizadas de áudios não editados, e 100 gravações telefônicas de áudios editados. Os resultados obtidos são comparados com trabalhos correlatos anteriores. ________________________________________________________________________________________________ ABSTRACT / Digital audio recordings are an important source of evidences related to various crimes and conflicts. Whether through recordings duly authorized by a judicial authority or made by one of the parties in a dialogue, such files have the potential to be crucial in important decisions since they contribute to clarify some aspects of reality. Thus, the authentication of this source of evidence is often a necessary and critical task, but still subject to many challenges. In order to identify audio tampering we propose a technique to detect adulterations in audio recordings by exploiting abnormal variations in the Electric Network Frequency (ENF) signal eventually embedded in a questioned audio recording. These abnormal variations may be caused by abrupt phase discontinuities due to insertions and suppressions of audio segments during the tampering task. Thus, we propose the ESPRIT-Hilbert ENF estimator in conjunction with an outlier detection based on the sample kurtosis of the estimated ENF (SPHINS). The technique uses a joint estimate of ENF by two methods, one based in the Hilbert Transform, and the other in the ESPRIT approach. It calculates the sample kurtosis of the estimates as a measure of outlierness, computing a feature vector applied to a Support Vector Machine (SVM) classifier to indicate the presence of tampering. The proposed scheme is validated using an audio database with 100 edited and 100 unedited authorized audio recordings of phone calls. The results obtained are further compared with previous related works.
|
2 |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor / Applying base value of fundamental frequency via MVKD in forensic speaker comparisonSilva, Ronaldo Rodrigues da 13 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-01-20T15:21:13Z
No. of bitstreams: 1
2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Approved for entry into archive by Ruthléa Nascimento(ruthleanascimento@bce.unb.br) on 2017-03-22T16:52:27Z (GMT) No. of bitstreams: 1
2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Made available in DSpace on 2017-03-22T16:52:27Z (GMT). No. of bitstreams: 1
2016_RonaldoRodriguesdaSilva.pdf: 1507927 bytes, checksum: 9db7accbea588ec2c50174217c542007 (MD5) / Comparação forense de locutor (CFL) é utilizada como uma abordagem complementar na
confirmação da autoria de um crime. A metodologia mais difundida mundialmente neste tipo de
exame se baseia em análises perceptuais e acústicas.
Uma das medidas acústicas mais utilizadas em CFL é a frequência fundamental (F0). O
parâmetro acústico F0 é robusto em áudios de baixa qualidade e é independente do conteúdo
das falas, o que o torna um parâmetro interessante de ser utilizado nas análises forenses. Além
disso, o algoritmo de extração de F0 apresenta baixa complexidade computacional.
Neste trabalho, propõe-se analisar o poder discriminante da medida de longo termo da frequência
fundamental nomeada valor de base de F0, que em trabalhos recentes tem se mostrado menos
sujeita a variações associadas ao conteúdo, ao estilo da fala, ao canal utilizado na gravação,
além de exigir uma menor quantidade de material para obter uma medida estável em
comparação a outras medidas de longo termo, como a média aritmética e o desvio padrão.
Foi avaliado o ganho de poder discriminante ao combinar a medida do valor de base de F0 a
outras medidas de longo termo de F0 usualmente utilizadas na área forense por meio de uma
abordagem que aplica a estatística de densidade do núcleo de multivariáveis, do inglês
Multivariate Kernel-Density (MVKD). Os testes foram realizados utilizando um corpus composto
de gravações de áudios de falantes masculinos do português brasileiro contendo 60 segundos
de produções vozeadas e obteve-se uma Taxa de Erro Igual, do inglês Equal Error Rate (EER)de 13 %, superando pesquisas recentes. / Forensic Speaker Comparisons (FSC) are applied as a complementary approach to
con rm the authorship of a crime. The methodology most used in FSC is based on
perceptual and acoustic analysis.
One of the most frequent measures in FSC is the fundamental frequency F0. The acoustic
parameter F0 is robust in low audio quality regardless of the speech content, which
is very important to the forensic area. Moreover, its algorithm has a low computational
complexity.
In this work, we propose to analyze the discriminatory power of the long-term fundamental
frequency parameter named baseline of the F0. This parameter is more stable
considering the speech content and style, the recording channel and needs less audio
quantity to extract a reliable measure compared to other F0 parameters, as arithmetic
mean and the standard deviation which are the most used parameters in the forensic
area.
The discriminant gain improvement obtained combining the baseline of the F0 and
other long-term fundamental frequency measures was addressed using the statistics of
the Multivariate Kernel-Density (MVKD). The experiments were done using a brasilian
portuguese male recording corpus containing 60 seconds of voiced speech each sample.
We show that our proposed approach achieves an Equal Error Rate (EER) of 13 %
outperforming recent researches.
|
Page generated in 0.0752 seconds