Return to search

Utilização de métodos de machine learning para identificação de instrumentos musicais de sopro pelo timbre

Orientador: Prof. Dr. Ricardo Suyama / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, Santo André, 2018. / De forma geral a Classificação de Padrões voltada a Processamento de Sinais
vem sendo estudada e utilizada para a interpretação de informações diversas, que se
manifestam em forma de imagens, áudios, dados geofísicos, impulsos elétricos, entre
outros. Neste trabalho são estudadas técnicas de Machine Learning aplicadas ao problema
de identificação de instrumentos musicais, buscando obter um sistema automático de
reconhecimento de timbres. Essas técnicas foram utilizadas especificamente com cinco
instrumentos da categoria de Sopro de Madeira (o Clarinete, o Fagote, a Flauta, o Oboé e
o Sax). As técnicas utilizadas foram o kNN (com k = 3) e o SVM (numa configuração
não linear), assim como foram estudadas algumas características (features) dos áudios,
tais como o MFCC (do inglês Mel-Frequency Cepstral Coefficients), o ZCR (do inglês Zero
Crossing Rate), a entropia, entre outros, sendo fonte de dados para os processos de
treinamento e de teste. Procurou-se estudar instrumentos nos quais se observa uma
aproximação nos timbres, e com isso verificar como é o comportamento de um sistema
classificador nessas condições específicas. Observou-se também o comportamento dessas
técnicas com áudios desconhecidos do treinamento, assim como com trechos em que há
uma mistura de elementos (gerando interferências para cada modelo classificador) que
poderiam desviar os resultados, ou com misturas de elementos que fazem parte das
classes observadas, e que se somam num mesmo áudio. Os resultados indicam que as
características selecionadas possuem informações relevantes a respeito do timbre de
cada um dos instrumentos avaliados (como observou-se em relação aos solos), embora
a acurácia obtida para alguns dos instrumentos tenha sido abaixo do esperado (como
observou-se em relação aos duetos). / In general, Pattern Classification for Signal Processing has been studied and
used for the interpretation of several information, which are manifested in many ways,
like: images, audios, geophysical data, electrical impulses, among others. In this project
we study techniques of Machine Learning applied to the problem of identification
of musical instruments, aiming to obtain an automatic system of timbres recognition.
These techniques were used specifically with five instruments of Woodwind category
(Clarinet, Bassoon, Flute, Oboe and Sax). The techniques used were the kNN (with
k = 3) and the SVM (in a non-linear configuration), as well as some audio features, such
as MFCC (Mel-Frequency Cepstral Coefficients), ZCR (Zero Crossing Rate), entropy,
among others, used as data source for the training and testing processes. We tried to
study instruments in which an approximation in the timbres is observed, and to verify
in this case how is the behavior of a classifier system in these specific conditions. It was
also observed the behavior of these techniques with audios unknown to the training, as
well as with sections in which there is a mixture of elements (generating interferences
for each classifier model) that could deviate the results, or with mixtures of elements
that are part of the observed classes, and added in a same audio. The results indicate
that the selected characteristics have relevant information regarding the timbre of each
one of evaluated instruments (as observed on the solos results), although the accuracy
obtained for some of the instruments was lower than expected (as observed on the duets
results).

Identiferoai:union.ndltd.org:IBICT/oai:BDTD:110473
Date January 2018
CreatorsVeras, Ricardo da Costa
ContributorsSuyama, Ricardo, Silva, Magno Teófilo Madeira da, Takahata, André Kasuo
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf, 142 f. : il.
Sourcereponame:Repositório Institucional da UFABC, instname:Universidade Federal do ABC, instacron:UFABC
Rightsinfo:eu-repo/semantics/openAccess
Relationhttp://biblioteca.ufabc.edu.br/index.php?codigo_sophia=110473&midiaext=76132, http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=110473&midiaext=76131, Cover: http://biblioteca.ufabc.edu.brphp/capa.php?obra=110473

Page generated in 0.1478 seconds