A classificação automática de gêneros musicais é uma tarefa importante na área de recuperação da informação musical. Para auxiliar esta tarefa diversos recursos linguísticos de processamento de linguagem natural vem sendo utilizado sem letras de músicas. Isto é importante considerando que a classificação baseada em áudio pode ser complementada com características das letras de músicas para auxiliar na melhoria dos resultados. Este trabalho busca realizar a análise de tais ferramentas de processamento de linguagem natural aplicadas as letras de músicas em diferentes idiomas para a classificação de gêneros musicais. Além disso, foram estudadas outras técnicas para melhorar os resultados da classificação, como por exemplo, combinação de características por meio de early fusion e late fusion. Para realizar os experimentos foram criadas três bases de dados com letras de músicas em diversos gêneros nos idiomas Latinos (Português e Espanhol), Nórdicos (Dinamarquês, Norueguês e Sueco) e Inglês. Os resultados obtidos demonstram que a combinação das abordagens por meio das técnicas de late fusion através do produto da probabilidade e da técnica de early fusion proporcionaram os melhores resultados na classificação de gêneros musicais utilizando letras de músicas em diferentes idiomas. / The automatic music genre classification is an important area in music information retrieval. For assist this task many languages resources of natural language processing has been used in song lyrics. This is important considering that the classification audio-based might be comple- mented with lyrics features to improve the results. This work analyzes such natural language processing tools employed to song lyrics in different languages for the music genre classi- fication. Furthermore, we studied other techniques to improve the classification results, for example, features combination by mean of early and late fusion methods. To run the experiments were created three lyrics database in various music genres into the Latin languages (Portuguese and Spanish), Nordic (Danish, Norwegian and Swedish) and En- glish. The results obtained shown that the combination approaches by mean of late fusion with product of the probability and early fusion outperformed the other approaches in music genre classification using song lyrics in different languages.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.utfpr.edu.br:1/2553 |
Date | 17 December 2015 |
Creators | Lima, Adriano Alves de |
Contributors | Silla Junior, Carlos Nascimento, Silla Junior, Carlos Nascimento, Sanches, Danilo Sipoli, Paraíso, Emerson Cabrera |
Publisher | Universidade Tecnológica Federal do Paraná, Cornelio Procopio, Programa de Pós-Graduação em Informática, UTFPR, Brasil |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UTFPR, instname:Universidade Tecnológica Federal do Paraná, instacron:UTFPR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0126 seconds