Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. / Submitted by Oliveira Flávia (flavia@sisbin.ufop.br) on 2015-01-12T15:49:36Z
No. of bitstreams: 2
license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5)
DISSERTAÇÃO_ExplorandoDadosPúblicos.pdf: 1429209 bytes, checksum: 6d9ace1ed2b65c1e0e50def4785c2592 (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2015-01-15T17:22:26Z (GMT) No. of bitstreams: 2
license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5)
DISSERTAÇÃO_ExplorandoDadosPúblicos.pdf: 1429209 bytes, checksum: 6d9ace1ed2b65c1e0e50def4785c2592 (MD5) / Made available in DSpace on 2015-01-15T17:22:26Z (GMT). No. of bitstreams: 2
license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5)
DISSERTAÇÃO_ExplorandoDadosPúblicos.pdf: 1429209 bytes, checksum: 6d9ace1ed2b65c1e0e50def4785c2592 (MD5)
Previous issue date: 2014 / Desde a antiguidade, o homem utiliza meios para realizar recomendações a outras pessoas com as quais se relaciona. Entretanto, nos dias atuais, com a explosão de informação acessível na Web, os meios para realizar recomendações têm sido empregados em diversos sistemas na Web. Na área da recomendação musical não tem sido diferente, pois, nas últimas décadas, houve uma explosão no conteúdo musical disponível e acessível, o que modificou consideravelmente a maneira de escutarmos músicas. Para isso, na literatura são utilizados métodos baseados em aprendizagem de máquina, agrupamentos entre usuários ou itens, exploração de metadados musicais, utilização de dados de uso, entre outros. Independentemente dos métodos empregados, um importante fator na qualidade da recomendação é a fonte de dados usada. Uma das abordagens mais utilizadas em recomendação é a filtragem colaborativa, que pressupõe a existência de dados de ratings de usuários para os itens em recomendação. No entanto, esses dados nem sempre estão presentes nas aplicações, e mesmo quando presentes, muitas vezes são escassos para um número significativo de usuários. Este trabalho visa explorar dados disponíveis na Web para, na falta ou escassez de dados de uso, serem usados para aumentar a qualidade da recomendação no contexto musical. A hipótese é que estes dados públicos poderiam substituir com qualidade os dados de uso, que são privados, em sistemas de recomendação. Os dados públicos utilizados neste trabalho são dados coletados do histórico de programação das rádios e de playlists públicos do YouTube. Como estes dados são gerados por especialistas e estão presentes em grande volume, este trabalho explora a inteligência coletiva existente na geração dos programas das rádios e dos playlists. De fato, os resultados demonstram que, para os cenários onde os dados públicos são podados de forma a simular dados cada vez mais ricos, uma vez que estão presentes em maior volume, o emprego de algoritmos desenvolvidos especialmente para esse propósito podem ser tão eficazes quanto os melhores algoritmos de filtragem colaborativa da literatura. ______________________________________________________________________________________________ / ABSTRACT: Since ancient times men have used several means to make recommendations to other people with whom they relate. However, nowadays, in the information era, the recommendations has been deployed in the web systems in several ways. In the music recommendation field, it has not been different, as in the last decades, the musical content has exploded and it became available, what changed substantially the way we listen to music. For that, on literature, machine learning methods are used, user or item clustering, music metadata exploring, usage data mining, among other methods. Independently of utilized methods, the source of the data used is a important factor in the quality of the recommendation. One of the most used approaches is the colaborative filtering, that presupposes the existence of data of user ratings for recommendation items. Nevertheless, that data are not always available in the applications, and even when they are, they often are scarce for a relevant number of users. This work, aims to explore the available data on the web for, in the case of scarce or missing usage data, being used to increase the quality of recommendation in the music context. The hypothesis is: the public data could substitute with quality the usage data, which are private, in recommendation systems. The public data used in this work are extracted from the radios playlist history and from public YouTube playlists. As those data are generated by specialists and are available as a high volume, this work explores the existing collective intelligence for generating radios programs and playlists. The results show, indeed, that the scenarios where the public data are pruned so that the generated data is constantly becoming more relevant, since they are available in bigger volume, the use of algorithms developed specially for that purpose can be so effective as the literature's best collaborative filtering algorithms.
Identifer | oai:union.ndltd.org:IBICT/oai:localhost:123456789/4214 |
Date | January 2014 |
Creators | Dutra, Alex Amorim |
Contributors | Pereira Junior, Álvaro Rodrigues |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFOP, instname:Universidade Federal de Ouro Preto, instacron:UFOP |
Rights | Autorização concedida ao Repositório Institucional da UFOP pelo autor, 09/01/2015, com as seguintes condições: disponível sob Licença Creative Commons 3.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta., info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds