Sistemas de recomendação estão se tornando ferramentas indispensáveis para diversos websites, que buscam oferecer ao seu usuário uma experiência personalizada e simplificada, e sua adoção se deve principalmente devido ao grande volume de dados disponíveis, advindos de diferentes fontes e contendo informações diversificadas, aumentando a necessidade e a complexidade de se extrair valor desses dados. Com o surgimento de redes sociais online os usuários passaram a expressar seus gostos e preferências além de estabelecer relações com outros usuários, podendo estes serem seus amigos, parentes, ídolos, etc. Estas possibilidades encontradas em redes sociais motivou o presente trabalho a interpretar a comunidade científica como uma rede social, utilizando relações de coautoria, colaboração em projetos, orientações, além de citações de trabalhos e, consequentemente, citações aos respectivos autores. O objetivo deste projeto foi propor um sistema de recomendação de trabalhos científicos combinando informações sociais e informações bibliométricas, no que diz respeito a artigos citados em publicações, caraterizando-se como um facilitador para auxiliar os pesquisadores a responderem perguntas como: Quais artigos interessantes da minha área eu ainda não tenho conhecimento? e Quais artigos podem auxiliar em trabalhos que tenho em desenvolvimento? Para atingir o objetivo proposto foram desenvolvidas duas abordagens de recomendação. A primeira abordagem teve como premissa que o tempo em que as relações entre os autores foi estabelecida é determinante para selecionar os autores mais próximos (ou similares), ou seja, as relações mais recentes tendem a ser mais relevantes que as relações mais antigas. Já a segunda técnica combinou o resultados das diferentes técnicas implementadas (tanto a proposta quanto técnicas da literatura correlata) para gerar novas recomendações de maneira híbrida. Os resultados mostraram que a solução baseada no tempo apresentou resultados superiores às estratégias correlatas quando se possui mais informações sobre o autor, ou seja, autores que possuem diversas relações de coautoria e um conjunto de artigos citados elevado tendem a obter resultados melhores quando comparados aos autores que possuem poucas relações e citaram poucos artigos. Já a solução híbrida, que combina os resultados dos diversos recomendadores, apresentou uma cobertura de recomendações superior às demais, pelo fato de combinar os pontos fortes de cada uma das técnicas, encontrando recomendações relevantes no conjunto de testes em mais de 57% dos casos / Recommender systems are becoming indispensable tools on websites, in order to offer a simplified and personalized experience to their users, and its adoption is due to the fact that the volume of data available has increased and also comes from different sources with different types of information. Thus, it is challenge and necessary tools for helping to extract more valuable information from these data. The arise of online social networks allowed users to express their tastes and preferences and establish relationships with other users, such as friends, relatives, idols, etc. Those possibilities found in social networks motivated this work to interpret the scientific community as a social network, providing the ability to use co-authorship relations, collaboration in projects, tutoring relations, as well as paper citations and thus citations from their authors. The goal of this project was to propose a papers recommender system combining social and bibliometric information, regarding cited articles on published papers, being characterized as a facilitator to help researchers to answer questions such as: \"What interesting articles in my area I still have no knowledge of?\" and \"Which articles can assist in the project I am developing?\". The first algorithm proposed used the time when the coauthorship relations among authors were established as a determining parameter to choose which authors are more similar, meaning that relations established in recent time are more relevant than those that are older. The second algorithm combines the results from different implemented algorithms to determine which would be the ideal weight of each algorithm on the recommendation result, using a linear regression on the recommendations scores. The results showed that the time based solution achieved a better performance for the authors with higher amount of information available, i.e., if the author has many coauthorship relations and cited many papers, the results are better when compared with authors that does not have many relations and cited articles. On the other hand, the hybrid solution which combines the results from different recommendations approaches presented a higher coverage compared with others, due to the fact that it combines the strengths of each one of the algorithms, finding recommendation for users on 57% of the cases.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-26072016-160726 |
Date | 21 June 2016 |
Creators | Arthur Patricio Grava |
Contributors | Luciano Antonio Digiampietri, Jesús Pascual Mena-Chalco, Sarajane Marques Peres |
Publisher | Universidade de São Paulo, Sistemas de Informação, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0035 seconds