Made available in DSpace on 2015-04-11T14:02:56Z (GMT). No. of bitstreams: 1
Ludimila.pdf: 1270701 bytes, checksum: 300c827c33013fc4aaa7278441f4a620 (MD5)
Previous issue date: 2013-03-27 / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / The large offer of contents nowadays makes it hard to find relevant information. Recommender systems (RS) have been developed to tackle with such information overloading.
Such systems are tools that recommend, from a large number of alternatives, the ones that the users will probably be interested in. The main RS applications are based on two approaches, content based filtering and collaborative filtering. Among them,
collaborative filtering is the most used one since, in general, it employs a more effective strategy to capture user preferences: to determine groups of users with similar likes and dislikes. The recommendation problem, as viewed by collaborative filtering, can be viewed as the problem of predicting the preference of the user, normally represented as a rating. Traditional systems predict such ratings by means of manually-crafted regression equations obtained by combining different evidences such as: users reputation and its strictness level. As with any other heuristic strategy, there is no guarantee that the used equations are the best for a particular dataset in the sense of minimizing the prediction error. Thus, in this work, we intend to determine if it would be better to learn regression equations instead of using heuristically built ones. Such learned equations should be obtained by using a machine learning regression task to find the most effective combination of evidence on minimizing error. According to our experiments, a simple regression method is able to significantly outperform the best traditional equations
using only evidence explored by those equations. Further, features like ratings that neighbors give to item (as all or individually) and user, item and neighbors average ratings have the best performance. Finally, we obtained gain of until 7% over the baseline with trust feature and gain of 6% over baseline without it. / A grande oferta de conteúdos na sociedade contemporânea torna difícil a tarefa de busca por informações que interessem aos usuários. Uma forma de lidar com tal sobrecarga
de informações é prover ferramentas que recomendem para os usuários, dentre as informações alternativas, aquelas que devem ser de seu interesse. Tais ferramentas são os Sistemas de Recomendação (SR). As principais aplicações em SR se baseiam em duas técnicas, filtragem baseada em conteúdo e filtragem colaborativa. Dentre as duas, a filtragem colaborativa é a mais utilizada uma vez que, em geral, a estratégia que emprega, determinar grupos de usuários com interesses similares, é mais efetiva para capturar preferências. O problema de recomendação, como abordado em filtragem colaborativa, pode ser visto como um problema de previsão da preferência do usuário, normalmente representada por uma nota. Sistemas tradicionais prevêem esta nota através de uma equação de regressão obtida heuristicamente, envolvendo diversas evidências como nível de rigor do usuário e sua reputação. Como em qualquer estratégia heurística, não há nenhuma garantia que as equações usadas para a previsão sejam mais adequadas para um conjunto particular de dados, no sentido de minimizar o erro de previsão. Assim, neste trabalho, buscamos determinar se, em lugar de usar fórmulas heurísticas, não seria mais eficaz determinar automaticamente, por meio de uma técnica de aprendizagem de máquina, a melhor combinação das evidências disponíveis de forma a reduzir o erro de previsão. Nossos experimentos indicam que usando apenas evidências empregadas em métodos tradicionais, um método de regressão, como o proposto, pode alcançar resultados significativamente melhores que métodos tradicionais. Além disso, evidências como as notas que vizinhos atribuem ao item (como um todo ou individualmente) e as notas médias do usuário, do item e dos vizinhos possuíram melhor desempenho. Por fim, obtivemos ganhos de até 7% sobre o baseline com característica de confiança e de 6% sobre baseline sem uso de confiança.
Identifer | oai:union.ndltd.org:IBICT/oai:http://localhost:tede/2920 |
Date | 27 March 2013 |
Creators | Gonçalves, Ludimila Carvalho |
Contributors | Cristo, Marco Antônio Pinheiro de |
Publisher | Universidade Federal do Amazonas, Programa de Pós-graduação em Informática, UFAM, BR, Instituto de Computação |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM |
Rights | info:eu-repo/semantics/openAccess |
Relation | -312656415484870643, 600, 600, 1052477850274827528 |
Page generated in 0.0036 seconds