• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Item-based-adp: análise e melhoramento do algoritmo de filtragem colaborativa item-based / Item-based-adp: analysis and improvent of collaborative filtering algorithm item-based

Aleixo, Everton Lima 02 September 2014 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2015-02-06T20:35:15Z No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2015-02-06T20:35:41Z (GMT) No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-02-06T20:35:41Z (GMT). No. of bitstreams: 2 Dissertação - Everton Lima Aleixo - 2014.pdf: 2375638 bytes, checksum: accbd56745e040e23362d951a1336538 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-09-02 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Memory-based algorithms are the most popular among the collaborative filtering algorithms. They use as input a table containing ratings given by users to items, known as the rating matrix. They predict the rating given by user a to an item i by computing similarities of the ratings among users or similarities of the ratings among items. In the first case Memory-Based algorithms are classified as User-based algorithms and in the second one they are labeled as Item-based algorithms. The prediction is computed using the ratings of k most similar users (or items), also know as neighbors. Memory-based algorithms are simple to understand and to program, usually provide accurate recommendation and are less sensible to data change. However, to obtain the most similar neighbors for a prediction they have to process all the data which is a serious scalability problem. Also they are sensitive to the sparsity of the input. In this work we propose an efficient and effective Item-Based that aims at diminishing the sensibility of the Memory-Based approach to both problems stated above. The algorithm is faster (almost 50%) than the traditional Item-Based algorithm while maintaining the same level of accuracy. However, in environments that have much data to predict and few to train the algorithm, the accuracy of the proposed algorithm surpass significantly that of the traditional Item-based algorithms. Our approach can also be easily adapted to be used as User-based algorithms. / Algoritmos baseados em memória são os mais populares entre os algoritmos de filtragem colaborativa. Eles usam como entrada uma tabela contendo as avaliações feitas pelos usuários aos itens, conhecida como matriz de avaliações. Eles predizem a avaliação dada por um usuário a a um item i, computando a similaridade de avaliações entre a e outros usuários ou entre i e outros itens. No primeiro caso, os algoritmos baseados em memória são classificados como algoritmos baseados em usuários (User-based) e no segundo caso são rotulados como algoritmos baseados em itens (Item-Based). A predição é computada usando as avaliações dos k usuários (ou itens) mais similares, também conhecidos como vizinhos. Algoritmos baseados em memória são simples de entender e implementar. Normalmente produzem boas recomendações e são menos sensíveis a mudança nos dados. Entretanto, para obter os vizinhos mais similares para a predição, eles necessitam processar todos os dados da matriz, o que é um sério problema de escalabilidade. Eles também são sensíveis a densidade dos dados. Neste trabalho, nós propomos um algoritmo eficiente e eficaz baseado em itens que visa diminuir a sensibilidade dos algoritmos baseados em memória para ambos os problemas acima referidos. Esse algoritmo é mais rápido (quase 50%) do que o algoritmo baseado em itens tradicional, mantendo o mesmo nível de acurácia. Entretanto, em ambientes onde existem muitos dados para predizer e poucos para treinar o algoritmo, a acurácia do algoritmo proposto supera significativamente a do algoritmo tradicional baseado em itens. Nossa abordagem pode ainda ser facilmente adaptada para ser utilizada como o algoritmo baseado em usuários.

Page generated in 0.0597 seconds