Made available in DSpace on 2015-04-11T14:03:13Z (GMT). No. of bitstreams: 1
DISSERTACAO.pdf: 487136 bytes, checksum: a15e0d0fd4eafc6664cf921aa9c18433 (MD5)
Previous issue date: 2009-07-27 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Métodos de poda de índices têm sido propostos a fim de melhorar a eficiência de máquinas de busca. Nos métodos de poda estática, as entradas do índice que têm pouca contribuição para ordenação das respostas são descartadas, reduzindo o tempo de acesso ao índice. Neste trabalho é realizado um estudo sobre métodos de poda estática e são propostos dois métodos.O primeiro método proposto leva em consideração a raridade dos termos do vocabulário para realizar a poda. Este método é apropriado para coleções que possuam grande incidência de termos raros nas consultas e um vocabulário com os tamanhos dos termos não concentrado em faixas de tamanho específicas. O segundo método proposto é apropriado para coleções onde os termos das consultas têm baixos valores de idf (inverse document frequency) e baseia-se no tamanho dos termos de logs de consultas para realizar a poda. Os resultados apresentados foram satisfatórios e podem ser aplicados a coleções com as características das estudadas neste trabalho.
Identifer | oai:union.ndltd.org:IBICT/oai:http://localhost:tede/2952 |
Date | 27 July 2009 |
Creators | Silva, Francisca Sancha Azevedo da |
Contributors | Moura, Edleno Silva de |
Publisher | Universidade Federal do Amazonas, Programa de Pós-graduação em Informática, UFAM, BR, Instituto de Computação |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM |
Rights | info:eu-repo/semantics/openAccess |
Relation | -312656415484870643, 600 |
Page generated in 0.0022 seconds