Global ETD Search

Return to search

Processamento de consultas documento-a-documento utilizando índice em camadas

Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-17T14:33:52Z
No. of bitstreams: 1
Dissertação - Cristian Rossi.pdf: 662641 bytes, checksum: 1f075c90b91e26f1afdb51e139918633 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:40:09Z (GMT) No. of bitstreams: 1
Dissertação - Cristian Rossi.pdf: 662641 bytes, checksum: 1f075c90b91e26f1afdb51e139918633 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:42:11Z (GMT) No. of bitstreams: 1
Dissertação - Cristian Rossi.pdf: 662641 bytes, checksum: 1f075c90b91e26f1afdb51e139918633 (MD5) / Made available in DSpace on 2015-06-17T20:42:11Z (GMT). No. of bitstreams: 1
Dissertação - Cristian Rossi.pdf: 662641 bytes, checksum: 1f075c90b91e26f1afdb51e139918633 (MD5)
Previous issue date: 2013-03-27 / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / Search engines are mechanisms to seek relevant information within large data collections. The constant growth of electronic media for storage information, along with the popularization of search engines, brings the constant need for solutions that reduce processing costs queries. We present two new algorithms for query processing searching systems. The processing algorithms use the approach document-to-document and modify the current algorithm state of the art, BMW, for taking advantage of an index architecture divided into two layers. The first layer contains only the highest impact index entries and is used to preprocess consultations before accessing the rest of the index in the second layer. This approach results in significant performance gains. The first algorithm, called BMW-CS, is up to 40 times more fast compared to many compared methods, but causes small changes in the returned response. The second algorithm, called BMW-t, preserves the answer set and is 10% faster than the BMW. / Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento
documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW.

Recuperação de informação

Processamento de consultas

Índices invertidos

Sistemas de busca

Information retrieval

Indexes reversed

Search systems

Identifer	oai:union.ndltd.org:IBICT/oai:http://localhost:tede/4123
Date	27 March 2013
Creators	Rossi, Cristian
Contributors	Moura, Edleno Silva de
Publisher	Universidade Federal do Amazonas, Programa de Pós-graduação em Informática, UFAM, Brasil, Instituto de Computação
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	English
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format	application/pdf
Source	reponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM
Rights	info:eu-repo/semantics/openAccess
Relation	-312656415484870643, 600

Page generated in 0.0031 seconds

Processamento de consultas documento-a-documento utilizando índice em camadas

Description

Links & Downloads

Tags

Additional Fields