Return to search

Multi-objective optimization in learn to pre-compute evidence fusion to obtain high quality compressed web search indexes

Submitted by Sáboia Nágila (nagila.saboia01@gmail.com) on 2016-07-29T14:09:40Z
No. of bitstreams: 1
Disertação-Anibrata Pal.pdf: 1139751 bytes, checksum: a29e1923e75e239365abac2dc74c7f40 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-08-15T17:54:46Z (GMT) No. of bitstreams: 1
Disertação-Anibrata Pal.pdf: 1139751 bytes, checksum: a29e1923e75e239365abac2dc74c7f40 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-08-15T17:57:29Z (GMT) No. of bitstreams: 1
Disertação-Anibrata Pal.pdf: 1139751 bytes, checksum: a29e1923e75e239365abac2dc74c7f40 (MD5) / Made available in DSpace on 2016-08-15T17:57:29Z (GMT). No. of bitstreams: 1
Disertação-Anibrata Pal.pdf: 1139751 bytes, checksum: a29e1923e75e239365abac2dc74c7f40 (MD5)
Previous issue date: 2016-04-19 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The world of information retrieval revolves around web search engines. Text search engines
are one of the most important source for routing information. The web search
engines index huge volumes of data and handles billions of documents. The learn to rank
methods have been adopted in the recent past to generate high quality answers for the
search engines. The ultimate goal of these systems are to provide high quality results
and, at the same time, reduce the computational time for query processing. Drawing direct
correlation from the aforementioned fact; reading from smaller or compact indexes
always accelerate data read or in other words, reduce computational time during query
processing.
In this thesis we study about using learning to rank method to not only produce high
quality ranking of search results, but also to optimize another important aspect of search
systems, the compression achieved in their indexes. We show that it is possible to achieve
impressive gains in search engine index compression with virtually no loss in the final
quality of results by using simple, yet effective, multi objective optimization techniques
in the learning process. We also used basic pruning techniques to find out the impact of
pruning in the compression of indexes. In our best approach, we were able to achieve
more than 40% compression of the existing index, while keeping the quality of results at
par with methods that disregard compression. / Máquinas de busca web para a web indexam grandes volumes de dados, lidando com
coleções que muitas vezes são compostas por dezenas de bilhões de documentos. Métodos
aprendizagem de máquina têm sido adotados para gerar as respostas de alta qualidade
nesses sistemas e, mais recentemente, há métodos de aprendizagem de máquina propostos
para a fusão de evidências durante o processo de indexação das bases de dados. Estes
métodos servem então não somente para melhorar a qualidade de respostas em sistemas de
busca, mas também para reduzir custos de processamento de consultas. O único método
de fusão de evidências em tempo de indexação proposto na literatura tem como foco exclusivamente
o aprendizado de funções de fusão de evidências que gerem bons resultados
durante o processamento de consulta, buscando otimizar este único objetivo no processo
de aprendizagem.
O presente trabalho apresenta uma proposta onde utiliza-se o método de aprendizagem
com múltiplos objetivos, visando otimizar, ao mesmo tempo, tanto a qualidade de
respostas produzidas quando o grau de compressão do índice produzido pela fusão de
rankings. Os resultados apresentados indicam que a adoção de um processo de aprendizagem
com múltiplos objetivos permite que se obtenha melhora significativa na compressão
dos índices produzidos sem que haja perda significativa na qualidade final do ranking
produzido pelo sistema.

Identiferoai:union.ndltd.org:IBICT/oai:http://localhost:tede/5128
Date19 April 2016
CreatorsPal, Anibrata
ContributorsMoura, Edleno Silva de
PublisherUniversidade Federal do Amazonas, Programa de Pós-graduação em Informática, UFAM, Brasil, Instituto de Computação
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM
Rightsinfo:eu-repo/semantics/openAccess
Relation-312656415484870643, 600, 500, 1052477850274827528

Page generated in 0.0584 seconds