Global ETD Search

1	Métodos de Poda Estática para Índices de Máquina de Busca Silva, Francisca Sancha Azevedo da 27 July 2009 (has links) Made available in DSpace on 2015-04-11T14:03:13Z (GMT). No. of bitstreams: 1 DISSERTACAO.pdf: 487136 bytes, checksum: a15e0d0fd4eafc6664cf921aa9c18433 (MD5) Previous issue date: 2009-07-27 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Métodos de poda de índices têm sido propostos a fim de melhorar a eficiência de máquinas de busca. Nos métodos de poda estática, as entradas do índice que têm pouca contribuição para ordenação das respostas são descartadas, reduzindo o tempo de acesso ao índice. Neste trabalho é realizado um estudo sobre métodos de poda estática e são propostos dois métodos.O primeiro método proposto leva em consideração a raridade dos termos do vocabulário para realizar a poda. Este método é apropriado para coleções que possuam grande incidência de termos raros nas consultas e um vocabulário com os tamanhos dos termos não concentrado em faixas de tamanho específicas. O segundo método proposto é apropriado para coleções onde os termos das consultas têm baixos valores de idf (inverse document frequency) e baseia-se no tamanho dos termos de logs de consultas para realizar a poda. Os resultados apresentados foram satisfatórios e podem ser aplicados a coleções com as características das estudadas neste trabalho. Máquinas de Busca Indexação Poda Estática
2	Detecção de ruídos em repositórios de máquina de busca Souza, Jucimar Brito de 08 March 2013 (has links) Made available in DSpace on 2015-04-20T12:33:27Z (GMT). No. of bitstreams: 1 jucimar.pdf: 2914952 bytes, checksum: 07583d96a43d2aaee11457881962b461 (MD5) Previous issue date: 2013-03-08 / Search engines are among the most used tools to find information on the Web. Recent studies show that the user s confidence on these systems is high. However, the database of search engines usually contains noisy information that may decrease the search results quality and thus negatively affect the confidence of users in these systems. Such type of information is called noise and it can be intentional or not. The main goals of this thesis are to develop and enhance techniques to detect noise in databases of search engines. We evaluated noisy sources of information that may be present either in the anchor text and/or links structures of search engine indexes. As a result, we present methods to turn search engines less susceptible of negative impact caused by the presence of noisy. / Máquinas ou motores de busca são as ferramentas mais usadas para localizar informações na Internet. Para muitas empresas, a porta de entrada para seu negócio está nas respostas dadas por esses mecanismos a determinadas consultas. Por este motivo, é importante que suas páginas estejam bem posicionadas nestas respostas. Pesquisas recentes mostram que a confiança dos usuários neste mecanismo é relativamente alta. Entretanto, existe nos repositórios de máquinas de busca uma série de informações que podem levar à degradação da qualidade das respostas providas por estes sistemas. Tais informações são conhecidas como ruído, podendo ser geradas de maneira intencional ou não. Esta tese tem como principal objetivo desenvolver e aprimorar técnicas de detecção e tratamento de informação ruidosa em máquinas de busca. Foram avaliadas fontes ruidosas que podem estar nos textos de âncora e/ou nas estruturas dos apontadores presentes em repositórios de máquina de busca. Como resultados, são apresentados métodos para tornar máquinas de busca menos suscetíveis aos efeitos negativos da presença do ruído em seus repositórios. Máquina de Busca Repositórios de máquinas de busca Search engine
3	Uma abordagem evolutiva para combinação de fontes de evidência de relevância em máquinas de busca Silva, Thomaz Philippe Cavalcante 07 April 2008 (has links) Made available in DSpace on 2015-04-11T14:03:21Z (GMT). No. of bitstreams: 1 Thomaz Philippe Cavalcante Silva.pdf: 477958 bytes, checksum: f2d356a7d29673f431c4aa41d9c41d11 (MD5) Previous issue date: 2008-04-07 / CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico / Modern search engines use different strategies to improve the quality of their answers. An important strategy is to get an ordered list of documents based on lists produced by different sources of evidence. This work studies the use of a evolutionary technique to generate good functions of combination of three different sources of evidence: the textual content of the documents, the connecting structures between the documents in a collection and the concatenation of anchor texts pointing to each document. The functions Combination findings in this study were tested in two separate collections: the first contains queries and document a real Web search engine that contains some 12 million documents and the second is to LETOR reference collection, created to allow the fair comparison between collating functions learning methods. The experiments indicate that the studied approach here is a practical and effective alternative to combining different sources of evidence in a single list of answers. We also checked different query classes require different functions combination of sources of evidence and show that our approach is feasible to identify good features. / Máquinas de busca modernas utilizam diferentes estratégias para melhorar a qualidade de suas respostas. Uma estratégia importante é obter uma única lista ordenada de documentos baseada em listas produzidas por diferentes fontes de evidência. Este trabalho estuda o uso de uma técnica evolutiva para gerar boas funções de combinação de três diferentes fontes de evidência: o conteúdo textual dos documentos, as estruturas de ligação entre os documentos de uma coleção e a concatenação dos textos de âncora que apontam para cada documento. As funções de combinação descobertas neste trabalho foram testadas em duas coleções distintas: a primeira contém consultas e documentos de uma máquina de busca real da Web que contém cerca de 12 milhões de documentos e a segunda é a coleção de referência LETOR, criada para permitir a justa comparação entre métodos de aprendizagem de funções de ordenação. Os experimentos indicam que a abordagem estudada aqui é uma alternativa prática e efetiva para combinação de diferentes fontes de evidência em uma única lista de respostas. Nós verificamos também que diferentes classes de consultas necessitam de diferentes funções de combinação de fontes de evidência e mostramos que nossa abordagem é viável em identificar boas funções. Recuperação de informação Máquinas de busca Web Programação genética Funções de ordenação de consultas Information Retrieval Search engines Genetic programming Sorting functions consultations

1

Page generated in 0.0632 seconds