Spelling suggestions: "subject:"engenho dde busca"" "subject:"engenho dee busca""
1 |
Uma proposta para a atualização da base de dados em engenhos de busca utilizando classificadoresBARBOSA, Luciano de Andrade January 2003 (has links)
Made available in DSpace on 2014-06-12T15:58:49Z (GMT). No. of bitstreams: 2
arquivo4714_1.pdf: 577288 bytes, checksum: 0df7b311129c3ab32b304b72880b28db (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2003 / Os Sistemas de Recuperação de Informação (SRI) têm por tarefa básica processar uma
consulta feita por um usuário, e, a partir dela, recuperar um conjunto de documentos
armazenados em uma coleção de dados, que são relevantes às necessidades de
informação deste usuário. As bibliotecas estão entre as primeiras instituições a adotarem
um SRI para facilitar o acesso às suas informações, através do uso de consultas
bibliográficas. Uma das características deste tipo de sistema em bibliotecas é a
manipulação controlada dos dados, ou seja, há um controle, por exemplo, de quem são
os autores dos documentos existentes, em que momento estes documentos foram
inseridos, modificados ou retirados da coleção. Ao contrário dos dados utilizados por
um sistema para consultas bibliográficas, a Web é uma coleção não controlada de
documentos, ou seja, a todo instante, estão sendo inseridos e modificados documentos
por diferentes pessoas, em locais distintos. Além dessa alta dinamicidade, a Web possui
um número muito grande de documentos, que vem aumentando exponencialmente. No
entanto, para que um SRI possa disponibilizar informações sobre o conteúdo da Web de
forma eficiente, é preciso que ele saiba lidar com esses problemas apresentados. Para
isso surgiu um novo tipo de SRI, os engenhos de busca. Eles têm como um de seus
grandes desafios manter as informações de sua base de dados atualizadas,
principalmente, porque eles são executados sobre recursos limitados (banda passante,
memória e processamento). Neste sentido, este trabalho propõe uma solução para o
problema da atualização da base de dados de um engenho de busca, focando na
utilização racional dos recursos utilizados por ele para a realização desta tarefa. Esta
solução baseia-se no uso de uma política não-uniforme, na qual elementos mais
dinâmicos são atualizados mais freqüentemente do que os menos dinâmicos. Para a
utilização desta política, são utilizadas técnicas de Aprendizagem de Máquina e
estatística para identificar os grupos de páginas de dinamicidade semelhantes. Um
protótipo contendo esta solução é desenvolvido a fim de validar seu desempenho em um ambiente real e um estudo de caso é apresentado visando mostrar a maior eficiência
desta solução em relação a uma abordagem tradicional de atualização
|
2 |
Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e IndexaçãoFernandes, Marcelo Rômulo January 2001 (has links)
Made available in DSpace on 2014-06-12T15:59:10Z (GMT). No. of bitstreams: 2
arquivo4931_1.pdf: 581419 bytes, checksum: 6d9e1efec074c836155c1e69761c3415 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2001 / A Internet é uma das principais fontes de informação utilizadas no apoio à solução de
problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos
meios mais utilizados para pesquisa de informação nesse ambiente. Observa-se que o
tamanho extraordinário, o crescimento exponencial e a elevada taxa de modificação da
World-Wide-Web (www) requerem novas abordagens aos problemas de indexação e
pesquisa de informação na estrutura dos Engenhos de Busca. Neste trabalho, uma
solução distribuída para operação de Engenhos de Busca é apresentada, visando
escalabilidade e atualidade. São comentadas arquiteturas distribuídas para Engenhos de
Busca. Apresenta-se o Radix, um Engenho de Busca distribuído para indexar e
pesquisar informação na www, baseado em visões Web. Um protótipo é desenvolvido,
focalizando a implementação de crawling e indexação do Radix distribuído, a fim de
validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre
Engenhos de Busca centralizados e distribuídos é apresentado, encorajando o uso de
técnicas de distribuição para elevar os valores de cobertura e atualidade desses sistemas
|
Page generated in 0.0549 seconds