Spelling suggestions: "subject:"cistema dde integração dde dados"" "subject:"cistema dde integração dee dados""
1 |
Uma proposta para o Gerenciamento de Cache de um Sistema de Integração de DadosGALVÃO, Walter de Carvalho Mattos January 2007 (has links)
Made available in DSpace on 2014-06-12T16:00:24Z (GMT). No. of bitstreams: 2
arquivo6556_1.pdf: 641759 bytes, checksum: 7046c38915c80e308e3cd3bc91890b55 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2007 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Sistemas de Integração de Dados (SID) proporcionam ao usuário uma visão unificada de dados
que estão armazenados em diversas fontes diferentes. Essas fontes são independentes e cada
uma possui um esquema próprio, elaborado para atender as necessidades dos usuários de cada
banco. Cada SID possui um conjunto de fontes de dados distintas relevantes para o seu domínio,
e deve colher de cada uma os dados necessários para responder as consultas do usuário.
Uma vez obtidos esses dados, o SID deverá traduzi-los para um esquema global (esquema de
mediação), integrá-los e exibi-los ao usuário.
Para Sistemas de Integração de Dados na Web, como o Integra - SID desenvolvido por
alunos e professores do Centro de Informática da UFPE e utilizado para a implementação das
nossas contribuições - os desafios são ainda maiores, visto que a disponibilidade das fontes se
torna um fator bastante relevante. Sendo assim, o custo para se buscar os dados sempre nas
fontes pode ser bastante alto. Por isso, alguns SID, como o Integra, possuem uma cache para
o armazenamento dos dados resultantes das consultas que o sistema considera mais relevantes.
Desta forma, quando alguma consulta que já esteja armazenada em cache for novamente solicitada
pelo usuário, o sistema não mais necessitará acessar as fontes de dados para respondê-la,
o que otimizará o processamento.
O objetivo desta dissertação de mestrado é apresentar uma proposta de um Gerenciador
de Cache para um Sistema de Integração de Dados. Esse Gerenciador é composto por um
módulo que controla o espaço da cache, decidindo que consultas devem entrar e quais devem
permanecer em cache. Possui outro módulo que identifica se a consulta submetida pelo usuário
está contida em outra que esteja armazenada em cache (técnica de query containment). E por
último, um módulo que realiza a substituição parcial de uma consulta, para o melhor aproveitamento
do espaço da cache
|
2 |
Materialização seletiva de dados baseada em critérios de qualidadeAMARAL, Haroldo José Costa do January 2007 (has links)
Made available in DSpace on 2014-06-12T16:00:34Z (GMT). No. of bitstreams: 2
arquivo6689_1.pdf: 1440653 bytes, checksum: 8e110d032301a3d0e89392806c78a317 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2007 / Sistemas de integração de dados oferecem acesso uniforme a informações distribuídas em fontes
autônomas e heterogêneas, através de um esquema integrado que compõe uma visão integrada das
fontes. Normalmente, duas abordagens podem ser usadas na construção de sistemas de integração de
dados, onde cada uma segue uma arquitetura de implementação: as abordagens virtual e materializada.
Na abordagem virtual, implementada pela arquitetura de mediadores, as informações são recuperadas
sob demanda diretamente das fontes de dados. Por outro lado, na abordagem materializada
(warehousing), implementada pela arquitetura de data warehouse, as informações relevantes são
recuperadas com antecedência, integradas e armazenadas em um repositório central, comumente
chamado de data warehouse, de forma que uma consulta é avaliada diretamente nesse repositório.
O sistema de integração de dados Integra, em desenvolvimento pelo Centro de Informática da
UFPE, combina recursos de ambas as abordagens, com suporte ao processamento de consultas virtuais
e materializadas. O Integra foi desenvolvido usando a arquitetura de mediadores (abordagem virtual)
com recursos de materialização (abordagem materializada), compondo uma abordagem híbrida de
integração de dados. A abordagem híbrida é proposta como uma forma de otimizar a performance do
sistema de integração, uma vez que a inserção de mecanismos de materialização funciona como um
mecanismo otimizador no processamento de consultas, além de aumentar a disponibilidade do sistema,
principalmente se for feita uma seleção criteriosa dos dados que serão materializados.
O objetivo principal deste trabalho é desenvolver e implementar os processos de materialização de
dados e de manutenção desses dados materializados, no contexto da proposta definida pelo sistema
Integra. A estratégia de materialização é baseada na seleção parcial de dados, mediante análise de
critérios de qualidade e custo, refletindo as características das fontes e das consultas. Para tal, o
processo de materialização ainda conta com o desenvolvimento de métodos para estimar os critérios.
Na arquitetura do sistema Integra, o módulo responsável pela materialização e manutenção dos dados
materializados é o Gerenciador do Data Warehouse. Sendo assim, este trabalho visa, também, o
desenvolvimento (funcionalidades) e implementação desse módulo.
|
Page generated in 0.1208 seconds