Spelling suggestions: "subject:"distributed spatial john"" "subject:"eistributed spatial john""
1 |
DistJoin: plataforma de processamento distribuído de operações de junção espacial com bases de dados dinâmicas / DistJoin: platform for distributed processing of spatial join operations with dynamic datasetsOliveira, Sávio Salvarino Teles de 28 June 2013 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2014-10-09T12:30:33Z
No. of bitstreams: 2
Dissertação - Savio Salvarino Teles de Oliveira - 2013.pdf: 6348358 bytes, checksum: 12e62cd925367772158d94e466de5827 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2014-10-09T14:44:35Z (GMT) No. of bitstreams: 2
Dissertação - Savio Salvarino Teles de Oliveira - 2013.pdf: 6348358 bytes, checksum: 12e62cd925367772158d94e466de5827 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2014-10-09T14:44:35Z (GMT). No. of bitstreams: 2
Dissertação - Savio Salvarino Teles de Oliveira - 2013.pdf: 6348358 bytes, checksum: 12e62cd925367772158d94e466de5827 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2013-06-28 / Fundação de Apoio à Pesquisa - FUNAPE / Geographic Information Systems (GIS) have received increasing attention in research institutes
and industry in recent years. A Spatial Database Managament System (SDBMS)
is one of the main components of a GIS and spatial join is one of the most important
operations in SDBMS. Spatial join involves the relationship between two datasets, combining
the geometries according some spatial predicate, such as intersection. Due to the
increasing availability of spatial data, the growing number of GIS users, and the high
cost of the processing of spatial operations, distributed SGBDEs (SGBDED) have been
proposed as a good option to efficiently process spatial join on a cluster. This distributed
processing brings some challenges, such as the data distribution and parallel and distributed
processing of spatial join. This paper presents a platform for parallel and distributed
processing of spatial joins in a cluster using data distribution techniques for dynamic
datasets. Studies in the literature have explored data distribution techniques for
static datasets, where any update requires data redistribution. This becomes unfeasible
when using large datasets with frequent updates. Therefore, this paper proposes two new
data distribution techniques for dynamic datasets: Proximity Area and Grid Proximity
Area. These techniques have been evaluated to determine which scenarios each technique
is more appropriate for. For this purpose, these techniques are evaluated in a real environment
using datasets with different characteristics. Therefore, it is possible to evaluate the
spatial join operation in real scenarios with each technique. / Os Sistemas de Informação Geográfica (SIG) têm recebido cada vez mais destaque nos
institutos de pesquisa e na indústria nos últimos anos. Um Sistema de Gerência de Bancos
de Dados Espaciais (SGBDE) é um dos principais componentes de um SIG e a junção
espacial uma das operações mais importantes nos SGBDEs. Ela envolve o relacionamento
entre duas bases de dados, combinando as geometrias de acordo com algum predicado
espacial, como intersecção. Devido à crescente disponibilidade de dados espaciais, ao
aumento no número de usuários dos SIGS e ao alto custo de processamento das operações
espaciais, os SGBDE distribuídos (SGBDED) surgem com uma boa opção para processar
a junção espacial de forma eficiente em um cluster de computadores. Esse processamento
distribuído traz consigo alguns desafios, tais como a distribuição dos dados pelo cluster
e o processamento paralelo e distribuído da junção espacial. O objetivo deste trabalho é
apresentar uma plataforma de geoprocessamento paralelo e distribuído da junção espacial
em um cluster de computadores, utilizando técnicas de distribuição de dados para bases
de dados dinâmicas. Os trabalhos encontrados na literatura têm explorado técnicas de
distribuição de dados indicadas para bases de dados estáticas, onde qualquer atualização
da base de dados requer que todos os dados sejam novamente distribuídos pelo cluster.
Isto se torna inviável com grandes bases de dados e que sofrem constantes atualizações.
Por isso, este trabalho propõe duas novas técnicas de distribuição de dados com bases de
dados dinâmicas: Proximity Area e Grid Proximity Area. Estas técnicas foram avaliadas
para definir em quais cenários cada uma delas é mais apropriada. Para tal, estas técnicas
foram avaliadas em um ambiente real com bases de dados com características diferentes,
para que fosse possível experimentar a junção espacial distribuída em cenários diversos
com cada técnica de distribuição de dados.
|
Page generated in 0.1095 seconds