Return to search

SimDB: :simulações numéricas em modelo de dados de matrizes multidimensionais / SimDB: numerical simulation in multidimensional array data model

Made available in DSpace on 2015-03-04T18:58:02Z (GMT). No. of bitstreams: 1
tese-RamonGomesCosta.pdf: 7300075 bytes, checksum: 798b5b705351c27584fa52cd559b8588 (MD5)
Previous issue date: 2014-07-21 / SimDB: Numerical Simulation in Multidimensional Array Data Model

Computational Modelling is a science wherein scientists conceive mathematical models that strive to reproduce the behavior of a studied phenomenon. By means of simulations, predicting variables are computed, usually, through a multidimensional space-time frame. State of the art simulations use a class of software named Solvers to solve equations and compute the values of predicting variables. Moreover, to guide the computation in the physical domain space, polygonal meshes pinpoint the spots where values get computed and the time dimension brings the system dynamics by indicating successive values for the same mesh spot. Finally, in order to test the model with different parameter sets, the scientist may run thousands of simulations. Despite the huge amount of data produced by such simulations, the process is basically not supported by an efficient data management solution. Typical implementation stores parameters and simulated data in standard files organized with a sort of directory structure with no support for high level query language and distribution query processing.

In this context, this paper investigates the adoption of the Multidimensional Array Data Model over the SciDB DBMS to manage multidimensional numerical simulation data. We model the 3D spatio-temporal dimensions and the simulation as indexes in the Multidimensional Array Data Model and the predicted variables as values in cells. We present a new strategy to map unstructured 3D spatial meshes into arrays. An orchestrated set of spatial transformations map the original spatial model into a dense multidimensional array, radically reducing the number of sparse chunks produced by a naive mapping. Our strategy is particularly interesting for large queries that would retrieve a huge number of sparsely loaded data chunks. We have run a series of experiments over a real case scenario for the simulation of the cardio-vascular system, developed at LNCC. We show that in some queries we present an improvement in query elapsed-time of approximately 25 times, compared to the standard SciDB implementation. / Modelagem Computacional e uma area na qual cientistas concebem modelos matematicos para reproduzir o comportamento de um fenomeno estudado. Por meio de simulacoes computacionais, variaveis dependentes do modelo sao calculadas, ao longo de uma amostra multidimensional espaco-temporal. O estado da arte em simulacoes numericas adota um tipo de softwares, chamado Resolvedor numerico (Solver), de forma a resolver equacoes matematicas e calcular os valores das variaveis dependentes. Para orientar o calculo no espaco do dominio fsico, malhas poligonais identicam os pontos onde os valores devem ser computados, enquanto que a dimensao temporal introduz a dinamica do sistema, indicando valores sucessivos para o mesmo ponto da malha. Finalmente, a m de testar o modelo com diferentes conjuntos de parametros, cientistas podem executar uma serie de simulacoes. Apesar da enorme quantidade de dados produzidos por tais simulacoes, o processo nao tem apoio de solucoes ecientes para o gerenciamento dos dados. Uma implementacao tipica armazena parametros e dados simulados em arquivos de texto simples, organizados em uma estrutura de diretorios, sem o interesse de permitir o uso de linguagem de consulta de alto nivel e o processamento distribuido de consultas. Neste contexto, esta tese investiga a adocao do Modelo de dados de Matrizes Multidimensionais e sua implementacao atraves do Sistema Gerenciador de Bancos de Dados SciDB, para gerenciar os dados de simulacao numerica. Modelamos as dimensoes espaco-temporais e a simulacao como indices da matriz em um Modelo de Dados de Matrizes Multidimensionais e suas variaveis dependentes como atributos de celulas. Apresentamos uma nova estrategia para mapear a representacao de pontos em malhas nao ortogonais para estruturas em array. Um conjunto orquestrado de transformacoes espaciais fazem o mapeamento do modelo espacial original em um array multidimensional denso, reduzindo radicalmente o numero de particoes (chunks) esparsas produzidas por um mapeamento simples. Nossa estrategia e particularmente interessante para consultas realizadas sobre um fragmento grande do array. Realizamos uma serie de experimentos sobre um cenario real, provido por simulacoes do sistema cardiovascular humano, desenvolvido no LNCC. Mostramos que em algumas consultas, obtem-se um desempenho 25 vezes melhor no tempo de resposta realizado sobre consultas de usuario, em comparaçao com a implementacao padrao usando o SciDB.

Identiferoai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/183
Date21 July 2014
CreatorsCosta, Ramon Gomes
ContributorsPorto, Fábio André M., Schulze, Bruno Richard, Blanco, Pablo Javier, Casanova, Marco Antonio, Macêdo, José Antonio Fernandes de
PublisherLaboratório Nacional de Computação Cientifica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, BR, Serviço de Análise e Apoio a Formação de Recursos Humanos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds