1 |
Metodologia de paralelização híbrida do DEM com controle de balanço de carga baseado em curva de HilbertCINTRA, Diogo Tenório 29 January 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-28T12:46:53Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese_diogotc_final.pdf: 7303783 bytes, checksum: f9959e8bb63b91d247de9903c2484d35 (MD5) / Made available in DSpace on 2016-07-28T12:46:53Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese_diogotc_final.pdf: 7303783 bytes, checksum: f9959e8bb63b91d247de9903c2484d35 (MD5)
Previous issue date: 2016-01-29 / Esta tese apresenta uma metodologia de paralelização híbrida aplicada ao Método dos
Elementos Discretos (DEM - Discrete Element Method) que combina MPI e OpenMP com
o intuito de melhoria de desempenho computacional. A metodologia utiliza estratégias de
decomposição de domínio visando a distribuição do cálculo de modelos de larga escala em
um cluster. A técnica proposta também particiona a carga de trabalho de cada subdomínio
entre threads. Este procedimento adicional visa obter maiores desempenhos computacionais
através do ajuste de utilização de mecanismos de troca de mensagens entre processos e
paralelização por threads. O objetivo principal da técnica é reduzir os elevados tempos de
comunicação entre processos em ambientes computacionais de memória compartilhada tais
como os processadores modernos. A divisão de trabalho por threads emprega a curva de
preenchimento de espaço de Hilbert (HSFC) visando a melhoria de localidade dos dados e
evitando custos computacionais (overheads) resultantes de ordenações constantes para o
vetor de partículas. As simulações numéricas apresentadas permitem avaliar os métodos de
decomposição de domínio, técnicas de particionamento, mecanismos de controle de acesso
à memória, dentre outros. Algoritmos distintos de particionamento e diferentes estratégias
de solução paralela são abordados para ambientes computacionais de memória distribuída,
compartilhada ou para um modelo híbrido que envolve os dois ambientes. A metodologia
desenvolvida e a ferramenta computacional utilizada nas implementações realizadas, o
software DEMOOP, fornecem recursos que podem ser aplicados em diversos problemas de
engenharia envolvendo modelos de partículas em larga escala. Nesta tese alguns destes
problemas são abordados, em especial aqueles relacionados com fluxo de partículas em
rampas, em funis de descarga e em cenários reais de deslizamento de terra. Os resultados
mostram que as estratégias de execução híbridas atingem, em geral, melhores desempenhos
computacionais que aqueles que se baseiam unicamente em troca de mensagens. A técnica
de paralelização híbrida desenvolvida também obtém um bom controle de balanço de carga
entre threads. Os estudos de caso apresentados apresentam boa escalabilidade e eficiências
paralelas. O método proposto permite uma execução configurável de modelos numéricos
do DEM e introduz uma estratégia combinada que melhora localidade dos dados e um
balanceamento de carga iterativo. / This thesis introduces a methodology of hybrid parallelization applied to the Discrete
Element Method (DEM) that combines MPI and OpenMP to improve computational
performance. The methodology uses domain decomposition strategies to distribute the
computation of large-scale models in a cluster. It also partitions the workload of each
subdomain among threads. This additional procedure aims to reach higher computational
performance by adjusting the usage of message passing artifacts and threads. The main
objective is to reduce the expensive communications between processes in computer
resources of shared memory such as modern processors. The work division by threads
employs Hilbert Space Filling Curves (HSFC) in order to improve data-locality and to avoid
the overhead caused by the dynamical sorting of the particles array. Presented numerical
simulations allow to evaluate several domain decomposition schemes, partitioning methods,
mechanisms of memory access control, among others. The work investigate distinct schemes
of parallel solution for both distributed and shared memory environments. The method and
the computational tool employed, the software DEMOOP, provide applied resources for
several engineering problems involving large scale particle models. Some of these problems
are presented on this thesis, such as the particle flows that happen on inclined ramps,
discharge hoppers and real scenarios of landslides. The results shows that the hybrid
executions reach better computational performance than those based on message passing
only, including a good control of load balancing among threads. Case studies present good
scalability and parallel efficiencies. The proposed approach allows a configurable execution
of numerical models and introduces a combined scheme that improves data-locality and
an iterative workload balancing.
|
Page generated in 0.0201 seconds