1 |
[en] MASSIVELY PARALLEL GENETIC PROGRAMMING ON GPUS / [pt] PROGRAMAÇÃO GENÉTICA MACIÇAMENTE PARALELA EM GPUSCLEOMAR PEREIRA DA SILVA 25 February 2015 (has links)
[pt] A Programação Genética permite que computadores resolvam problemas
automaticamente, sem que eles tenham sido programados para tal. Utilizando
a inspiração no princípio da seleção natural de Darwin, uma população
de programas, ou indivíduos, é mantida, modificada baseada em variação
genética, e avaliada de acordo com uma função de aptidão (fitness). A
programação genética tem sido usada com sucesso por uma série de aplicações
como projeto automático, reconhecimento de padrões, controle robótico,
mineração de dados e análise de imagens. Porém, a avaliação da gigantesca
quantidade de indivíduos gerados requer excessiva quantidade de computação,
levando a um tempo de execução inviável para problemas grandes. Este
trabalho explora o alto poder computacional de unidades de processamento
gráfico, ou GPUs, para acelerar a programação genética e permitir a geração
automática de programas para grandes problemas. Propomos duas novas
metodologias para se explorar a GPU em programação genética: compilação em
linguagem intermediária e a criação de indivíduos em código de máquina. Estas
metodologias apresentam vantagens em relação às metodologias tradicionais
usadas na literatura. A utilização de linguagem intermediária reduz etapas de
compilação e trabalha com instruções que estão bem documentadas. A criação
de indivíduos em código de máquina não possui nenhuma etapa de compilação,
mas requer engenharia reversa das instruções que não estão documentadas
neste nível. Nossas metodologias são baseadas em programação genética
linear e inspiradas em computação quântica. O uso de computação quântica
permite uma convergência rápida, capacidade de busca global e inclusão da
história passada dos indivíduos. As metodologias propostas foram comparadas
com as metodologias existentes e apresentaram ganhos consideráveis de
desempenho. Foi observado um desempenho máximo de até 2,74 trilhões de
GPops (operações de programação genética por segundo) para o benchmark
Multiplexador de 20 bits e foi possível estender a programação genética para
problemas que apresentam bases de dados de até 7 milhões de amostras. / [en] Genetic Programming enables computers to solve problems
automatically, without being programmed to it. Using the inspiration in
the Darwin s Principle of natural selection, a population of programs or
individuals is maintained, modified based on genetic variation, and evaluated
according to a fitness function. Genetic programming has been successfully
applied to many different applications such as automatic design, pattern
recognition, robotic control, data mining and image analysis. However, the
evaluation of the huge amount of individuals requires excessive computational
demands, leading to extremely long computational times for large size
problems. This work exploits the high computational power of graphics
processing units, or GPUs, to accelerate genetic programming and to enable
the automatic generation of programs for large problems. We propose two
new methodologies to exploit the power of the GPU in genetic programming:
intermediate language compilation and individuals creation in machine
language. These methodologies have advantages over traditional methods
used in the literature. The use of an intermediate language reduces the
compilation steps, and works with instructions that are well-documented.
The individuals creation in machine language has no compilation step, but
requires reverse engineering of the instructions that are not documented at
this level. Our methodologies are based on linear genetic programming and are
inspired by quantum computing. The use of quantum computing allows rapid
convergence, global search capability and inclusion of individuals past history.
The proposed methodologies were compared against existing methodologies
and they showed considerable performance gains. It was observed a maximum
performance of 2,74 trillion GPops (genetic programming operations per
second) for the 20-bit Multiplexer benchmark, and it was possible to extend
genetic programming for problems that have databases with up to 7 million
samples.
|
2 |
[pt] MAPEAMENTO DE SIMULAÇÃO DE FRATURA E FRAGMENTAÇÃO COESIVA PARA GPUS / [en] MAPPING COHESIVE FRACTURE AND FRAGMENTATION SIMULATIONS TO GPUSANDREI ALHADEFF MONTEIRO 11 February 2016 (has links)
[pt] Apresentamos um método computacional na GPU que lida com eventos
de fragmentação dinâmica, simulados por meio de zona coesiva. Implementamos
uma estrutura de dados topológica simples e especializada para
malhas com triângulos ou tetraedros, projetada para rodar eficientemente e
minimizar ocupação de memória na GPU. Apresentamos um código dinâmico
paralelo, adaptativo e distribuído que implementa a formulação de modelo
zona coesiva extrínsica (CZM), onde elementos são inseridos adaptativamente,
onde e quando necessários. O principal objetivo na implementação
deste framework computacional reside na habilidade de adaptar a malha
de forma dinâmica e consistente, inserindo elementos coesivos nas facetas
fraturadas e inserindo e removendo elementos e nós no caso da malha adaptativa.
Apresentamos estratégias para refinar e simplificar a malha para
lidar com simulações dinâmicas de malhas adaptativas na GPU. Utilizamos
uma versão de escala reduzida do nosso modelo para demonstrar o impacto
da variação de operações de ponto flutuante no padrão final de fratura.
Uma nova estratégia de duplicar nós conhecidos como ghosts também é
apresentado quando distribuindo a simulação em diversas partições de um
cluster. Deste modo, resultados das simulações paralelas apresentam um
ganho de desempenho ao adotar estratégias como distribuir trabalhos entre
threads para o mesmo elemento e lançar vários threads por elemento. Para
evitar concorrência ao acessar entidades compartilhadas, aplicamos a coloração
de grafo para malhas não-adaptativas e percorrimento nodal no caso
adaptativo. Experimentos demonstram que a eficiência da GPU aumenta
com o número de nós e elementos da malha. / [en] A GPU-based computational framework is presented to deal with
dynamic failure events simulated by means of cohesive zone elements. We
employ a novel and simplified topological data structure relative to CPU
implementation and specialized for meshes with triangles or tetrahedra,
designed to run efficiently and minimize memory requirements on the GPU.
We present a parallel, adaptive and distributed explicit dynamics code that
implements an extrinsic cohesive zone formulation where the elements are
inserted on-the-fly, when needed and where needed. The main challenge
for implementing a GPU-based computational framework using an extrinsic
cohesive zone formulation resides on being able to dynamically adapt the
mesh, in a consistent way, by inserting cohesive elements on fractured
facets and inserting or removing bulk elements and nodes in the adaptive
mesh modification case. We present a strategy to refine and coarsen the
mesh to handle dynamic mesh modification simulations on the GPU. We
use a reduced scale version of the experimental specimen in the adaptive
fracture simulations to demonstrate the impact of variation in floating point
operations on the final fracture pattern. A novel strategy to duplicate ghost
nodes when distributing the simulation in different compute nodes containing
one GPU each is also presented. Results from parallel simulations show
an increase in performance when adopting strategies such as distributing
different jobs amongst threads for the same element and launching many
threads per element. To avoid concurrency on accessing shared entities, we
employ graph coloring for non-adaptive meshes and node traversal for the
adaptive case. Experiments show that GPU efficiency increases with the
number of nodes and bulk elements.
|
Page generated in 0.0454 seconds