• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 83
  • 1
  • Tagged with
  • 84
  • 84
  • 65
  • 60
  • 20
  • 19
  • 17
  • 15
  • 14
  • 14
  • 14
  • 13
  • 13
  • 13
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Um programa de elementos finitos em GPU e orientado a objetos para análise dinâmica não linear de estruturas. / An object-oriented finite element program in GPU for nonlinear dynamic structural analysis.

Renato Toshio Yamassaki 28 March 2014 (has links)
É notório que o emprego de unidades de processamento gráfico (GPU) pode acelerar significativamente métodos numéricos de aplicações científicas. Para suportar essa nova tecnologia, é necessário que programas sejam readaptados, exigindo flexibilidade do código. Nesse trabalho, é apresentada a arquitetura de um programa de elementos finitos (MEF) para a análise de estruturas, com suporte ao processamento em GPU. A orientação a objetos é usada para guiar o desenvolvimento e modelar o código em uma estrutura flexível. A escalabilidade do programa é dada pela extensão de suas funcionalidades através de componentes carregados em tempo de execução. Para ilustrar a robustez do código, o software é aplicado para o estudo de dinâmica estrutural, considerando aspectos complexos de não linearidade de material (plasticidade) e geometria (grandes deslocamentos). A acurácia do código é verificada através da comparação com problemas conhecidos da literatura e com as soluções MEF comerciais (ABAQUS). As comparações mostraram uma boa concordância nos resultados. O speedup da GPU é analisado em relação aos tempos de CPU do próprio programa, sendo observado ganhos de desempenho de até 10 vezes. / It has been recognized that the adoption of graphics processing units (GPU) can significantly boost numerical methods in scientific applications. In order to support such technology, it is necessary to readapt the program, which requires code flexibility. In this work, it is presented the architecture of a finite element (FEM) analysis program for structural analysis with GPU support. Object-oriented design is used to guide development and to build code into a flexible structure. Program scalability is achieved by extensibility of its features, provided by run-time loaded components. In order to demonstrate code robustness, the software is directed to the study of structural dynamics, considering complex non-linear aspects of material (plasticity) and geometry (large displacements). Code accuracy is checked by comparing with known literature problems and with commercial solver packages (ABAQUS). The comparison shows good agreement in the results. The GPU code speedup is analysed against timings of CPU program code, where it is observed performance gain up to 10 times.
72

Comparação de métodos de otimização para o problema de ajuste de histórico em ambientes paralelos

Xavier, Carolina Ribeiro 18 August 2009 (has links)
Submitted by isabela.moljf@hotmail.com (isabela.moljf@hotmail.com) on 2017-05-05T11:50:07Z No. of bitstreams: 1 carolinaribeiroxavier.pdf: 2823825 bytes, checksum: af5d50f5cdbb099ed71457b9baaabdc9 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-17T13:34:27Z (GMT) No. of bitstreams: 1 carolinaribeiroxavier.pdf: 2823825 bytes, checksum: af5d50f5cdbb099ed71457b9baaabdc9 (MD5) / Made available in DSpace on 2017-05-17T13:34:27Z (GMT). No. of bitstreams: 1 carolinaribeiroxavier.pdf: 2823825 bytes, checksum: af5d50f5cdbb099ed71457b9baaabdc9 (MD5) Previous issue date: 2009-08-18 / O processo de ajuste histórico tem como objetivo a determinação dos parâmetros de modelos de reservatório de petróleo. Uma vez ajustados, os modelos podem ser utilizados para a previsão do comportamento do reservatório. Este trabalho apresenta uma comparação de diferentes métodos de otimização para a solução deste problema. Métodos baseados em derivadas são comparados com um algoritmo genético. Em particular, compara-se os métodos: Levenberg-Marquardt, Quasi-Newton, Gradiente Conjugado n~ao linear, máxima descida e algoritmo genético. Devido à grande demanda computacional deste problema a computação paralela foi amplamente utilizada. As comparações entre os algoritmos de otimização foram realizadas em um ambiente de computação paralela heterogêneo e os resultados preliminares são apresentados e discutidos. / The process of history matching aims on the determination of the models' parameters from a petroleum reservoir. Once adjusted, the models can be used for the prediction of the reservoir behavior. This work presents a comparsion of different optimization methods for this problem's solution. Derivative based methods are compared to a genetic algorithm. In particular, the following methods are compared: Levenberg-Marquadt, Quasi-Newton, Non Linear Conjugate Gradient, steepest descent and genetic algorithm. Due to the great computational demand of this problem, the parallel computing has been widely used. The comparsions among the optimization algorithms were performed in an heterogeneous parallel computing environment and the preliminar results are presented and discussed.
73

Agrupando dados e kernels de um simulador cardíaco em um ambiente multi-GPU

Cordeiro, Raphael Pereira 10 March 2017 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-07-04T17:30:00Z No. of bitstreams: 1 raphaelpereiracordeiro.pdf: 17027543 bytes, checksum: 91ef68c2021ff4c93dc8b4fe66217cf2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-08-08T13:42:41Z (GMT) No. of bitstreams: 1 raphaelpereiracordeiro.pdf: 17027543 bytes, checksum: 91ef68c2021ff4c93dc8b4fe66217cf2 (MD5) / Made available in DSpace on 2017-08-08T13:42:41Z (GMT). No. of bitstreams: 1 raphaelpereiracordeiro.pdf: 17027543 bytes, checksum: 91ef68c2021ff4c93dc8b4fe66217cf2 (MD5) Previous issue date: 2017-03-10 / A modelagem computacional é uma ferramenta útil no estudo de diversos fenômenos complexos, como o comportamento eletro-mecânico do coração em condições normais e patológicas, sendo importante para o desenvolvimento de novos medicamentos e métodos de combate às doenças cardíacas. A alta complexidade de processos biofísicos se traduz em complexos modelos matemáticos e computacionais, o que faz com que simulações cardíacas necessitem de um grande poder computacional para serem executadas. Logo, o estado da arte em simuladores cardíacos é implementado para ser executado em arquiteturas paralelas. Este trabalho apresenta a implementação e avaliação de um método com dados e kernel agregados, método este utilizado para reduzir o tempo de computação de códigos que executam em ambientes computacionais compostos de múltiplas unidades de processamento gráfico (Graphics Processing Unit ou simplesmente GPUs). Este método foi testado na computação de uma importante parte da simulação da eletrofisiologia do coração, a resolução das equações diferenciais ordinárias (EDOs), resultando em uma redução pela metade do tempo necessário para a sua resolução, quando comparado com o esquema onde este método não foi implementado. Com o uso da técnica proposta neste trabalho, o tempo total de execução das simulações cardíacas foi reduzido em até 25%. / Computational modeling is a useful tool to study many distinct and complex phenomena, such as to describe the electrical and mechanical behavior of the heart, under normal and pathological conditions. The high complexity of the associated biophysical processes translates into complex mathematical and computational models. This, in turn, translates to cardiac simulators that demand a lot of computational power to be executed. Therefore, most of the state-of-the-art cardiac simulators are implemented to run in parallel architectures. In this work a new coalesced data and kernel scheme is evaluated. Its objective is to reduce the execution costs of cardiac simulations that run on multi-GPU environments. The new scheme was tested for an important part of the simulator, the solution of the systems of Ordinary Differential Equations (ODEs). The results have shown that the proposed scheme is very effective. The execution time to solve the systems of ODEs on the multi-GPU environment was reduced by half, when compared to a scheme that does not implemented the proposed data and kernel coalescing. As a result, the total execution time of cardiac simulations was 25% faster.
74

"Processamento distribuído de áudio em tempo real" / "Distributed Real-Time Audio Processing"

Nelson Posse Lago 04 June 2004 (has links)
Sistemas computadorizados para o processamento de multimídia em tempo real demandam alta capacidade de processamento. Problemas que exigem grandes capacidades de processamento são comumente abordados através do uso de sistemas paralelos ou distribuídos; no entanto, a conjunção das dificuldades inerentes tanto aos sistemas de tempo real quanto aos sistemas paralelos e distribuídos tem levado o desenvolvimento com vistas ao processamento de multimídia em tempo real por sistemas computacionais de uso geral a ser baseado em equipamentos centralizados e monoprocessados. Em diversos sistemas para multimídia há a necessidade de baixa latência durante a interação com o usuário, o que reforça ainda mais essa tendência para o processamento em um único nó. Neste trabalho, implementamos um mecanismo para o processamento síncrono e distribuído de áudio com características de baixa latência em uma rede local, permitindo o uso de um sistema distribuído de baixo custo para esse processamento. O objetivo primário é viabilizar o uso de sistemas computacionais distribuídos para a gravação e edição de material musical em estúdios domésticos ou de pequeno porte, contornando a necessidade de hardware dedicado de alto custo. O sistema implementado consiste em duas partes: uma, genérica, implementada sob a forma de um middleware para o processamento síncrono e distribuído de mídias contínuas com baixa latência; outra, específica, baseada na primeira, voltada para o processamento de áudio e compatível com aplicações legadas através da interface padronizada LADSPA. É de se esperar que pesquisas e aplicações futuras em que necessidades semelhantes se apresentem possam utilizar o middleware aqui descrito para outros tipos de processamento de áudio bem como para o processamento de outras mídias, como vídeo. / Computer systems for real-time multimedia processing require high processing power. Problems that depend on high processing power are usually solved by using parallel or distributed computing techniques; however, the combination of the difficulties of both real-time and parallel programming has led the development of applications for real-time multimedia processing for general purpose computer systems to be based on centralized and single-processor systems. In several systems for multimedia processing, there is a need for low latency during the interaction with the user, which reinforces the tendency towards single-processor development. In this work, we implemented a mechanism for synchronous and distributed audio processing with low latency on a local area network which makes the use of a low cost distributed system for this kind of processing possible. The main goal is to allow the use of distributed systems for recording and editing of musical material in home and small studios, bypassing the need for high-cost equipment. The system we implemented is made of two parts: the first, generic, implemented as a middleware for synchronous and distributed processing of continuous media with low latency; and the second, based on the first, geared towards audio processing and compatible with legacy applications based on the standard LADSPA interface. We expect that future research and applications that share the needs of the system developed here make use of the middleware we developed, both for other kinds of audio processing as well as for the processing of other media forms, such as video.
75

Sistemas Distribuídos para Otimização por Simulação Numérica Aplicada a Modelagem de Aquíferos / Distributed Systems for Numerical Simulation Optimization Applied to Aquifer Modeling

Costa, Patrícia de Araújo Pereira 09 July 2009 (has links)
Made available in DSpace on 2015-03-04T18:51:14Z (GMT). No. of bitstreams: 1 thesis.pdf: 2079516 bytes, checksum: 3232c130f07c34bec216c5c6008d6256 (MD5) Previous issue date: 2009-07-09 / Conselho Nacional de Desenvolvimento Cientifico e Tecnologico / In this dissertation, a hypothetical aquifer that has been contaminated by the dumping of toxic substances is modeled. The remediation strategy considered is based on withdrawal, which requires the removal of contaminated groundwater from the aquifer by pumping. The design of such a system involves the choice of the number of extracting wells to be installed, their locations and pumping rates,with the goal of maximizing the amount of contaminant extracted, while minimizing the cost of the system. To find the optimal solution, a numerical simulation optimization parallel system is used, which is composed by three subsystems: (a) numerical simulator - numerically solves the mathematical model ofthe contaminated aquifer; (b) optimizer - implements the genetic algorithm method to search for optimal locations and pumping rates for the extracting wells; (c)distributed computing system - manages the distribuition and parallel execution of the numerical simulations. Experiments were done in many different computational environments: homogeneous, heterogeneous, in large scale, using non dedicated computers, connected via local network, and computational grids, and their results demonstrate the methodology s applicability. / Neste trabalho, modela-se a ocorrência de contaminação de um aquífero hipotético por derramamento de substância tóxica e analisa-se a solução de descontaminação baseada na retirada do contaminante através de bombeamento feito por poços de extração. O projeto do sistema de remediação envolve a escolha do número de poços a serem instalados, suas localizações e vazões de modo a maximizar a quantidade de poluente extraída e ao mesmo tempo minimizar o custo total do sistema. A busca da solução ótima é feita de forma automática, através de um sistema paralelo de otimização por simulação numérica, composto por três subsistemas: (a) simulador numérico - resolve numericamente o modelo matemático do aquífero contaminado; (b) otimizador automático - implementa o método dos algoritmos genéticos para busca das localizações e vazões ótimas dos poços de extração; (c)sistema computacional distribuído - gerencia a distribuição e a execução paralela das simulações numéricas. Foram feitos experimentos em vários ambientes computacionais: homogêneo, heterogêneo, em grande escala, usando máquinas não dedicadas, interligadas por rede local e ambiente de grade, e seus resultados demonstram a aplicabilidade da metodologia.
76

Simulação numérica direta de escoamento transicional sobre uma superfície contendo rugosidade / Direct numerical simulation of transitional flow over a surface containing roughness

Petri, Larissa Alves 09 March 2015 (has links)
Em diversos escoamentos sobre superfícies há a presença de protuberâncias, como por exemplo rebites, parafusos e juntas. Estas protuberâncias podem influenciar a camada limite, acelerando a transição do escoamento do estado laminar para o estado turbulento. Em alguns casos isto pode ser indesejável, já que o escoamento turbulento implica necessariamente em uma força de atrito maior do que aquela referente ao escoamento laminar. Existem alguns aspectos neste tipo de escoamento que ainda não estão bem compreendidos. O objetivo deste trabalho é estudar a influência de uma rugosidade isolada no escoamento sobre uma superfície. Este estudo contribui para se entender o que ocorre em casos de maior complexidade. O estudo é de natureza computacional, em que se utiliza simulação numérica direta das equações de Navier-Stokes. A técnica de fronteiras imersas é utilizada para representar a rugosidade no escoamento sobre a superfície. O código numérico é verificado por meio do método de soluções manufaturadas. Comparações entre resultados experimentais, da teoria de estabilidade linear e numéricos também são utilizados para a validação do código. Resultados obtidos com diferentes alturas de rugosidade e variações no gradiente de pressão permitiram analisar a influência de elemento rugoso tridimensional em escoamentos de camada limite. / The presence of protuberances on surfaces, for example, rivets, screws and gaskets, can influence the boundary layer by accelerating the transition from laminar flow to turbulent flow. In some cases this may be undesirable, since the turbulent flow involves frictional forces greater than the ones at the laminar regime. There are some aspects of the flow in the boundary layer perturbed by a single roughness element that are not well understood. The aim of this work is to study the influence of an isolated roughness on the boundary layer. This study is a step towards to the understanding of what can happen in more complex cases. The nature of this study is computational, therefore a Direct Numerical Simulation code is used. The immersed boundary method is used to represent the roughness in the flow on the surface. The numerical code is verified via theMethod ofManufactured Solutions. Comparisons between experimental data, Linear Stability Theory and numerical results are also used for the validation of the code. Results obtained with different roughness heights and variations in the pressure gradient allowed the analysis of the influence of a three-dimensional roughness element in boundary layer flows.
77

Desenvolvimento e implementação de malhas adaptativas bloco-estruturadas para computação paralela em mecânica dos fluidos / Desenvolvimento e implementação de malhas adaptativas bloco-estruturadas para computação paralela em mecânica dos fluidos / Development and implementation of block-structured adaptive mesh refinement for parallel computations in fluid mechanics / Development and implementation of block-structured adaptive mesh refinement for parallel computations in fluid mechanics

Lima, Rafael Sene de 28 September 2012 (has links)
The numerical simulation of fluid flow involving complex geometries is greatly limited by the required spatial grid resolution. These flows often contain small regions with complex motions, while the remaining flow is relatively smooth. Adaptive mesh refinement (AMR) enables the spatial grid to be refined in local regions that require finer grids to resolve the flow. This work describes an approach to parallelization of a structured adaptive mesh refinement (SAMR) algorithm. This type of methodology is based on locally refined grids superimposed on coarser grids to achieve the desired resolution in numerical simulations. Parallel implementations of SAMR methods offer the potential for accurate simulations of high complexity fluid flows. However, they present interesting challenges in dynamic resource allocation, data-distribution and load-balancing. The overall efficiency of parallel SAMR applications is limited by the ability to partition the underlying grid hierarchies at run-time to expose all inherent parallelism, minimize communication and synchronization overheads, and balance load. The methodology is based on a message passing interface model (MPI) using the recursive coordinate bisection (RCB) for domain partition. For this work, a semi-implicit projection method has been implemented to solve the incompressible Navier Stokes equations. All numerical implementations are an extension of a sequential Fortran 90 code, called "AMR3D", developed in the work of Nós (2007) .The efficiency and robustness of the applied methodology are verified via convergence analysis using the method of manufactured solutions. Validations were performed by simulating an incompressible jet flow and a lid driven cavity flow. / A simulação numérica de escoamentos envolvendo geometrias complexas é fortemente limitada pela resolução da malha espacial. Na grande maioria dos escoamentos, há pequenas regiões do domínio onde o fluido se movimenta de forma complexa gerando gradientes elevados, enquanto que no restante do domínio o escoamento é relativamente calmo". O Refinamento Adaptativo de Malhas (Adaptive Mesh Refinement - AMR), possibilita que o refinamento da malha espacial seja mais apurado em regiões especificas, enquanto que nas demais regiões o refinamento pode ser mais grosseiro. O presente trabalho consiste no desenvolvimento de uma metodologia de paralelização para a solução das equações de Navier-Stokes em malhas adaptativas bloco-estruturadas (Structured Adaptive Mesh Refinement - SAMR) utilizando a interface MPI (Message Passing Interface) e o método de bisseção por coordenadas RCB (Recursive Coordinate Bisection) para o balanço de carga. Implementações de métodos SAMR em processamento paralelo oferecem a possibilidade de simulações precisas de escoamentos de elevada complexidade. No entanto, apresentam desafios interessantes quanto à dinamicidade na alocação e distribuição dos dados e no balanceamento de carga. Cabe ressaltar que a é ciência total das aplicações envolvendo métodos SAMR em processamento paralelo é fortemente dependente da qualidade do particionamento dinâmico de domínio, efetuado em tempo de execução, para que se garanta os menores custos de comunicação e sincronização possíveis, além de uma boa distribuição da carga computacional. Neste trabalho, utilizou-se o esquema semi-implícito proposto por Ceniceros et al. (2010) para avanço temporal. Todas as implementações foram efetuadas como uma extensão do código AMR3D", proposto por Nós (2007). A é ciência e a robustez do método proposto são verificadas por meio do método das soluções manufaturadas. As validações foram feitas por meio da simulação do escoamento em uma cavidade com tampa deslizante e de um jato incompressível. / Doutor em Engenharia Mecânica
78

Simulação numérica direta de escoamento transicional sobre uma superfície contendo rugosidade / Direct numerical simulation of transitional flow over a surface containing roughness

Larissa Alves Petri 09 March 2015 (has links)
Em diversos escoamentos sobre superfícies há a presença de protuberâncias, como por exemplo rebites, parafusos e juntas. Estas protuberâncias podem influenciar a camada limite, acelerando a transição do escoamento do estado laminar para o estado turbulento. Em alguns casos isto pode ser indesejável, já que o escoamento turbulento implica necessariamente em uma força de atrito maior do que aquela referente ao escoamento laminar. Existem alguns aspectos neste tipo de escoamento que ainda não estão bem compreendidos. O objetivo deste trabalho é estudar a influência de uma rugosidade isolada no escoamento sobre uma superfície. Este estudo contribui para se entender o que ocorre em casos de maior complexidade. O estudo é de natureza computacional, em que se utiliza simulação numérica direta das equações de Navier-Stokes. A técnica de fronteiras imersas é utilizada para representar a rugosidade no escoamento sobre a superfície. O código numérico é verificado por meio do método de soluções manufaturadas. Comparações entre resultados experimentais, da teoria de estabilidade linear e numéricos também são utilizados para a validação do código. Resultados obtidos com diferentes alturas de rugosidade e variações no gradiente de pressão permitiram analisar a influência de elemento rugoso tridimensional em escoamentos de camada limite. / The presence of protuberances on surfaces, for example, rivets, screws and gaskets, can influence the boundary layer by accelerating the transition from laminar flow to turbulent flow. In some cases this may be undesirable, since the turbulent flow involves frictional forces greater than the ones at the laminar regime. There are some aspects of the flow in the boundary layer perturbed by a single roughness element that are not well understood. The aim of this work is to study the influence of an isolated roughness on the boundary layer. This study is a step towards to the understanding of what can happen in more complex cases. The nature of this study is computational, therefore a Direct Numerical Simulation code is used. The immersed boundary method is used to represent the roughness in the flow on the surface. The numerical code is verified via theMethod ofManufactured Solutions. Comparisons between experimental data, Linear Stability Theory and numerical results are also used for the validation of the code. Results obtained with different roughness heights and variations in the pressure gradient allowed the analysis of the influence of a three-dimensional roughness element in boundary layer flows.
79

Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU / Automatic raking function discovery method using parallel genetic programming on GPU

Coimbra, Andre Rodrigues 28 March 2014 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2015-05-15T13:33:06Z No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-05-15T13:37:45Z (GMT) No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-05-15T13:37:45Z (GMT). No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-03-28 / Ranking functions have a vital role in the performance of information retrieval systems ensuring that documents more related to the user’s search need – represented as a query – are shown in the top results, preventing the user from having to examine a range of documents that are not really relevant. Therefore, this work uses Genetic Programming (GP), an Evolutionary Computation technique, to find ranking functions automaticaly and systematicaly. Moreover, in this project the technique of GP was developed following a strategy that exploits parallelism through graphics processing units. Other known methods in the context of information retrieval as classification committees and the Lazy strategy were combined with the proposed approach – called Finch. These combinations were only feasible due to the GP nature and the use of parallelism. The experimental results with the Finch, regarding the ranking functions quality, surpassed the results of several strategies known in the literature. Considering the time performance, significant gains were also achieved. The solution developed exploiting the parallelism spends around twenty times less time than the solution using only the central processing unit. / Funções de ordenação têm um papel vital no desempenho de sistemas de recuperação de informação garantindo que os documentos mais relacionados com o desejo do usuário – representado através de uma consulta – sejam trazidos no topo dos resultados, evitando que o usuário tenha que analisar uma série de documentos que não sejam realmente relevantes. Assim, utiliza-se a Programação Genética (PG), uma técnica da Computação Evolucionária, para descobrir de forma automática e sistemática funções de ordenação. Além disso, neste trabalho a técnica de PG foi desenvolvida seguindo uma estratégia que explora o paralelismo através de unidades gráficas de processamento. Foram agregados ainda na abordagem proposta – denominada Finch – outros métodos conhecidos no contexto de recuperação de informação como os comitês de classificação e a estratégia Lazy. Sendo que essa complementação só foi viável devido a natureza da PG e em virtude da utilização do paralelismo. Os resultados experimentais encontrados com a Finch, em relação à qualidade das funções de ordenação descobertas, superaram os resultados de diversas estratégias conhecidas na literatura. Considerando o desempenho da abordagem em função do tempo, também foram alcançados ganhos significativos. A solução desenvolvida explorando o paralelismo gasta, em média, vinte vezes menos tempo que a solução utilizando somente a unidade central de processamento.
80

Emprego de GPGPUs para acelerar simulações do sistema humano inato

Rocha, Pedro Augusto Ferreira 27 August 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-02T17:47:54Z No. of bitstreams: 1 pedroaugustoferreirarocha.pdf: 4715587 bytes, checksum: dfef00badf9cc3d7c79c1b4c62d3abfd (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T19:58:07Z (GMT) No. of bitstreams: 1 pedroaugustoferreirarocha.pdf: 4715587 bytes, checksum: dfef00badf9cc3d7c79c1b4c62d3abfd (MD5) / Made available in DSpace on 2017-03-06T19:58:07Z (GMT). No. of bitstreams: 1 pedroaugustoferreirarocha.pdf: 4715587 bytes, checksum: dfef00badf9cc3d7c79c1b4c62d3abfd (MD5) Previous issue date: 2012-08-27 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Dois mecanismos são utilizados pelo Sistema Imunológico Humano (SIH) para defender o organismo contra doenças causadas pelos mais distintos agentes patogênicos: o sistema inato e o sistema adaptativo. O primeiro é composto por células e substâncias químicas que utilizam um mecanismo genérico de defesa para prevenir ou limitar infecções ocasionadas pela maioria dos patógenos. Já o segundo mecanismo é ativado pelo primeiro, baseando-se na habilidade de reconhecer e de recordar agentes patogênicos específicos, colaborando para a montagem de um ataque mais potente a cada vez que o mesmo patógeno é encontrado. Apesar de ser muito estudado, muitas questões sobre o funcionamento do SIH ainda estão em aberto em virtude de sua complexidade e do grande número de interações, nos mais diversos níveis, entre seus distintos componentes. Neste sentido, ferramentas computacionais podem se constituir em um poderoso ferramental para auxiliar nas pesquisas sobre o tema. O presente trabalho está inserido neste escopo, dividindo-se em duas partes. Na primeira parte, o trabalho apresenta os resultados de uma análise de sensibilidade em um modelo matemático-computacional que simula a resposta imunológica inata ao lipopolissacarídeo (LPS), com o objetivo de encontrar os parâmetros mais sensíveis deste modelo. Além disto, a segunda parte do trabalho propõe uma adaptação do modelo original para um modelo tridimensional. As simulações realizadas nas duas partes do trabalho mostraram-se computacionalmente caras, demandando longos períodos de tempo para serem concluídas. Assim, GPGPUs (General Purpose Graphics Processing Units) foram utilizadas para reduzir os tempos de execução. O uso de GPGPUs permitiu que acelerações de 276 vezes para a análise de sensibilidade massiva e de 87 vezes para a computação do modelo em três dimensões fossem obtidas. / Two mechanisms are used by the Humman Immune System (HIS) to protect the body against diseases caused by distinct pathogens: the innate and the adaptive immune system. The first one is composed of cells and chemicals that use a generic mechanism of defense to prevent or limit infections caused by most pathogens. The second mechanism is activated by the first one. It has the ability to recognize and remember specific pathogens, contributing to the assembly of a more powerful attack each time the same pathogen is encountered again. Despite being widely studied, many questions about the functioning of the HIS are still open because of its complexity and the large number of interactions of its components on distinct levels. In this sense, computational tools are a powerful instrument to assist researchers on this field of study. This work is inserted in this scope and it is split into two parts. In the first part, this work presents the results of a sensitivity analysis on a mathematical-computational model that simulates the innate immune response to lipopolysaccharide (LPS). The main objective of the sensitivity analysis was to find the most sensitive parameters of the mathematical model. The second part of this work proposes the extension of the original model to a three-dimensional one. The simulations in the two parts of the work proved to be computationally expensive, requiring long periods of time to complete. Thus, GPGPUs (General Purpose Graphics Processing Units) were used to reduce execution times. The use of GPGPUs allowed speedups of 276 times for sensitivity analysis, when compared to the sequential one, and of 87 times for computations using the three dimensions model.

Page generated in 0.061 seconds