Spelling suggestions: "subject:"processamento dde alto desempenho"" "subject:"processamento dde alto esempenho""
11 |
Resolu??o paralela verificada de sistemas de equa??es lineares : uma abordagem para efici?ncia energ?tica utilizando DVFSLara, Viviane Linck 25 November 2013 (has links)
Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-02-04T18:55:15Z
No. of bitstreams: 1
DIS_VIVIANE_LINCK_LARA_COMPLETO.pdf: 10477924 bytes, checksum: 092f88ba6468650374664bacdbcdb4df (MD5) / Made available in DSpace on 2016-02-04T18:55:15Z (GMT). No. of bitstreams: 1
DIS_VIVIANE_LINCK_LARA_COMPLETO.pdf: 10477924 bytes, checksum: 092f88ba6468650374664bacdbcdb4df (MD5)
Previous issue date: 2013-11-25 / Solving Systems of Linear Equations is important in several domains. In many cases, it
is necessary to employ verified computing to achieve reliable results. With the support of High
Performance Computing (HPC), solve efficiently huge linear systems with Verified Computing has
become possible. Recently, HPC researchers have started to investigate solutions focused not only
in performance but also in energy efficiency as well. In this context, the main goal of this work is to
propose the use of DVFS (Dynamic Voltage and Frequency Scaling) technique to change the CPU
frequency during the execution of a solver that employs Verified Computing. Furthermore, this works
intends to present a case study aiming at verifying if the use of DVFS can provide a reduction on
energy consumption without perfomance and accuracy being compromised. Initially, a study about
the FastPILSS solver was carried out to evaluate its accuracy, performance and energy consumption
over several different input matrices. After that, we observed that the use of DVFS does not affect
accuracy. Analysing the results, no reduction in energy consumption using the powersave governor
was observed if compared to the energy consumption using the performance governor. This occurs
due to the significant increase in execution time. When the frequency was changed in isolated steps
of the solver algorithm, it was possible to reduce up to 3,29% the energy consumption for dense
matrices during the approximate inverse calculation. / A resolu??o de Sistemas de Equa??es Lineares Alg?bricas (SELAs) ? importante em diversos
dom?nios do conhecimento. Em muitos casos, o uso de Computa??o Verificada ? necess?rio para
garantir que os resultados sejam confi?veis. Com o aux?lio da Computa??o de Alto Desempenho, a
resolu??o mais eficiente de SELAs de grande porte com o uso da Computa??o Verificada tornou-se
poss?vel. Atualmente, a ?rea de Alto Desempenho tem buscado solu??es que considerem, al?m do
desempenho, a efici?ncia energ?tica. Nesse sentido, o objetivo do trabalho ? utilizar a t?cnica DVFS
(Dynamic Voltage and Frequency Scaling) para modificar a frequ?ncia do processador na execu??o
de um solver de SELAs de Alto Desempenho com verifica??o do resultado. Al?m disso, realizar
um estudo de caso que permita avaliar se o uso de DVFS reduz o consumo de energia, bem como
avaliar de que maneira o desempenho e a exatid?o podem ser comprometidos. Inicialmente, foi
realizado um estudo de caso sobre o solver FastPILSS, analisando exatid?o, desempenho e consumo
de energia. Depois disso, verificou-se que a utiliza??o de DVFS n?o afetou a exatid?o. Com a
an?lise dos resultados, observou-se que n?o houve redu??o do consumo de energia ao utilizar o
governador em powersave se comparado ao consumo de energia com o governador em performance.
Esse comportamento pode ser atribu?do ao significativo aumento no tempo de execu??o. Ao realizar
a altera??o de frequ?ncia em pontos isolados no algoritmo do solver, observou-se que tendo como
entrada matrizes do tipo densas durante a realiza??o do c?lculo da inversa aproximada, obt?m-se
redu??o de no m?ximo 3,29% no consumo de energia.
|
12 |
Algoritmos de escalonamento para grades computacionais voltados ? efici?ncia energ?ticaTeodoro, Silvana 13 March 2013 (has links)
Made available in DSpace on 2015-04-14T14:50:01Z (GMT). No. of bitstreams: 1
448653.pdf: 3845852 bytes, checksum: 42fed21d426d0772e6f918691f47833c (MD5)
Previous issue date: 2013-03-13 / Recent advances in High Performance Computing have opened a wide range of new research opportunities. Modern parallel and distributed architectures present each time more and more processing units seeking for a higher computational power. At the same time, the gain of performance obtained with those platforms is followed by an increase in energy consumption. In this scenario, researches in energy efficient high performance environments have emerged as a way to find the causes of excessive energy consumption and propose alternative solutions. Nowadays, one of the most representative high performance platforms is the computational grid which is used in many scientific and academic projects all over the world. In this work, we propose the use of energy-aware scheduling algorithms to efficiently manage the energy consumption in computational grids trying to avoid excessive performance losses. Our solution is based on: (i) an efficient management of idle resources; (ii) a clever use of active resources; (iii) the development of a procedure to accurately estimate the energy consumed in a given platform; (iv) the proposal of several new energy-aware scheduling algorithms for computational grids. We evaluate our approach using the SimGrid simulation environment and we compared our algorithms against five traditional scheduling algorithms for computational grids that are not energy-aware and one new algorithm recently proposed in the literature that deals with energy consumption issues. Our results show that in some experimental scenarios using our algorithms it is possible to achieve up to 221,03% of reduction in the energy consumption combined with 34,60% of performance loss. This example confirms our assumption that it is possible to significantly decrease the energy consumption on a grid platform without compromising proportionally the performance. / Os recentes avan?os da Computa??o de Alto Desempenho abrem um largo espectro de possibilidades para as pesquisas na ?rea. Arquiteturas paralelas e distribu?das modernas apresentam cada vez mais capacidade de processamento em busca de um maior poder computacional. Ao mesmo tempo, o ganho de desempenho obtido com as plataformas ? seguido por um aumento do consumo de energia. Neste cen?rio, pesquisas sobre efici?ncia energ?tica em ambientes de alto desempenho t?m surgido como uma forma de encontrar as causas e propor solu??es para o consumo excessivo de energia. Atualmente, uma das mais representativas plataformas de alto desempenho ? a grade computacional, que ? usada em muitos projetos cient?ficos e acad?micos em todo mundo. Neste trabalho, propomos o uso de algoritmos de escalonamento de tarefas energeticamente eficientes para a gest?o do consumo de energia em grades computacionais sem causar perdas significativas de desempenho. A solu??o ? baseada em: (i) gest?o eficiente de recursos ociosos; (ii) uso inteligente de recursos ativos; (iii) desenvolvimento de um mecanismo para estimar com precis?o a energia consumida por uma determinada plataforma; (iv) proposta de novos algoritmos de escalonamento energeticamente eficientes para grades computacionais. A abordagem criada foi avaliada utilizando o ambiente de simula??o SimGrid. Comparamos nossos algoritmos com cinco algoritmos de escalonamento tradicionais para grades computacionais, que n?o consideram quest?es de energia, e um algoritmo recentemente proposto na literatura que lida com quest?es de consumo de energia. Os resultados mostram, em alguns cen?rios, uma redu??o no consumo de energia de 221,03%, combinada com uma perda de desempenho de 34,60%, com o uso de um dos algoritmos desenvolvidos neste trabalho. Este exemplo confirma a nossa hip?tese de que ? poss?vel reduzir significativamente o consumo de energia em uma grade computacional sem comprometer de forma proporcional o desempenho.
|
13 |
Um ambiente de programação e processamento de aplicações paralelas para grades computacionais. / A programming and prrocessing environment of parallel applications to grid computing.Augusto Mendes Gomes Júnior 28 November 2011 (has links)
A execução de uma aplicação paralela, utilizando grades computacionais, necessita de um ambiente que permita a sua execução, além de realizar o seu gerenciamento, escalonamento e monitoramento. O ambiente de execução deve prover um modelo de processamento, composto pelos modelos de programação e de execução, no qual o objetivo é a exploração adequada das características das grades computacionais. Este trabalho objetiva a proposta de um modelo de processamento paralelo, baseado em variáveis compartilhadas, para grades computacionais, sendo composto por um modelo de execução apropriado para grades e pelo modelo de programação da linguagem paralela CPAR. O ambiente CPAR-Grid foi desenvolvido para executar aplicações paralelas em grades computacionais, abstraindo do usuário todas as características presentes em uma grade computacional. Os resultados obtidos mostram que este ambiente é uma solução eficiente para a execução de aplicações paralelas. / The execution of parallel applications, using grid computing, requires an environment that enables them to be executed, managed, scheduled and monitored. The execution environment must provide a processing model, consisting of programming and execution models, with the objective appropriately exploiting grid computing characteristics. This paper proposes a parallel processing model, based on shared variables for grid computing, consisting of an execution model that is appropriate for the grid and a CPAR parallel language programming model. The CPAR-Grid environment is designed to execute parallel applications in grid computing, where all the characteristics present in grid computing are transparent to users. The results show that this environment is an efficient solution for the execution of parallel applications.
|
14 |
Um ambiente de programação e processamento de aplicações paralelas para grades computacionais. / A programming and prrocessing environment of parallel applications to grid computing.Gomes Júnior, Augusto Mendes 28 November 2011 (has links)
A execução de uma aplicação paralela, utilizando grades computacionais, necessita de um ambiente que permita a sua execução, além de realizar o seu gerenciamento, escalonamento e monitoramento. O ambiente de execução deve prover um modelo de processamento, composto pelos modelos de programação e de execução, no qual o objetivo é a exploração adequada das características das grades computacionais. Este trabalho objetiva a proposta de um modelo de processamento paralelo, baseado em variáveis compartilhadas, para grades computacionais, sendo composto por um modelo de execução apropriado para grades e pelo modelo de programação da linguagem paralela CPAR. O ambiente CPAR-Grid foi desenvolvido para executar aplicações paralelas em grades computacionais, abstraindo do usuário todas as características presentes em uma grade computacional. Os resultados obtidos mostram que este ambiente é uma solução eficiente para a execução de aplicações paralelas. / The execution of parallel applications, using grid computing, requires an environment that enables them to be executed, managed, scheduled and monitored. The execution environment must provide a processing model, consisting of programming and execution models, with the objective appropriately exploiting grid computing characteristics. This paper proposes a parallel processing model, based on shared variables for grid computing, consisting of an execution model that is appropriate for the grid and a CPAR parallel language programming model. The CPAR-Grid environment is designed to execute parallel applications in grid computing, where all the characteristics present in grid computing are transparent to users. The results show that this environment is an efficient solution for the execution of parallel applications.
|
15 |
Metodologia de paralelização híbrida do DEM com controle de balanço de carga baseado em curva de HilbertCINTRA, Diogo Tenório 29 January 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-28T12:46:53Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese_diogotc_final.pdf: 7303783 bytes, checksum: f9959e8bb63b91d247de9903c2484d35 (MD5) / Made available in DSpace on 2016-07-28T12:46:53Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese_diogotc_final.pdf: 7303783 bytes, checksum: f9959e8bb63b91d247de9903c2484d35 (MD5)
Previous issue date: 2016-01-29 / Esta tese apresenta uma metodologia de paralelização híbrida aplicada ao Método dos
Elementos Discretos (DEM - Discrete Element Method) que combina MPI e OpenMP com
o intuito de melhoria de desempenho computacional. A metodologia utiliza estratégias de
decomposição de domínio visando a distribuição do cálculo de modelos de larga escala em
um cluster. A técnica proposta também particiona a carga de trabalho de cada subdomínio
entre threads. Este procedimento adicional visa obter maiores desempenhos computacionais
através do ajuste de utilização de mecanismos de troca de mensagens entre processos e
paralelização por threads. O objetivo principal da técnica é reduzir os elevados tempos de
comunicação entre processos em ambientes computacionais de memória compartilhada tais
como os processadores modernos. A divisão de trabalho por threads emprega a curva de
preenchimento de espaço de Hilbert (HSFC) visando a melhoria de localidade dos dados e
evitando custos computacionais (overheads) resultantes de ordenações constantes para o
vetor de partículas. As simulações numéricas apresentadas permitem avaliar os métodos de
decomposição de domínio, técnicas de particionamento, mecanismos de controle de acesso
à memória, dentre outros. Algoritmos distintos de particionamento e diferentes estratégias
de solução paralela são abordados para ambientes computacionais de memória distribuída,
compartilhada ou para um modelo híbrido que envolve os dois ambientes. A metodologia
desenvolvida e a ferramenta computacional utilizada nas implementações realizadas, o
software DEMOOP, fornecem recursos que podem ser aplicados em diversos problemas de
engenharia envolvendo modelos de partículas em larga escala. Nesta tese alguns destes
problemas são abordados, em especial aqueles relacionados com fluxo de partículas em
rampas, em funis de descarga e em cenários reais de deslizamento de terra. Os resultados
mostram que as estratégias de execução híbridas atingem, em geral, melhores desempenhos
computacionais que aqueles que se baseiam unicamente em troca de mensagens. A técnica
de paralelização híbrida desenvolvida também obtém um bom controle de balanço de carga
entre threads. Os estudos de caso apresentados apresentam boa escalabilidade e eficiências
paralelas. O método proposto permite uma execução configurável de modelos numéricos
do DEM e introduz uma estratégia combinada que melhora localidade dos dados e um
balanceamento de carga iterativo. / This thesis introduces a methodology of hybrid parallelization applied to the Discrete
Element Method (DEM) that combines MPI and OpenMP to improve computational
performance. The methodology uses domain decomposition strategies to distribute the
computation of large-scale models in a cluster. It also partitions the workload of each
subdomain among threads. This additional procedure aims to reach higher computational
performance by adjusting the usage of message passing artifacts and threads. The main
objective is to reduce the expensive communications between processes in computer
resources of shared memory such as modern processors. The work division by threads
employs Hilbert Space Filling Curves (HSFC) in order to improve data-locality and to avoid
the overhead caused by the dynamical sorting of the particles array. Presented numerical
simulations allow to evaluate several domain decomposition schemes, partitioning methods,
mechanisms of memory access control, among others. The work investigate distinct schemes
of parallel solution for both distributed and shared memory environments. The method and
the computational tool employed, the software DEMOOP, provide applied resources for
several engineering problems involving large scale particle models. Some of these problems
are presented on this thesis, such as the particle flows that happen on inclined ramps,
discharge hoppers and real scenarios of landslides. The results shows that the hybrid
executions reach better computational performance than those based on message passing
only, including a good control of load balancing among threads. Case studies present good
scalability and parallel efficiencies. The proposed approach allows a configurable execution
of numerical models and introduces a combined scheme that improves data-locality and
an iterative workload balancing.
|
16 |
Algoritmo distribuído para alocação de múltiplos recursos em ambientes distribuídos. / Distributed algorithm for multiple resource allocation in a distributed environment.Ribacionka, Francisco 07 June 2013 (has links)
Ao considerar um sistema distribuído composto por um conjunto de servidores, clientes e recursos, que caracterizam ambientes como grades ou nuvens computacionais, que oferecem um grande número de recursos distribuídos como CPUs ou máquinas virtuais, os quais são utilizados conjuntamente por diferentes tipos de aplicações, tem-se a necessidade de se ter uma solução para alocação destes recursos. O apoio à alocação dos recursos fornecidos por tais ambientes deve satisfazer todas as solicitações de recursos das aplicações, e fornecer respostas afirmativas para alocação eficiente de recursos, fazer justiça na alocação no caso de pedidos simultâneos entre vários clientes de recursos e responder em um tempo finito a requisições. Considerando tal contexto de grande escala em sistemas distribuídos, este trabalho propõe um algoritmo distribuído para alocação de recursos. Este algoritmo explora a Lógica Fuzzy sempre que um servidor está impossibilitado de atender a uma solicitação feita por um cliente, encaminhando esta solicitação a um servidor remoto. O algoritmo utiliza o conceito de relógio lógico para garantir justiça no atendimento das solicitações feitas em todos os servidores que compartilham recursos. Este algoritmo segue o modelo distribuído, onde uma cópia do algoritmo é executada em cada servidor que compartilha recursos para seus clientes, e todos os servidores tomam parte das decisões com relação a alocação destes recursos. A estratégia desenvolvida tem como objetivo minimizar o tempo de resposta na alocação de recursos, funcionando como um balanceamento de carga em um ambiente cliente-servidor com alto índice de solicitações de recursos pelos clientes. A eficiência do algoritmo desenvolvido neste trabalho foi comprovada através da implementação e comparação com outros algoritmos tradicionais, mostrando a possibilidade de utilização de recursos que pertencem a distintos servidores por uma mesma solicitação de recursos, com a garantia de que esta requisição será atendida, e em um tempo finito. / When considering a distributed system composed of a set of servers, clients, and resources that characterize environments like computational grids or clouds that offer a large number of distributed resources such as CPUs or virtual machines, which are used jointly by different types of applications, there is the need to have a solution for allocating these resources. Support the allocation of resources provided by such environments must satisfy all Requests for resources such applications, and provide affirmative answers to the efficient allocation of resources, to do justice in this allocation in the case of simultaneous Requests from multiple clients and answer these resources in a finite time these Requests. Considering such a context of large- scale distributed systems, this paper proposes a distributed algorithm for resource allocation This algorithm exploits fuzzy logic whenever a server is unable to meet a request made by a client, forwarding this request to a remote server. The algorithm uses the concept of logical clock to ensure fairness in meeting the demands made on all servers that share resources. This algorithm follows a distributed model, where a copy of the algorithm runs on each server that shares resources for its clients and all servers take part in decisions regarding allocation of resources. The strategy developed aims to minimize the response time in allocating resources, functioning as a load-balancing in a client-server environment with high resource Requests by customers.
|
17 |
Alinhamento de seqüências biológicas em arquiteturas com memória distribuídaPeranconi, Daniela Saccol 04 March 2005 (has links)
Made available in DSpace on 2015-03-05T13:53:44Z (GMT). No. of bitstreams: 0
Previous issue date: 4 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A utilização de aglomerados de computadores na solução de problemas que demandam grande quantidade de recursos computacionais vem se mostrando uma alternativa interessante. aglomerados são economicamente viáveis e de fácil manutenção, oferecendo poder computacional equivalente ao de supercomputadores. No entanto,
o desenvolvimento de aplicações para este tipo de arquitetura é complexo, uma vez que envolve questões não presentes na programação seqüencial, como a comunicação de dados e a sincronização de tarefas concorrentes, problemas estes que, em geral, são tratados em supercomputadores por pacotes de software especializados. Neste contexto, este trabalho apresenta o desenvolvimento de um mecanismo de suporte à comunicação sobre aglomerados de computadores, focado na exploração desta plataforma de hardware para o processamento de alto desempenho. O mecanismo criado e disponibilizado sob a forma de uma biblioteca de funções em C, é baseado no modelo de Mensagens
Ativas. Sua implementação é realizada na cama / The use of cluster of computers for solving problems that require a great quantity
of computational resources is becoming an interesting alternative. Clusters are economically
feasible and of easy maintenance, offering a computational power equivalent to that
of supercomputers. However developing applications for this kind of architecture is complex because it involves issues that are not present in the sequential programming such
as data communication and concurrent tasks synchronization, problems that usually are
handled by specialized software packages in supercomputers. Considering this context,
this work presents the development of a mechanism for supporting communication on clusters of computers focused on exploring this hardware platform for high performance processing. The mechanism was created as a library of functions written in C and it is based on the Active Messages model. Its implementation was performed on the applicative level, using light multiprogramming techniques as programming resou
|
18 |
Algoritmo distribuído para alocação de múltiplos recursos em ambientes distribuídos. / Distributed algorithm for multiple resource allocation in a distributed environment.Francisco Ribacionka 07 June 2013 (has links)
Ao considerar um sistema distribuído composto por um conjunto de servidores, clientes e recursos, que caracterizam ambientes como grades ou nuvens computacionais, que oferecem um grande número de recursos distribuídos como CPUs ou máquinas virtuais, os quais são utilizados conjuntamente por diferentes tipos de aplicações, tem-se a necessidade de se ter uma solução para alocação destes recursos. O apoio à alocação dos recursos fornecidos por tais ambientes deve satisfazer todas as solicitações de recursos das aplicações, e fornecer respostas afirmativas para alocação eficiente de recursos, fazer justiça na alocação no caso de pedidos simultâneos entre vários clientes de recursos e responder em um tempo finito a requisições. Considerando tal contexto de grande escala em sistemas distribuídos, este trabalho propõe um algoritmo distribuído para alocação de recursos. Este algoritmo explora a Lógica Fuzzy sempre que um servidor está impossibilitado de atender a uma solicitação feita por um cliente, encaminhando esta solicitação a um servidor remoto. O algoritmo utiliza o conceito de relógio lógico para garantir justiça no atendimento das solicitações feitas em todos os servidores que compartilham recursos. Este algoritmo segue o modelo distribuído, onde uma cópia do algoritmo é executada em cada servidor que compartilha recursos para seus clientes, e todos os servidores tomam parte das decisões com relação a alocação destes recursos. A estratégia desenvolvida tem como objetivo minimizar o tempo de resposta na alocação de recursos, funcionando como um balanceamento de carga em um ambiente cliente-servidor com alto índice de solicitações de recursos pelos clientes. A eficiência do algoritmo desenvolvido neste trabalho foi comprovada através da implementação e comparação com outros algoritmos tradicionais, mostrando a possibilidade de utilização de recursos que pertencem a distintos servidores por uma mesma solicitação de recursos, com a garantia de que esta requisição será atendida, e em um tempo finito. / When considering a distributed system composed of a set of servers, clients, and resources that characterize environments like computational grids or clouds that offer a large number of distributed resources such as CPUs or virtual machines, which are used jointly by different types of applications, there is the need to have a solution for allocating these resources. Support the allocation of resources provided by such environments must satisfy all Requests for resources such applications, and provide affirmative answers to the efficient allocation of resources, to do justice in this allocation in the case of simultaneous Requests from multiple clients and answer these resources in a finite time these Requests. Considering such a context of large- scale distributed systems, this paper proposes a distributed algorithm for resource allocation This algorithm exploits fuzzy logic whenever a server is unable to meet a request made by a client, forwarding this request to a remote server. The algorithm uses the concept of logical clock to ensure fairness in meeting the demands made on all servers that share resources. This algorithm follows a distributed model, where a copy of the algorithm runs on each server that shares resources for its clients and all servers take part in decisions regarding allocation of resources. The strategy developed aims to minimize the response time in allocating resources, functioning as a load-balancing in a client-server environment with high resource Requests by customers.
|
Page generated in 0.1253 seconds