Return to search

DistributedCL: middleware de processamento distribuído em GPU com interface da API OpenCL. / DistributedCL: middleware de processamento distribuído em GPU com interface da API OpenCL.

Este trabalho apresenta a proposta de um middleware, chamado DistributedCL, que
torna transparente o processamento paralelo em GPUs distribuídas. Com o suporte do
middleware DistributedCL uma aplicação, preparada para utilizar a API OpenCL, pode
executar de forma distribuída, utilizando GPUs remotas, de forma transparente e sem
necessidade de alteração ou nova compilação do seu código. A arquitetura proposta para o
middleware DistributedCL é modular, com camadas bem definidas e um protótipo foi
construído de acordo com a arquitetura, onde foram empregados vários pontos de otimização,
incluindo o envio de dados em lotes, comunicação assíncrona via rede e chamada assíncrona
da API OpenCL. O protótipo do middleware DistributedCL foi avaliado com o uso de
benchmarks disponíveis e também foi desenvolvido o benchmark CLBench, para avaliação de
acordo com a quantidade dos dados. O desempenho do protótipo se mostrou bom, superior às
propostas semelhantes, tendo alguns resultados próximos do ideal, sendo o tamanho dos
dados para transmissão através da rede o maior fator limitante. / This work proposes a middleware, called DistributedCL, which makes parallel
processing on distributed GPUs transparent. With DistributedCL middleware support, an
OpenCL enabled application can run in a distributed manner, using remote GPUs,
transparently and without alteration to the code or recompilation. The proposed architecture
for the DistributedCL middleware is modular, with well-defined layers. A prototype was built
according to the architecture, into which were introduced multiple optimization features,
including batch data transfer, asynchronous network communication and asynchronous
OpenCL API invocation. The prototype was evaluated using available benchmarks and a
specific benchmark, the CLBench, was developed to facilitate evaluations according to the
amount of processed data. The prototype presented good performance, higher compared to
similar proposals. The size of data for transmission over the network showed to be the biggest
limiting factor.

Identiferoai:union.ndltd.org:IBICT/urn:repox.ist.utl.pt:UERJ:oai:www.bdtd.uerj.br:5479
Date10 July 2013
CreatorsAndre Luiz Rocha Tupinamba
ContributorsAlexandre Sztajnberg, Felipe Maia Galvão França, Eugene Francis Vinod Rebello, Noemi de La Rocque Rodriguez
PublisherUniversidade do Estado do Rio de Janeiro, Programa de Pós-Graduação em Engenharia Eletrônica, UERJ, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UERJ, instname:Universidade do Estado do Rio de Janeiro, instacron:UERJ
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0022 seconds