Spelling suggestions: "subject:"parallelism.""
81 |
Estudio de librerías paralelas de libre distribución y algoritmos paralelos iterativos multipaso para la resolución de sistemas de ecuaciones lineales dispersos. Aplicación a la ecuación de difusión neutrónicaFlores Sánchez, Omar 02 April 2009 (has links)
En esta tesis se abordan dos problemas fundamentales relacionados con los estudios
de estabilidad y seguridad de reactores nucleares, donde es necesario resolver eficientemente
sistemas de ecuaciones lineales dispersos de gran dimensi'on. El primero de
ellos est'a relacionado con el problema de los modos Lambda de la ecuaci'on de difusi'on
neutr'onica aplicada a un caso de estudio (reactor Ringhals I, tipo agua en ebullici'on
o BWR), que constituye un problema de valores propios generalizado. El segundo problema
est'a relacionado con la resoluci'on de un sistema de ecuaciones lineales disperso
de gran dimensi'on que surge de la discretizaci'on temporal de la ecuaci'on de difusi'on
neutr'onica aplicada a otro caso de estudio (reactor Leibstadt, tipo BWR) y que debe
resolverse en distintos pasos de tiempo.
Para la resoluci'on de los sistemas de ecuaciones lineales dispersos de gran dimensi'on
asociados al problema de los modos Lambda, en esta tesis se ha realizado un estudio
num'erico del comportamiento secuencial y paralelo de algunos de los m'etodos que resuelven
este tipo de problemas, tales como: m'etodos directos, m'etodos iterativos y m'etodos
basados en subespacios de Krylov. Para realizar el estudio se han utilizando librer'yas
de libre distribuci'on, tanto secuenciales como paralelas. Con los resultados obtenidos,
se han identificado aquellos m'etodos y librer'yas que resuelven m'as eficientemente los
sistemas lineales para el caso de estudio seleccionado.
Para la resoluci'on de los sistemas de ecuaciones lineales dispersos del caso din'amico,
en esta tesis se han propuesto m'etodos iterativos multipaso para la aceleraci'on de su
resoluci'on, los cuales tambi'en se han implementado secuencial y paralelamente utilizando
librer'yas de libre distribuci'on. En la experimentaci'on de estos m'etodos iterativos
multipaso propuestos se ha podido comprobar que se ha alcanzado una aceleraci'on considerable
y que pueden ser una opci'on apropiada para llevar a cabo simul / Flores Sánchez, O. (2009). Estudio de librerías paralelas de libre distribución y algoritmos paralelos iterativos multipaso para la resolución de sistemas de ecuaciones lineales dispersos. Aplicación a la ecuación de difusión neutrónica [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/4334
|
82 |
[en] ALGORITHMS FOR PARTIAL LEAST SQUARES REGRESSION / [pt] ALGORITMOS PARA REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAISRAUL PIERRE RENTERIA 08 January 2004 (has links)
[pt] Muitos problemas da área de aprendizagem automática tem por
objetivo modelar a complexa relação existente num
sisitema , entre variáveis de entrada X e de saída Y na
ausência de um modelo teórico. A regressão por mínimos
quadrados parciais PLS ( Partial Least Squares) constitui
um método linear para resolução deste tipo de
problema , voltado para o caso de um grande número de
variáveis de entrada quando comparado com número de
amostras. Nesta tese , apresentamos uma variante do
algoritmo clássico PLS para o tratamento de grandes
conjuntos de dados , mantendo um bom poder preditivo.
Dentre os principais resultados destacamos um versão
paralela PPLS (Parallel PLS ) exata para o caso de apenas
um variável de saída e um versão rápida e aproximada DPLS
(DIRECT PLS) para o caso de mais de uma variável de saída.
Por outro lado ,apresentamos também variantes para o
aumento da qualidade de predição graças à formulação não
linear. São elas o LPLS ( Lifted PLS ), algoritmo para o
caso de apenas uma variável de saída, baseado na teoria
de funções de núcleo ( kernel functions ), uma
formulação kernel para o DPLS e um algoritmo multi-kernel
MKPLS capaz de uma modelagemmais compacta e maior poder
preditivo, graças ao uso de vários núcleos na geração do
modelo. / [en] The purpose of many problems in the machine learning
field isto model the complex relationship in a system
between the input X and output Y variables when no
theoretical model is available. The Partial Least Squares
(PLS)is one linear method for this kind of problem, for the
case of many input variables when compared to the number of
samples. In this thesis we present versions of the
classical PLS algorithm designed for large data sets while
keeping a good predictive power. Among the main results we
highlight PPLS (Parallel PLS), a parallel version for the
case of only one output variable, and DPLS ( Direct PLS), a
fast and approximate version, for the case fo more than one
output variable. On the other hand, we also present some
variants of the regression algorithm that can enhance the
predictive quality based on a non -linear formulation. We
indroduce LPLS (Lifted PLS), for the case of only one
dependent variable based on the theory of kernel functions,
KDPLS, a non-linear formulation for DPLS, and MKPLS, a
multi-kernel algorithm that can result in a more compact
model and a better prediction quality, thankas to the use
of several kernels for the model bulding.
|
83 |
Computação paralela em GPU para resolução de sistemas de equações algébricas resultantes da aplicação do método de elementos finitos em eletromagnetismo. / Parallel computing on GPU for solving systems of algebraic equations resulting from application of finite element method in electromagnetism.Camargos, Ana Flávia Peixoto de 04 August 2014 (has links)
Este trabalho apresenta a aplicação de técnicas de processamento paralelo na resolução de equações algébricas oriundas do Método de Elementos Finitos aplicado ao Eletromagnetismo, nos regimes estático e harmônico. As técnicas de programação paralelas utilizadas foram OpenMP, CUDA e GPUDirect, sendo esta última para as plataformas do tipo Multi-GPU. Os métodos iterativos abordados incluem aqueles do subespaço Krylov: Gradientes Conjugados, Gradientes Biconjugados, Conjugado Residual, Gradientes Biconjugados Estabilizados, Gradientes Conjugados para equações normais (CGNE e CGNR) e Gradientes Conjugados ao Quadrado. Todas as implementações fizeram uso das bibliotecas CUSP, CUSPARSE e CUBLAS. Para problemas estáticos, os seguintes pré-condicionadores foram adotados, todos eles com implementações paralelizadas e executadas na GPU: Decomposições Incompletas LU e de Cholesky, Multigrid Algébrico, Diagonal e Inversa Aproximada. Para os problemas harmônicos, apenas os dois primeiros pré-condicionadores foram utilizados, porém na sua versão sequencial, com execução na CPU, resultando em uma implementação híbrida CPU-GPU. As ferramentas computacionais desenvolvidas foram testadas na simulação de problemas de aterramento elétrico. No caso do regime harmônico, em que o fenômeno é regido pela Equação de Onda completa com perdas e não homogênea, a formulação adotada foi aquela em dois potenciais, A-V aresta-nodal. Em todas as situações, os aplicativos desenvolvidos para GPU apresentaram speedups apreciáveis, demonstrando a potencialidade dessa tecnologia para a simulação de problemas de larga escala na Engenharia Elétrica, com excelente relação custo-benefício. / This work presents the use of parallel processing techniques in Graphics Processing Units (GPU) for the solution of algebraic equations arising from the Finite Element modeling of electromagnetic phenomena, both in steadystate and time-harmonic regime. The techniques used were parallel programming OpenMP, CUDA and GPUDirect, the latter for those platforms of type Multi-GPU. The iterative methods discussed include those of the Krylov subspace: Conjugate Gradients, Bi-conjugate Gradients, Conjugate Residual, Bi-conjugate Gradients Stabilized, Conjugate Gradients for Normal Equations (CGNE and CGNR) and Conjugate Gradients Squared. All implementations have made use of CUSP, CUSPARSE and CUBLAS libraries. For the static problems, the following pre-conditioners were adopted, all with parallelized implementations and executed on the GPU: Incomplete decompositions, both LU and Cholesky, Algebraic Multigrid, Diagonal and Approximate Inverse. For the time-harmonic varying problems, only the first two pre-conditioners were used, but in their sequential version and running in the CPU, which yielded a hybrid CPU-GPU implementation. The developed computational tools were tested in the simulation of electrical grounding systems. In the case of the harmonic regime, in which the phenomenon is governed by the driven, lossy wave equation, the formulation adopted was that in two potential, the ungauged edge A-V formulation. In all cases, the developed GPU-based tools showed considerable speedups, showing that this is a promising technology for the simulation of large-scale Electrical Engineering problems, with excellent cost-benefit.
|
84 |
Delayed Transfer Entropy applied to Big Data / Delayed Transfer Entropy aplicado a Big DataDourado, Jonas Rossi 30 November 2018 (has links)
Recent popularization of technologies such as Smartphones, Wearables, Internet of Things, Social Networks and Video streaming increased data creation. Dealing with extensive data sets led the creation of term big data, often defined as when data volume, acquisition rate or representation demands nontraditional approaches to data analysis or requires horizontal scaling for data processing. Analysis is the most important Big Data phase, where it has the objective of extracting meaningful and often hidden information. One example of Big Data hidden information is causality, which can be inferred with Delayed Transfer Entropy (DTE). Despite DTE wide applicability, it has a high demanding processing power which is aggravated with large datasets as those found in big data. This research optimized DTE performance and modified existing code to enable DTE execution on a computer cluster. With big data trend in sight, this results may enable bigger datasets analysis or better statistical evidence. / A recente popularização de tecnologias como Smartphones, Wearables, Internet das Coisas, Redes Sociais e streaming de Video aumentou a criação de dados. A manipulação de grande quantidade de dados levou a criação do termo Big Data, muitas vezes definido como quando o volume, a taxa de aquisição ou a representação dos dados demanda abordagens não tradicionais para analisar ou requer uma escala horizontal para o processamento de dados. A análise é a etapa de Big Data mais importante, tendo como objetivo extrair informações relevantes e às vezes escondidas. Um exemplo de informação escondida é a causalidade, que pode ser inferida utilizando Delayed Transfer Entropy (DTE). Apesar do DTE ter uma grande aplicabilidade, ele possui uma grande demanda computacional, esta última, é agravada devido a grandes bases de dados como as encontradas em Big Data. Essa pesquisa otimizou e modificou o código existente para permitir a execução de DTE em um cluster de computadores. Com a tendência de Big Data em vista, esse resultado pode permitir bancos de dados maiores ou melhores evidências estatísticas.
|
85 |
Paralelismo de alimentadores através de seccionadoras de vis-à-vis na rede aérea primária de distribuição. / Feeders parallelism through vis-a-vis disconnecting switches in aerial primary distribution network.Santos, Marcos Rosa dos 15 May 2008 (has links)
Um aspecto importante relacionado à operação de sistemas de distribuição é o referente à segurança nas ações de restabelecimento pós-perturbações, em manobras emergenciais e programadas, onde necessite de transferência de cargas entre alimentadores aéreos primários de uma mesma subestação ou para uma subestação adjacente, de forma segura e confiável. Devem-se observar os requisitos de carregamento, tensão a nível sistêmico, proteção, entre outros. Atualmente as decisões e tomadas de ações referentes às manobras necessárias para os remanejamentos de cargas são de competência dos operadores que atuam nas salas de controle de operações e, em muitos casos, respaldadas somente na experiência de cada operador, acumulada ao longo do tempo. Este trabalho visa o estudo dos fenômenos físicos envolvidos em situações que coloquem alimentadores aéreos primários de distribuição em paralelo ou mesmo quando se forme uma configuração em anel fechado. Estas manobras podem ser executadas através de alimentadores e transformadores distintos, de mesma potência ou de potências diferentes, estabelecendo diretrizes e respaldando os operadores das salas de controle em situações de emergência, urgência ou programadas no sistema aéreo de distribuição. O objetivo principal é oferecer informações técnicas, possibilitando as tomadas de decisões mais adequadas na coordenação de manobras no sistema aéreo de distribuição, em tempo real. Cada uma delas tem condições que se pode considerar como a mais adequada para a execução dos procedimentos estabelecidos, porém sem os principais subsídios técnicos. Desta forma, algumas variáveis como tensão mínima, limites de carregamento de equipamentos, ângulo de fase dos transformadores, restrições operativas do sistema e de consumidores, devem ser aplicadas em tempo real para a tomada de decisão por parte dos operadores do sistema elétrico. / An important aspect related to the distribution systems operation concerns the safety required in the post-disturbances restorement actions or in the emergency and scheduled maneuvers, which involve the need for load transfer between primary overhead feeders of a same sub-station or for an adjacent sub-station, in a safe and reliable way, complying with the loading requirements, voltage at systemic level and protection, among others. Currently the decisions and taking actions related to the necessary maneuvers to carry out the load transfers are responsibility of the operators who work in the operations control rooms, and in many cases, only endorsed by each operator´s own experience, gathered along the time. This paper aims at the study of the involved physical phenomena in situations that place distribution primary overhead feeders in parallel or even when a configuration in closed ring is formed, via distinct transformers and feeders of same or different powers, establishing guidelines and endorsing the control rooms operators in emergency, urgency or scheduled situations in the distribution overhead system. The main objective is to provide technical information, enabling more adequate taking decisions in the distribution overhead system maneuvers coordination, in real time. Each of them has conditions that can be considered the most adequate to carry out the established procedures, however without the main technical information. Thus, some variables such as minimum voltage, equipment loading limits, transformers´ phase angle, the operational restrictions of the system and customers must be applied in real time for the taking decision by the electrical system operators.
|
86 |
[en] SEQUENTIAL AND PARALLEL STRATEGIES OF GRASP WITH PATH-RELINKING FOR THE 2-PATH NETWORK DESIGN PROBLEM / [pt] ESTRATÉGIAS SEQÜENCIAIS E PARALELAS DE GRASP COM RECONEXÃO POR CAMINHOS PARA O PROBLEMA DE SÍNTESE DE REDES A 2-CAMINHOSISABEL CRISTINA MELLO ROSSETI 09 January 2004 (has links)
[pt] Seja G= (V, E) um grafo não-orientado com custos não-
negativos em suas arestas e D um conjunto de pares
origem -
destino. Um 2-caminho entre nós (s,t)é um caminho de s a
t
formado por , no máximo, 2 arestas. O problema de síntese
de redes com 2-caminhos (2PNDP) consiste em encontrar um
subconjunto de arestas com custo mínimo que contenha um 2-
caminho entre as extremidades dea cada para origem-
destino
pertencente a D. Apicações deste problema encontram-se no
projeto de redes de comunicação, onde caminhos com poucas
arestas são desejáveis para garantir alta confiabilidade
e
pequenos atrasos. A metaheurística GRASP é um processo
multipartida para resolver problemas combinatórios, cujas
iterações consistem de duas fases, uma fase de construção
e
outra de busca local. O algoritmo retorna a melhor
solução
encontrada depois de um número determinado de
iterações.Aplica-se a técnica de reconexão por caminhos
ao
final de cada iteração GRASP para melhorar a qualidade
das
soluções. Implementações paralelas de metaheurística são
muito robustas. A maior parte das implementações
paralelas
da metaheurística GRASP segue uma estratégia do tipo
independente , baseada na distribuição balanceada das
iterações pelos processadores. No caso de estratégias
colaboradtivas, os processadores trocam e compartilham
informações coletadas ao longo da trajetória que cada um
deles investiga. Neta tese são desenvolvidas heurísticas
seqüenciais e paralelas para 2PNDP. São analisadas
variantes e combinações de GRASP e reconexão por
caminhos , comparando-se os resultados obtidos pelos
algoritmos descritos na literatura. Heurísticas GRASP
paralelas com reconexão por caminhos são avaliadas e
comparadas para verificar qual o papel que a colaboração
entre os processadores desempenha na qualidade das
soluções
e nos tempos de processamento. Procura-se também estudar
a
melhor maneira de desenvolver implementações paralelas ,
para se utilizar da melhor forma possível os recursos
computacionais e reduzir conflitos de memória e
comunicação. / [en] Let G = ( V, E) be a connected undirected graph , where V
is the set of nodes and E denotes the set of edges. A 2-
path between nodes (s,t)is a sequence of a most two edges
connecting them. Given a non-negative weight function
associated with edges of G and a set D of origin-
destination pairs of nodes, the 2-path network design
problem (2PNDP) consists in finding a minimum weighted
subset of edges containing a 2-path between the extremities
of every origin-destination pair in D. Applications can be
found in the design of communication networks , in which
paths with few edges are sought to enforce high reliability
and small delays. The GRASP metaheuristic is a multistart
process , in which each iteration consists of two phases :
construction and local search. The best solution found
after a fixed number of iterations is returned. Path-
relinking is applied as an attempt to improve the solutions
found at the of each GRASP iteration. Parallel
implementations of metaheuistics ara very robust. Typical
parallelizations of GRASP correspond to multiple-walk
independent-thread strategies, based on the balanced
distribuiton of the iterations over the processors. In the
case of multiple-walk cooperative-thread strategies, the
processors exchange and share information collected along
the trajectories that they investigate. In this thesis,
sequential and parallel heuristics are developed for 2PNDP.
Variants and combinations of GRASP with path-relinking are
analysed by comparing the results of the proposed
algorithms with those obtained by others algoritms
described in the literature. Parallel GRASP with
pathrelinking heuristcs are compared to investigate the
influence of the cooperation among processors in terms of
solution quality and processing time. We also explore
different strategies to optimize the parallel
implementations, to make better use of the computational
resources and to reduce communication and memory
conflicts.
|
87 |
Delayed Transfer Entropy applied to Big Data / Delayed Transfer Entropy aplicado a Big DataJonas Rossi Dourado 30 November 2018 (has links)
Recent popularization of technologies such as Smartphones, Wearables, Internet of Things, Social Networks and Video streaming increased data creation. Dealing with extensive data sets led the creation of term big data, often defined as when data volume, acquisition rate or representation demands nontraditional approaches to data analysis or requires horizontal scaling for data processing. Analysis is the most important Big Data phase, where it has the objective of extracting meaningful and often hidden information. One example of Big Data hidden information is causality, which can be inferred with Delayed Transfer Entropy (DTE). Despite DTE wide applicability, it has a high demanding processing power which is aggravated with large datasets as those found in big data. This research optimized DTE performance and modified existing code to enable DTE execution on a computer cluster. With big data trend in sight, this results may enable bigger datasets analysis or better statistical evidence. / A recente popularização de tecnologias como Smartphones, Wearables, Internet das Coisas, Redes Sociais e streaming de Video aumentou a criação de dados. A manipulação de grande quantidade de dados levou a criação do termo Big Data, muitas vezes definido como quando o volume, a taxa de aquisição ou a representação dos dados demanda abordagens não tradicionais para analisar ou requer uma escala horizontal para o processamento de dados. A análise é a etapa de Big Data mais importante, tendo como objetivo extrair informações relevantes e às vezes escondidas. Um exemplo de informação escondida é a causalidade, que pode ser inferida utilizando Delayed Transfer Entropy (DTE). Apesar do DTE ter uma grande aplicabilidade, ele possui uma grande demanda computacional, esta última, é agravada devido a grandes bases de dados como as encontradas em Big Data. Essa pesquisa otimizou e modificou o código existente para permitir a execução de DTE em um cluster de computadores. Com a tendência de Big Data em vista, esse resultado pode permitir bancos de dados maiores ou melhores evidências estatísticas.
|
88 |
Computação paralela em GPU para resolução de sistemas de equações algébricas resultantes da aplicação do método de elementos finitos em eletromagnetismo. / Parallel computing on GPU for solving systems of algebraic equations resulting from application of finite element method in electromagnetism.Ana Flávia Peixoto de Camargos 04 August 2014 (has links)
Este trabalho apresenta a aplicação de técnicas de processamento paralelo na resolução de equações algébricas oriundas do Método de Elementos Finitos aplicado ao Eletromagnetismo, nos regimes estático e harmônico. As técnicas de programação paralelas utilizadas foram OpenMP, CUDA e GPUDirect, sendo esta última para as plataformas do tipo Multi-GPU. Os métodos iterativos abordados incluem aqueles do subespaço Krylov: Gradientes Conjugados, Gradientes Biconjugados, Conjugado Residual, Gradientes Biconjugados Estabilizados, Gradientes Conjugados para equações normais (CGNE e CGNR) e Gradientes Conjugados ao Quadrado. Todas as implementações fizeram uso das bibliotecas CUSP, CUSPARSE e CUBLAS. Para problemas estáticos, os seguintes pré-condicionadores foram adotados, todos eles com implementações paralelizadas e executadas na GPU: Decomposições Incompletas LU e de Cholesky, Multigrid Algébrico, Diagonal e Inversa Aproximada. Para os problemas harmônicos, apenas os dois primeiros pré-condicionadores foram utilizados, porém na sua versão sequencial, com execução na CPU, resultando em uma implementação híbrida CPU-GPU. As ferramentas computacionais desenvolvidas foram testadas na simulação de problemas de aterramento elétrico. No caso do regime harmônico, em que o fenômeno é regido pela Equação de Onda completa com perdas e não homogênea, a formulação adotada foi aquela em dois potenciais, A-V aresta-nodal. Em todas as situações, os aplicativos desenvolvidos para GPU apresentaram speedups apreciáveis, demonstrando a potencialidade dessa tecnologia para a simulação de problemas de larga escala na Engenharia Elétrica, com excelente relação custo-benefício. / This work presents the use of parallel processing techniques in Graphics Processing Units (GPU) for the solution of algebraic equations arising from the Finite Element modeling of electromagnetic phenomena, both in steadystate and time-harmonic regime. The techniques used were parallel programming OpenMP, CUDA and GPUDirect, the latter for those platforms of type Multi-GPU. The iterative methods discussed include those of the Krylov subspace: Conjugate Gradients, Bi-conjugate Gradients, Conjugate Residual, Bi-conjugate Gradients Stabilized, Conjugate Gradients for Normal Equations (CGNE and CGNR) and Conjugate Gradients Squared. All implementations have made use of CUSP, CUSPARSE and CUBLAS libraries. For the static problems, the following pre-conditioners were adopted, all with parallelized implementations and executed on the GPU: Incomplete decompositions, both LU and Cholesky, Algebraic Multigrid, Diagonal and Approximate Inverse. For the time-harmonic varying problems, only the first two pre-conditioners were used, but in their sequential version and running in the CPU, which yielded a hybrid CPU-GPU implementation. The developed computational tools were tested in the simulation of electrical grounding systems. In the case of the harmonic regime, in which the phenomenon is governed by the driven, lossy wave equation, the formulation adopted was that in two potential, the ungauged edge A-V formulation. In all cases, the developed GPU-based tools showed considerable speedups, showing that this is a promising technology for the simulation of large-scale Electrical Engineering problems, with excellent cost-benefit.
|
89 |
Uma Linguagem de Programação Paralela Orientada a Objetos para Arquiteturas Distribuídas / A Programming Language for Parallel Object-Oriented Distributed ArchitecturesPinho, Eduardo Gurgel January 2012 (has links)
PINHO, Eduardo Gurgel. Uma Linguagem de Programação Paralela Orientada a Objetos para Arquiteturas Distribuídas. 2012. 71 f. : Dissertação (mestrado) - Universidade Federal do Ceará, Centro de Ciências, Departamento de Computação, Fortaleza-CE, 2012. / Submitted by guaracy araujo (guaraa3355@gmail.com) on 2016-06-21T19:17:42Z
No. of bitstreams: 1
2012_dis_egpinho.pdf: 1247267 bytes, checksum: b2db45af231441771b82531797f8c819 (MD5) / Approved for entry into archive by guaracy araujo (guaraa3355@gmail.com) on 2016-06-21T19:19:30Z (GMT) No. of bitstreams: 1
2012_dis_egpinho.pdf: 1247267 bytes, checksum: b2db45af231441771b82531797f8c819 (MD5) / Made available in DSpace on 2016-06-21T19:19:30Z (GMT). No. of bitstreams: 1
2012_dis_egpinho.pdf: 1247267 bytes, checksum: b2db45af231441771b82531797f8c819 (MD5)
Previous issue date: 2012 / In object-oriented programming (OOP) languages, the ability to encapsulate software concerns of the dominant decomposition in objects is the key to reaching high modularity and loss of complexity in large scale designs. However, distributed-memory parallelism tends to break modularity, encapsulation, and functional independence of objects, since parallel computations cannot be encapsulated in individual objects, which reside in a single address space. For reconciling object-orientation and distributed-memory parallelism, this work introduces OOPP (Object-Oriented Parallel Programming), a style of OOP where objects are distributed by default. As an extension of C++, a widespread language in HPC, the PObC++ language has been designed and protoyped, incorporating the ideas of OOPP / Em programação orientadas a objetos (POO) , a habilidade de encapsular interesses de software da dominante decomposição em objetos é a chave para alcançar alto nível de modularidade e diminuição de complexidade em projetos de larga escala. Entretanto, o paralelismo de memória distribuída tende a quebrar modularidade, encapsulamento e a independência de objetos, uma vez que as computações paralelas não podem ser encapsuladas em objetos individuais, os quais residem em um espaço de endereçamento único. Para reconciliar orientação a objetos e paralelismo em memória distribuída, esse trabalho introduz a PPOO (Programação Paralela Orientada a Objetos), um estilo de POO onde objetos são distribuídos por padrão. Como uma estensão do C++, uma linguagem consolidada em CAD, a linguagem PObC++ foi projetada e prototipada, incorporando as ideias da PPOO.
|
90 |
Experimentos computacionais com implementações de conjunto por endereçamento direto e o problema de conjunto independente máximo / Computational experiments with set implementations by direct addressing and the maximum independent set problemSantos, Marcio Costa January 2013 (has links)
SANTOS, Marcio Costa. Experimentos computacionais com implementações de conjunto por endereçamento direto e o problema de conjunto independente máximo. 2013. 78 f. Dissertação (Mestrado em ciência da computação)- Universidade Federal do Ceará, Fortaleza-CE, 2013. / Submitted by Elineudson Ribeiro (elineudsonr@gmail.com) on 2016-07-11T19:04:45Z
No. of bitstreams: 1
2013_dis_mcsantos.pdf: 1370695 bytes, checksum: f82fbf8bcae3901a15066e6d39ac2720 (MD5) / Approved for entry into archive by Rocilda Sales (rocilda@ufc.br) on 2016-07-20T11:59:49Z (GMT) No. of bitstreams: 1
2013_dis_mcsantos.pdf: 1370695 bytes, checksum: f82fbf8bcae3901a15066e6d39ac2720 (MD5) / Made available in DSpace on 2016-07-20T11:59:49Z (GMT). No. of bitstreams: 1
2013_dis_mcsantos.pdf: 1370695 bytes, checksum: f82fbf8bcae3901a15066e6d39ac2720 (MD5)
Previous issue date: 2013 / The use of bit vectors is a usual practice for represent sets by direct addressing with the aim of reduce memory consumed and improve efficiency of applications with the use of bit parallel techniques. In this text, we study implementations for represent sets by direct addressed. The basic structure in this implementations is the bit vector. Besides that basic implementation, we implement two variations also. The first one is a stratification of the bit vector, while the second uses a hash table. The operations linked to the implemented structure are include and remove an element and the union and intersection of two sets. Especial attention is given to the use of bit parallel in this condition. The implementation of the different structures in this work use an base interface and a base abstract class, where the operations are defined and the bit parallel is used. An experimental comparative between this structures is carry out using enumerative algorithms for the maximum stable set problem. Two approaches are used in the implementation of the enumerative algorithms for the maximum stable set problem, both using the bit parallel in the representation of the graph and on the operations with subsets of vertices. The first one is a known branch-and-bound algorithm and the second uses the Russian dolls method. In both cases, the use of bit parallel improve efficiency when the lower bounds are calculated based in a clique cover of the vertices. The results of computational experiments are presented as comparison between the two algorithms and as an assessment of the structures implemented. These results show that the algorithm based on the method Russian Dolls is more efficient regarding runtime and the memory consumed. Furthermore, the experimental results also show that the use stratification and hash tables also allow more efficiency in the case of sparse graphs. / A utilização de vetores de bits é prática corrente na representação de conjuntos por endereçamento direto com o intuito de reduzir o espaço de memória necessário e melhorar o desempenho de aplicações com uso de técnicas de paralelismo em bits. Nesta dissertação, examinamos implementações para representação de conjuntos por endereçamento direto. A estrutura básica nessas implementações é o vetor de bits. No entanto, além dessa estrutura básica, implementamos também duas variações. A primeira delas consiste em uma estratificação de vetores de bits, enquanto a segunda emprega uma tabela de dispersão. As operações associadas às estruturas implementadas são a inclusão ou remoção de um elemento do conjunto e a união ou interseção de dois conjuntos. Especial atenção é dada ao uso de paralelismo em bits nessas operações. As implementações das diferentes estruturas nesta dissertação utilizam uma interface e uma implementação abstrata comuns, nas quais as operações são especificadas e o paralelismo em bits é explorado. A diferença entre as implementações está apenas na estrutura utilizada. Uma comparação experimental é realizada entre as diferentes estruturas utilizando algoritmos enumerativos para o problema de conjunto independente máximo. Duas abordagens são utilizadas na implementação de algoritmos enumerativos para o problema de conjunto independente máximo, ambas explorando o potencial de paralelismo em bits na representação do grafo e na operação sobre subconjuntos de vértices. A primeira delas é um algoritmo do tipo {em branch-and-boound} proposto na literatura e a segunda emprega o método das bonecas russas. Em ambos os casos, o uso de paralelismo em bits proporciona ganhos de eficiência quando empregado no cálculo de limites inferiores baseados em cobertura por cliques. Resultados de experimentos computacionais são apresentados como forma de comparação entre os dois algoritmos e como forma de avaliação das estruturas implementadas. Esses resultados permitem concluir que o algoritmo baseado no método das bonecas russas é mais eficiente quanto ao tempo de execução e quanto ao consumo de memória. Além disso, os resultados experimentais mostram também que o uso de estratificação e tabelas de dispersão permitem ainda maior eficiência no caso de grafos com muito vértices e poucas arestas.
|
Page generated in 0.0784 seconds