• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 337
  • 21
  • 17
  • 6
  • 4
  • 4
  • 4
  • 4
  • 3
  • 1
  • 1
  • Tagged with
  • 384
  • 226
  • 191
  • 184
  • 96
  • 95
  • 68
  • 57
  • 54
  • 53
  • 46
  • 45
  • 42
  • 41
  • 39
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Sobre a escolha da relaxação e ordenação das projeções no método de Kaczmarz com ênfase em implementações altamente paralelas e aplicações em reconstrução tomográfica / On the choice of relaxation and ordering of projections in Kaczmarz method with emphasis on highly prallel implementations and applications in tomographic reconstruction

Estácio, Leonardo Bravo 16 May 2014 (has links)
O método de Kaczmarz é um algoritmo iterativo que soluciona sistemas lineares do tipo Ax = b através de projeções sobre hiperplanos bastante usado em aplicações que envolvem a Tomografia Computadorizada. Recentemente voltou a ser destaque após a publicação de uma versão aleatória apresentada por Strohmer e Vershynin em 2009 a qual foi provada possuir taxa de convergência esperada exponencial. Posteriormente, Eldar e Needell em 2011 sugeriram uma versão modificada do algoritmo de Strohmer e Vershynin, na qual a cada iteração é selecionada a projeção ótima a partir de um conjunto aleatório, utilizando para isto o lema de Johnson-Lindenstrauss. Nenhum dos artigos mencionados apresenta uma técnica para a escolha do parâmetro de relaxação, entretanto, a seleção apropriada deste parâmetro pode ter uma influência substancial na velocidade do método. Neste trabalho apresentamos uma metodologia para a escolha do parâmetro de relaxação, bem como implementações paralelas do algoritmo de Kaczmarz utilizando as ideias de Eldar e Needell. Nossa metodologia para seleção do parâmetro utiliza uma nova generalização dos resultados de Strohmer e Vershynin que agora leva em consideração o parâmetro λ de relaxação e, a partir daí, obtemos uma estimativa da taxa de convergência como função de λ. Escolhemos então, para uso no algoritmo, aquele que otimiza esta estimativa. A paralelização dos métodos foi realizada através da plataforma CUDA e se mostrou muito promissora, pois conseguimos, através dela, um ganho significativo na velocidade de convergência / The Kaczmarz method is an iterative algorithm for finding the solution of a system of linear equations Ax = b by projecting onto the hyperplanes widely used in applications involving Computerized Tomography. It has been recently highlighted after the publication of a random version presented by Strohmer and Vershynin in 2009 that yields probably exponential convergence in expectation. Thereafter, Eldar and Needell in 2011 suggested a modified version of Strohmer and Vershynin algorithm, which at each iteration selects the optimal projection from a random set making use of the Johnson-Lindenstrauss lemma. None of the mentioned articles presents a technique for choosing the relaxation parameter, however, the proper selection of this parameter can achieve a substantial gain on the speed of the method. In this project we present a methodology for finding the relaxation parameter, as well as parallel implementations of Kacmarzs Algorithm using the ideas of Eldar and Needell. Our methodology for parameter selection uses a new generalization on Strohmer and Vershynins results which now regards the relaxation parameter λ. Thenceforward, we obtain an estimate of the convergence rate as a function of λ. Then we use this estimate in the algorithm the optimizer of this estimate. The parallelization of the methods has been implemented through the CUDA platform and appears to be very promising, since it delivers substantial gain in the convergence speed
92

Algoritmos iterativos paralelos para la resolución de sistemas no lineales

Arnal, Josep 17 July 2000 (has links)
Proyecto DGESIC PB98-0977
93

Análisis de eficiencia de algoritmos BSP para la resolución de sistemas lineales tridiagonales

Zamora, Antonio 25 February 2000 (has links)
El libro está estructurado en cinco capítulos; en el capítulo 1 se describen algunos de los modelos de computación paralela que se han propuesto a lo largo de los años, con especial dedicación al modelo BSP. En el capítulo 2 se describe el método de las particiones superpuestas para el que se proponen dos algoritmos BSP y se comparan entre sí. La paralelización de la factorización LDU de matrices tridiagonales fundamenta el algoritmo BSP bidireccional para dos procesadores que se formula en el capítulo 3 en el que, además, se propone un nuevo método bidireccional para un número par de procesadores basado en el método bidireccional para dos procesadores y en el método de las particiones superpuestas; asimismo, se plantean dos algoritmos BSP para el nuevo método y se comparan entre sí. El método de las particiones de Wang es un clásico y rápido método para la resolución de sis-temas tridiagonales que se describe en el capítulo 4; en este capítulo se proponen dos algoritmos BSP para el mismo, uno de los cuales es una modificación de dicho método que supone una mejora cuando el número de procesadores es grande. En la última sección del capítulo se comparan entre sí ambos algoritmos BSP. En el capítulo 5 y último se comparan entre sí todos los algoritmos BSP descritos y analizados en los capítulos anteriores y se obtiene el óptimo para cada una de las situaciones que han sido objeto de estudio. Es de reseñar el buen comportamiento del nuevo método propuesto en el capítulo tercero frente al método de Wang y al método (secuencial) de eliminación de Gauss para sistemas tridiagonales, especialmente en un CRAY T3D y en un CRAY T3E.
94

Algoritmos divide y vencerás para la resolución de sistemas lineales tridiagonales en un computador BSP

Tortosa, Leandro 25 February 2000 (has links)
No description available.
95

Avaliação do desempenho de máquinas de usinagem com estrutura cinemática paralela plana. / Performance analysis of machine-tool with plane parallel kinematic structure.

Celso Ramos de Souza 01 June 2007 (has links)
Este trabalho trata da avaliação do desempenho de máquinas de usinagem cujas arquiteturas se baseiem em estruturas cinemáticas paralelas planas. Inicialmente analisa dois tipos distintos de arquiteturas paralelas, avaliando as suas mobilidades, possíveis formas de atuação, além de apresentar seus modelos teóricos cinemáticos e dinâmicos correspondentes. A seguir, descrevem-se no texto algumas simulações realizadas em oito modelos propostos, de modo a se observar os comportamentos das arquiteturas consideradas, quando da execução de possíveis trajetórias da ferramenta em movimento plano (2D). A seleção dos modelos e a discussão dos resultados são guiadas por índices de desempenho presentes na literatura e outros propostos ou adaptados. O trabalho discute ainda as melhores soluções, com foco nas trajetórias prédefinidas e em critérios importantes para os mecanismos de arquitetura paralela. / This dissertation concerns the performance evaluation of machine-tool with architectures based on planar parallel kinematic structures. The text starts analyzing two distinct types of parallel architectures, their mobility, feasible schemes of actuation and presents their kinematic and dynamic models. From this point, simulations are described to figure out some characteristics of chosen architectures, in eight different models, focused on execution of tool trajectories in plane motion (2D). The model selection and the discussion about obtained results are guided by performance indexes from the literature and others either proposed or adapted. The work also discusses the best solutions, for pre-defined tool trajectories and important points for mechanisms with parallel structures.
96

Programação paralela em GPU aplicada à técnica N-Scheme para solução de problemas eletrostáticos utilizando o método de elementos finitos /

Kewitz, Leonardo Koch, 1989-, Vanti, Marcelo Grafulha, 1963-, Universidade Regional de Blumenau. Programa de Pós-Graduação em Engenharia Elétrica. January 2015 (has links) (PDF)
Orientador: Marcelo Grafulha Vanti. / Dissertação (Mestrado em Engenharia Elétrica) - Programa de Pós-Graduação em Engenharia Elétrica, Centro de Ciências Tecnológicas, Universidade Regional de Blumenau, Blumenau,
97

Geração das K-melhores soluções para o problema da mochila unidimensional em ambiente distribuído

Rodrigo de Castro Penna Franca 01 November 1996 (has links)
Este trabalho sugere um algoritmo para ambiente distribuído que determina as K-melhores soluções para o problema da mochila unidimensional. O algoritmo baseia-se no trabalho de Yanasse, Soma e Maculan (1995), que trata da mesma questão para ambiente serial. Entretanto, convém ressaltar que a versão distribuída do algoritmo possui profundas modificações em relação à versão serial. Primeiramente, o algoritmo serial foi estudado e totalmente implementado. A segunda etapa do trabalho foi o desenvolvimento do algoritmo distribuído. Parte desta tarefa tratou da escolha de uma abordagem de implementação no ambiente distribuído. Duas abordagens foram levadas em consideração e os respectivos algoritmos foram implementados e testados. O paradigma divide and conquer para algoritmos paralelos foi o que prevaleceu. Quanto ao ambiente operacional, o algoritmo serial foi desenvolvido, na sua fase inicial, sobre a plataforma 486/Windows e linguagem de programação C++. Posteriormente, portou-se a aplicação para o ambiente RISC/UNIX. O algoritmo distribuído foi desenvolvido em linguagem de programação C++ aliada às funções da biblioteca PVM, Parallel Virtual Machine (Máquina Paralela Virtual), em uma rede de estações UNIX. Resutaldos computacionais são apresentados.
98

Algoritmos para o problema subset-sum em GPU

Vitor Venceslau Curtis 11 June 2013 (has links)
Este trabalho utiliza o problema subset-sum (SSP) como estudo de caso, com o objetivo de analisar a complexidade de paralelização em Unidades de Processamento Gráficas (GPU). O SSP foi escolhido por pertencer à classe dos problemas NP-Completo, possuir grande necessidade de memória e não ter cálculo de ponto flutuante, além de ser amplamente estudado na área acadêmica devido a sua importância prática e teórica. Estas características representam um desafio para paralelização em GPUs, pelo fato de serem especialistas em cálculos de ponto flutuante e por possuir pouca quantidade de memória em relação ao grande número de núcleos. Basicamente, são apresentados 3 novos algoritmos, implementados em linguagem CUDA C, com baixo consumo de memória: somente , onde , é a capacidade da mochila e é a quantidade de itens, ao invés de do paradigma de Bellman, referentes aos algoritmos do estado da arte implementados na mesma arquitetura. Esta característica permite um ganho significativo na quantidade de instâncias solucionáveis, além do melhor tempo computacional. Para uma variedade de benchmarks, obteve-se bons valores de speed-up em relação aos melhores resultados práticos conhecidos até agora. Isto foi possível graças a um novo método para a solução do SSP, permitindo sua computação em tempo e mesmo espaço, caso processadores sejam utilizados.
99

PMPI: uma implementação MPI multi-plataforma, multi-linguagem. / PMPI: a multi-platform, multi-language implementation of MPI.

El Saifi, Mohamad Maamoun 28 August 2006 (has links)
Esta dissertação apresenta o PMPI, uma implementação do padrão MPI em plataformas heterogêneas. Diferentemente de outras implementações de MPI, o PMPI permite que a aplicação paralela seja realizada num sistema multi-plataforma, e que programas em linguagens de programação diferentes participem da mesma computação. PMPI é construído sobre o Dotnet Framework. Com o PMPI, os nós de processamento chamam funções MPI que são executadas transparentemente em outros nós participantes da computação paralela pela rede de comunicação. O PMPI pode atravessar múltiplos domínios administrativos distribuídos geograficamente. Para os programadores, o grid se parece como uma computação MPI local. O modelo de computação é indistinguível da computação MPI padrão. Esta dissertação estuda a implementação de PMPI com o Microsoft Dotnet Framework e com o MONO para prover uma biblioteca que suporta ambiente de multi-linguagens de programação e multi-plataformas. São analisados os resultados obtidos dos testes executados em sistemas heterogêneos usando PMPI. Os resultados obtidos mostram que a implementação PMPI é uma solução viável, possuindo várias vantagens que ainda podemos explorar melhor. / This dissertation describes PMPI, an implementation of the MPI standard on a heterogeneous platform. Unlike other MPI implementations, PMPI permits MPI computation to run on a multiplatform system. In addition, PMPI permits programs executing on different nodes to be written in different programming languages. PMPI is build on the top of Dotnet framework. With PMPI, nodes call MPI functions that are transparently executed on the participating nodes across the network. PMPI can span multiple administrative domains distributed geographically. To programmers, the grid looks like a local MPI computation. The model of computation is indistinguishable from that of standard MPI computation. This dissertation studies the implementation of PMPI with Microsoft Dotnet framework and MONO Dotnet framework to provide a common layer for a multiprogramming language multiplatform MPI library. Results obtained from tests running PMPI on a heterogeneous system are analyzed. The obtained results show that PMPI implementation is feasible and has many advantages that can be explored.
100

Data Warehouse utilizando processamento paralelo em ambiente distribuído. / Data Warehouse using parallel programming in an environment distributed.

Ruggiero Júnior, Waldemar 02 July 2007 (has links)
Esse trabalho propõe uma solução de um Data Warehouse distribuído para implementação de um sistema de CRM, Customer Relationship Management, com o objetivo de uso no ambiente bancário possibilitando que ações de relacionamento com clientes sejam planejadas e implementadas. É proposta uma arquitetura para implementação de um Data Warehouse em ambiente distribuído, utilizando programação paralela. Com o aumento no volume de dados armazenados nos Data Warehouse, as arquiteturas tradicionais exigem processadores e sistemas de entrada e saída cada vez mais robustos em termos de desempenho. Isso fica mais bem caracterizado quando são executadas procuras complexas (Ad hoc). A utilização de ambientes distribuídos em conjunto com programação paralela é uma alternativa para redução de custo e aumento de desempenho. É apresentada, aqui, uma proposta de arquitetura de Data Warehouse distribuído, integrado ao uso de programação paralela. / This lecture proposes a solution for Data Warehouse in an distributed environment for implementation of a CRM, Customer Relationship Management in a banking system. It\'s possible to create, plan and implement relationship actions with clients. Architecture is proposed for implementation of a Data Warehouse in a distributed environment, using parallel programming. With the increase of volume of data stored in Data Warehouse, the traditional architectures needs high performance in terms of processors and input and output systems. This kind of problem is well characterized when high complex queries (Ad hoc) is performed. Using distributed environment, together with parallel programming is a good choice to increase the performance and reduce cost. It\'s presented, here, a proposal for architecture of distributed Data Warehouse, integrated with the use of parallel programming.

Page generated in 0.0269 seconds