Spelling suggestions: "subject:"computação paralelamente""
61 |
"Processamento distribuído de áudio em tempo real" / "Distributed Real-Time Audio Processing"Lago, Nelson Posse 04 June 2004 (has links)
Sistemas computadorizados para o processamento de multimídia em tempo real demandam alta capacidade de processamento. Problemas que exigem grandes capacidades de processamento são comumente abordados através do uso de sistemas paralelos ou distribuídos; no entanto, a conjunção das dificuldades inerentes tanto aos sistemas de tempo real quanto aos sistemas paralelos e distribuídos tem levado o desenvolvimento com vistas ao processamento de multimídia em tempo real por sistemas computacionais de uso geral a ser baseado em equipamentos centralizados e monoprocessados. Em diversos sistemas para multimídia há a necessidade de baixa latência durante a interação com o usuário, o que reforça ainda mais essa tendência para o processamento em um único nó. Neste trabalho, implementamos um mecanismo para o processamento síncrono e distribuído de áudio com características de baixa latência em uma rede local, permitindo o uso de um sistema distribuído de baixo custo para esse processamento. O objetivo primário é viabilizar o uso de sistemas computacionais distribuídos para a gravação e edição de material musical em estúdios domésticos ou de pequeno porte, contornando a necessidade de hardware dedicado de alto custo. O sistema implementado consiste em duas partes: uma, genérica, implementada sob a forma de um middleware para o processamento síncrono e distribuído de mídias contínuas com baixa latência; outra, específica, baseada na primeira, voltada para o processamento de áudio e compatível com aplicações legadas através da interface padronizada LADSPA. É de se esperar que pesquisas e aplicações futuras em que necessidades semelhantes se apresentem possam utilizar o middleware aqui descrito para outros tipos de processamento de áudio bem como para o processamento de outras mídias, como vídeo. / Computer systems for real-time multimedia processing require high processing power. Problems that depend on high processing power are usually solved by using parallel or distributed computing techniques; however, the combination of the difficulties of both real-time and parallel programming has led the development of applications for real-time multimedia processing for general purpose computer systems to be based on centralized and single-processor systems. In several systems for multimedia processing, there is a need for low latency during the interaction with the user, which reinforces the tendency towards single-processor development. In this work, we implemented a mechanism for synchronous and distributed audio processing with low latency on a local area network which makes the use of a low cost distributed system for this kind of processing possible. The main goal is to allow the use of distributed systems for recording and editing of musical material in home and small studios, bypassing the need for high-cost equipment. The system we implemented is made of two parts: the first, generic, implemented as a middleware for synchronous and distributed processing of continuous media with low latency; and the second, based on the first, geared towards audio processing and compatible with legacy applications based on the standard LADSPA interface. We expect that future research and applications that share the needs of the system developed here make use of the middleware we developed, both for other kinds of audio processing as well as for the processing of other media forms, such as video.
|
62 |
Métodos de fronteira imersa em mecânica dos fluidos / Immersed boundary methods in fluid mechanicsLarissa Alves Petri 24 March 2010 (has links)
No desenvolvimento de códigos paralelos, a biblioteca PETSc se destaca como uma ferramenta prática e útil. Com o uso desta ferramenta, este trabalho apresenta um estudo sobre resolvedores de sistemas lineares aplicados a escoamentos incompressíveis de fluidos em microescala, além de uma análise de seu comportamento em paralelo. Após um estudo dos diversos aspectos dos métodos de fronteira imersa, é apresentado um método de fronteira imersa paralelo de primeira ordem. Na sequência, é apresentada uma proposta de melhoria na precisão do método, baseada na minimização da distância entre a condição de contorno exata e aproximada, no sentido de mínimos quadrados. O desenvolvimento de uma ferramenta paralela eficiente é demonstrado na solução numérica de problemas envolvendo escoamentos incompressíveis de fluidos viscosos com fronteiras imersas / In the development of parallel codes, PETSc library has an important position as a practical and useful tool. With this tool, this work presents a study about linear system solvers applied to incompressible flow in microscale problems, furthermore an analysis of the parallel behavior of these methods is presented. After a study of several aspects of immersed boundary methods, and taking advantage of the flexibility of PETSc, a parallel first order immersed boundary method is presented. Thereafter, an improvement in the accuracy of the method is presented, based on the minimization of the distance between exact and approximated boundary conditions, in the least square sense. The development of a parallel and efficient tool is demonstrated in the numerical solution of incompressible viscous flow problems with immersed boundary
|
63 |
Processamento paralelo na simulação de campos eletromagnéticos pelo método das diferenças finitas no domínio do tempo - FDTD. / Parallel processing in the electromagnetic fields simulation with the finite-difference time-domain method - FDTD.Marcelo Porto Trevizan 08 January 2007 (has links)
São crescentes as pesquisas e os projetos envolvendo o eletromagnetismo. Tanto para as pesquisas quanto para os projetos, tem-se o recurso de realizar simulações computacionais dos problemas envolvidos, a fim de investigar o comportamento dos fenômenos eletromagnéticos diante da situação na qual encontram-se. Há casos, contudo, em que o problema pode ficar computacionalmente grande, requisitando maior quantidade de memória e maior tempo de processamento, devido às geometrias envolvidas ou à acuracidade desejada. Com o objetivo de contornar estas questões, tem-se o desenvolvimento da computação paralela. Uma das implementações possíveis de sistema paralelizado é por meio de uma rede de computadores e, empregando-se programas gratuitos, tem-se sua realização a custo praticamente nulo. O presente trabalho, utilizando o método FDTD, visa a implementação de tal sistema paralelizado. Entretanto, na etapa de desenvolvimento, uma especial atenção foi dada às boas práticas de programação, com o objetivo de garantir ao programa flexibilidade, modularidade e expansibilidade. Adicionalmente, desenvolveu-se uma ferramenta matemática para estimar o tempo de processamento total de uma simulação paralelizada, além de fornecer indicativos de ajustes de parâmetros para que este tempo seja o menor possível. Validam-se o código, o sistema paralelizado e a ferramenta matemática com alguns exemplos. Finalmente, realiza-se um estudo para uma aplicação prática de interesse com a ferramenta desenvolvida. / Researches and projects involving electromagnetic problems are continuously increasing. As much for researches as for projects, there is a resource of achieving computer simulations for the involved problems aiming to investigate the electromagnetic phenomenons behavior, in the situation they are. There are cases, however, the problem results in high computational size, requesting more memories sizes and high processing times, because of the given geometries or high accuracy wanted. With the intent of solving these questions, the parallel computation developing becomes interesting. One of the possible implementations of this parallel system is the use of a computer network. Besides, using free programms, the implementation has almost any costs. The present work, using the FDTD method, aims at the implementation of this parallel system. However, during the development stage, a special attention was given to the programming practices, with the intent of guaranteeing the flexibility, modularity and expansibility of the program. In addition, a mathematic tool was developed to estimate the total processing time of the parallel simulation and to predict indications for adjustments of parameters to reach the minimum time possible. The code, the parallel system and the mathematic tool are validated with some examples. Finally, a study for a practical aplication of interest is done with the developed tool.
|
64 |
Processamento paralelo na simulação de campos eletromagnéticos pelo método das diferenças finitas no domínio do tempo - FDTD. / Parallel processing in the electromagnetic fields simulation with the finite-difference time-domain method - FDTD.Trevizan, Marcelo Porto 08 January 2007 (has links)
São crescentes as pesquisas e os projetos envolvendo o eletromagnetismo. Tanto para as pesquisas quanto para os projetos, tem-se o recurso de realizar simulações computacionais dos problemas envolvidos, a fim de investigar o comportamento dos fenômenos eletromagnéticos diante da situação na qual encontram-se. Há casos, contudo, em que o problema pode ficar computacionalmente grande, requisitando maior quantidade de memória e maior tempo de processamento, devido às geometrias envolvidas ou à acuracidade desejada. Com o objetivo de contornar estas questões, tem-se o desenvolvimento da computação paralela. Uma das implementações possíveis de sistema paralelizado é por meio de uma rede de computadores e, empregando-se programas gratuitos, tem-se sua realização a custo praticamente nulo. O presente trabalho, utilizando o método FDTD, visa a implementação de tal sistema paralelizado. Entretanto, na etapa de desenvolvimento, uma especial atenção foi dada às boas práticas de programação, com o objetivo de garantir ao programa flexibilidade, modularidade e expansibilidade. Adicionalmente, desenvolveu-se uma ferramenta matemática para estimar o tempo de processamento total de uma simulação paralelizada, além de fornecer indicativos de ajustes de parâmetros para que este tempo seja o menor possível. Validam-se o código, o sistema paralelizado e a ferramenta matemática com alguns exemplos. Finalmente, realiza-se um estudo para uma aplicação prática de interesse com a ferramenta desenvolvida. / Researches and projects involving electromagnetic problems are continuously increasing. As much for researches as for projects, there is a resource of achieving computer simulations for the involved problems aiming to investigate the electromagnetic phenomenons behavior, in the situation they are. There are cases, however, the problem results in high computational size, requesting more memories sizes and high processing times, because of the given geometries or high accuracy wanted. With the intent of solving these questions, the parallel computation developing becomes interesting. One of the possible implementations of this parallel system is the use of a computer network. Besides, using free programms, the implementation has almost any costs. The present work, using the FDTD method, aims at the implementation of this parallel system. However, during the development stage, a special attention was given to the programming practices, with the intent of guaranteeing the flexibility, modularity and expansibility of the program. In addition, a mathematic tool was developed to estimate the total processing time of the parallel simulation and to predict indications for adjustments of parameters to reach the minimum time possible. The code, the parallel system and the mathematic tool are validated with some examples. Finally, a study for a practical aplication of interest is done with the developed tool.
|
65 |
Uma abordagem em paralelo para matching de grandes ontologias com balanceamento de carga. / A parallel approach for matching large ontologies with load balancing.ARAÚJO, Tiago Brasileiro. 01 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-01T19:28:54Z
No. of bitstreams: 1
TIAGO BRASILEIRO ARAÚJO - DISSERTAÇÃO PPGCC 2016..pdf: 18742851 bytes, checksum: 92b3eefe5e78ab27784255e850871df9 (MD5) / Made available in DSpace on 2018-08-01T19:28:54Z (GMT). No. of bitstreams: 1
TIAGO BRASILEIRO ARAÚJO - DISSERTAÇÃO PPGCC 2016..pdf: 18742851 bytes, checksum: 92b3eefe5e78ab27784255e850871df9 (MD5)
Previous issue date: 2016-03-07 / Atualmente, o uso de grandes ontologias em diversos domínios do conhecimento está aumentando. Uma vez que estas ontologias podem apresentar sobreposição de conteúdo, a identificação de correspondências entre seus conceitos se torna necessária. Esse processo é chamado de Matching de Ontologias (MO). Um dos maiores desafios do matching de grandes ontologias é o elevado tempo de execução e o excessivo consumo de recursos de computacionais. Assim, para melhorar a eficiência, técnicas de particionamento de ontologias e paralelismo podem ser empregadas no processo de MO. Este trabalho apresenta uma abordagem para o Matching de Ontologias baseado em Particionamento e Paralelismo (MOPP) que particiona as ontologias de entrada em subontologias e executa as comparações entre conceitos em paralelo, usando o framework MapReduce como solução programável. Embora as técnicas de paralelização possam melhorar a eficiência do processo de MO, essas técnicas apresentam problemas referentes ao desbalanceamento de carga. Por essa razão, o presente trabalho propõe ainda duas técnicas para balanceamento de carga (básica e refinada) para serem aplicadas junto à abordagem MOPP, a fim de orientar a distribuição uniforme das
comparações (carga de trabalho) entre os nós de uma infraestrutura computacional. O desempenho da abordagem proposta é avaliado em diferentes cenários (diferentes tamanhos de ontologias e graus de desbalanceamento de carga) utilizando uma infraestrutura computacional e ontologias reais e sintéticas. Os resultados experimentais indicam que a abordagem MOPP é escalável e capaz de reduzir o tempo de execução do processo de MO. No que diz respeito às técnicas de balanceamento de carga, os resultados obtidos mostram que a abordagem MOPP é robusta, mesmo em cenários com elevado grau de desbalanceamento de carga, com a utilização da técnica refinada de balanceamento de carga. / Currently, the use of large ontologies in various áreas of knowledge is increasing. Since,
these ontologies can present contents overlap, the identification of correspondences among their concepts is necessary. This process is called Ontologies Matching (OM). One of the major challenges of the large ontologies matching is the high execution time and the computational resources consumption. Therefore, to get the efficiency better, partition and parallel techniques can be employed in the MO process. This work presents a Partition-Parallelbased Ontology Matching (PPOM) approach which partitions the input ontologies in subontologies and executes the comparisons between concepts in parallel, using the framework MapReduce as a programmable solution. Although the parallel techniques can get the MO efficiency process better, these techniques present problems concerning to the load imbalancing. For that reason, our work has proposed two techniques to the load balancing - the basic and the fine-grained one - which are supposed to be applied together with the PPOM approach, in order to orientate the uniform distribution of the comparisons (workload) between the nodes of a computing infrastructure. The performance of the proposed approach is assessed in different settings (different sizes of ontologies and degrees of load imbalancing) using a computing infrastructure and real and synthetic ontologies. The experimental results have indicated that the PPOM approach is scalable and able to reduce the OM process execution time. Referring to the load balancing techniques, the obtained results have shown that the PPOM approach is robust, even in settings with a high load imbalancing, with the fine-grained load balancing technique.
|
66 |
Otimização do método SOR para matrizes p-cíclicas consistentemente ordenadasCaleffi, José January 2000 (has links)
Estudamos a otimização do método SOR clássico, para a resolução de um sistema linear Ax = b, com A não-singular, a partir dos resultados de Young [55, 57] e Varga [50, 51] para matrizes de blocos p-cíclicas consistentemente ordenadas. Num primeiro nível, a otimização refere-se à escolha do parâmetro de relaxação do SOR que produz a maior velocidade de convergência, e, num segundo nível, à escolha da p-ciclicidade que apresenta o melhor desempenho com os valores ótimos do parâmetro, e damos ênfase ao caso 2-cíclico. Além disso, descrevemos a otimização do parâmetro em três generalizações: a) num relaxamento das condições sobre o espectro da matriz de Jacobi associada a A; b) no método SOR para matrizes singulares; c) num novo método SOR, que substitui a decomposição A = D - L - U, onde D, L e U são a diagonal de A, a parte triangular inferior estrita de A e a parte triangular superior estrita de A, pela A = D - P - Q, onde P pertence a uma classe de matrizes constru ída a partir das matrizes-escada. Descrevemos também a aplicação do caso singular às cadeias de Markov, comentamos a computação paralela aplicada ao SOR, e apresentamos diversas simulações relativas à otimização desse método. / We study the optimization of the classic SOR method for solving a linear system Ax = b, where A is a nonsingular p-cyclic consistently ordered block matrix, based on the discoveries of Young [55, 57] and Varga [50, 51]. In a first levei, the optimization refers to the choice of the SOR relaxation parameter, which produces the greatest convergence speed and, in a second levei, to the p-cyclicity that presents the best performance with the optimal parameter values and emphasize the 2- cyclic case. Moreover we describe three SOR generalizations concerning optimization: a) by weakening the conditions on the spectrum of Jacobi matrix associated with A; b) by considering the SOR method for singular matrices; c) by approaching a new SOR, that replaces the splitting A = D - L - U, where O, L and U are the diagonal of A, the strict lower triangular part of A and the strict upper triangular part of A. respectively, by this one A = D - P - Q, where P is a stair matrix or a matrix even more general than a stair matrix. We also describe the application of the singular case to Markov chains, discuss parallel computing applied to SOR method, and present severa! simulations regarding the optimization of that method.
|
67 |
Sistemas Distribuídos para Otimização por Simulação Numérica Aplicada a Modelagem de Aquíferos / Distributed Systems for Numerical Simulation Optimization Applied to Aquifer ModelingPatrícia de Araújo Pereira Costa 09 July 2009 (has links)
Neste trabalho, modela-se a ocorrência de contaminação de um aquífero hipotético por derramamento de substância tóxica e analisa-se a solução de descontaminação baseada na retirada
do contaminante através de bombeamento feito por poços de extração. O projeto do sistema de remediação envolve a escolha do número de poços a serem instalados, suas localizações e vazões de modo a maximizar a quantidade de poluente extraída e ao mesmo tempo minimizar o custo total do
sistema. A busca da solução ótima é feita de forma automática, através de um sistema paralelo de otimização por simulação numérica, composto por três subsistemas:
(a) simulador numérico - resolve numericamente o modelo matemático do aquífero contaminado;
(b) otimizador automático - implementa o método dos algoritmos genéticos para busca das localizações e vazões ótimas dos poços de extração;
(c)sistema computacional distribuído - gerencia a distribuição e a execução paralela das simulações numéricas.
Foram feitos experimentos em vários ambientes computacionais: homogêneo, heterogêneo, em grande escala, usando máquinas não dedicadas, interligadas por rede local e ambiente de grade, e seus resultados demonstram a aplicabilidade da metodologia. / In this dissertation, a hypothetical aquifer that has been contaminated by the dumping of toxic substances is modeled. The remediation strategy considered is based on withdrawal, which requires the removal of contaminated groundwater
from the aquifer by pumping. The design of such a system involves the choice of the number of extracting wells to be installed, their locations and pumping rates,with the goal of maximizing the amount of contaminant extracted, while minimizing the cost of the system. To find the optimal solution, a numerical simulation optimization parallel system is used, which is composed by three subsystems:
(a) numerical simulator - numerically solves the mathematical model ofthe contaminated aquifer;
(b) optimizer - implements the genetic algorithm method to search for optimal locations and pumping rates for the extracting wells;
(c)distributed computing system - manages the distribuition and parallel execution of the numerical simulations.
Experiments were done in many different computational environments: homogeneous, heterogeneous, in large scale, using non dedicated computers, connected via local network,
and computational grids, and their results demonstrate the methodologys applicability.
|
68 |
Estudo para otimização do algoritmo Non-local means visando aplicações em tempo realSilva, Hamilton Soares da 25 July 2014 (has links)
Made available in DSpace on 2015-05-08T14:59:57Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 3935872 bytes, checksum: 5a4c90590e53b3ea1d71bbe61a628b56 (MD5)
Previous issue date: 2014-07-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The aim of this work is to study the non-local means algorithm and propose techniques to optimize and implement this algorithm for its application in real-time. Two alternatives are suggested for implementation. The first deals with the development of an accelerator card for computers, which has a PCI bus containing specialized hardware that implements the NLM filter. The second implementation uses densely GPU multiprocessor environment, which exists in the parent video. Both proposals significantly accelerates the NLM algorithm, while maintains the same visual quality of traditional software implementations, enabling real-time use. Image denoising is an important area for digital image processing. Recently, its use is becoming more popular due to improvements of of the new acquisition equipments and, thus, the increase of image resolution that favors the occurrence of such perturbations. It is widely studied in the fields of image processing, computer vision and predictive maintenance of electrical substations, motors, tires, building facilities, pipes and fittings, focusing on reducing the noise without removing details of the original image. Several approaches have been proposed for filtering noise. One of such approaches is the non-local method called Non-Local Means (NLM), which uses the entire image rather than local information and stands out as the state of the art. However, a problem in this method is its high computational complexity, which turns its application almost impossible in real time applications, even for small images / O propósito deste trabalho é estudar o algoritmo non-local means(NLM) e propor técnicas para otimizar e implementar o referido algoritmo visando sua aplicação em tempo real. Ao todo são sugeridas duas alternativas de implementação. A primeira trata do desenvolvimento de uma placa aceleradora para computadores que possuam Barramento PCI, contendo um hardware especializado que implementa o Filtro NLM. A segunda implementação utiliza o ambiente densamente multiprocessado GPU, existente nas controladoras de vídeo. As duas propostas aceleraram significativamente o algoritmo NLM, mantendo a mesma qualidade visual das implementações tradicionais em software, tornando possível sua utilização em tempo real. A filtragem de ruídos é uma área importante para o processamento digital de imagens, sendo cada vez mais utilizada devido as melhorias dos novos equipamentos de captação, e o consequente aumento da resolução da imagem, que favorece o aparecimento dessas perturbações. Ela é amplamente estudada nos campos de tratamento de imagens, visão computacional e manutenção preditiva de subestações elétricas, motores, pneus, instalações prediais, tubos e conexões, focando em reduzir os ruídos sem que se remova os detalhes da imagem original. Várias abordagens foram propostas para filtragem de ruídos, uma delas é o método não-local, chamado de Non-Local Means (NLM), que não só utiliza as informações locais, mas a imagem inteira, destaca-se como o estado da arte, porém, há um problema neste método, que é a sua alta complexidade computacional, que o torna praticamente inviável de ser utilizado em aplicações em tempo real, até mesmo para imagens pequenas
|
69 |
Otimização do método SOR para matrizes p-cíclicas consistentemente ordenadasCaleffi, José January 2000 (has links)
Estudamos a otimização do método SOR clássico, para a resolução de um sistema linear Ax = b, com A não-singular, a partir dos resultados de Young [55, 57] e Varga [50, 51] para matrizes de blocos p-cíclicas consistentemente ordenadas. Num primeiro nível, a otimização refere-se à escolha do parâmetro de relaxação do SOR que produz a maior velocidade de convergência, e, num segundo nível, à escolha da p-ciclicidade que apresenta o melhor desempenho com os valores ótimos do parâmetro, e damos ênfase ao caso 2-cíclico. Além disso, descrevemos a otimização do parâmetro em três generalizações: a) num relaxamento das condições sobre o espectro da matriz de Jacobi associada a A; b) no método SOR para matrizes singulares; c) num novo método SOR, que substitui a decomposição A = D - L - U, onde D, L e U são a diagonal de A, a parte triangular inferior estrita de A e a parte triangular superior estrita de A, pela A = D - P - Q, onde P pertence a uma classe de matrizes constru ída a partir das matrizes-escada. Descrevemos também a aplicação do caso singular às cadeias de Markov, comentamos a computação paralela aplicada ao SOR, e apresentamos diversas simulações relativas à otimização desse método. / We study the optimization of the classic SOR method for solving a linear system Ax = b, where A is a nonsingular p-cyclic consistently ordered block matrix, based on the discoveries of Young [55, 57] and Varga [50, 51]. In a first levei, the optimization refers to the choice of the SOR relaxation parameter, which produces the greatest convergence speed and, in a second levei, to the p-cyclicity that presents the best performance with the optimal parameter values and emphasize the 2- cyclic case. Moreover we describe three SOR generalizations concerning optimization: a) by weakening the conditions on the spectrum of Jacobi matrix associated with A; b) by considering the SOR method for singular matrices; c) by approaching a new SOR, that replaces the splitting A = D - L - U, where O, L and U are the diagonal of A, the strict lower triangular part of A and the strict upper triangular part of A. respectively, by this one A = D - P - Q, where P is a stair matrix or a matrix even more general than a stair matrix. We also describe the application of the singular case to Markov chains, discuss parallel computing applied to SOR method, and present severa! simulations regarding the optimization of that method.
|
70 |
Otimização do método SOR para matrizes p-cíclicas consistentemente ordenadasCaleffi, José January 2000 (has links)
Estudamos a otimização do método SOR clássico, para a resolução de um sistema linear Ax = b, com A não-singular, a partir dos resultados de Young [55, 57] e Varga [50, 51] para matrizes de blocos p-cíclicas consistentemente ordenadas. Num primeiro nível, a otimização refere-se à escolha do parâmetro de relaxação do SOR que produz a maior velocidade de convergência, e, num segundo nível, à escolha da p-ciclicidade que apresenta o melhor desempenho com os valores ótimos do parâmetro, e damos ênfase ao caso 2-cíclico. Além disso, descrevemos a otimização do parâmetro em três generalizações: a) num relaxamento das condições sobre o espectro da matriz de Jacobi associada a A; b) no método SOR para matrizes singulares; c) num novo método SOR, que substitui a decomposição A = D - L - U, onde D, L e U são a diagonal de A, a parte triangular inferior estrita de A e a parte triangular superior estrita de A, pela A = D - P - Q, onde P pertence a uma classe de matrizes constru ída a partir das matrizes-escada. Descrevemos também a aplicação do caso singular às cadeias de Markov, comentamos a computação paralela aplicada ao SOR, e apresentamos diversas simulações relativas à otimização desse método. / We study the optimization of the classic SOR method for solving a linear system Ax = b, where A is a nonsingular p-cyclic consistently ordered block matrix, based on the discoveries of Young [55, 57] and Varga [50, 51]. In a first levei, the optimization refers to the choice of the SOR relaxation parameter, which produces the greatest convergence speed and, in a second levei, to the p-cyclicity that presents the best performance with the optimal parameter values and emphasize the 2- cyclic case. Moreover we describe three SOR generalizations concerning optimization: a) by weakening the conditions on the spectrum of Jacobi matrix associated with A; b) by considering the SOR method for singular matrices; c) by approaching a new SOR, that replaces the splitting A = D - L - U, where O, L and U are the diagonal of A, the strict lower triangular part of A and the strict upper triangular part of A. respectively, by this one A = D - P - Q, where P is a stair matrix or a matrix even more general than a stair matrix. We also describe the application of the singular case to Markov chains, discuss parallel computing applied to SOR method, and present severa! simulations regarding the optimization of that method.
|
Page generated in 0.0962 seconds