Parallel self-verified solver for dense linear systems

Made available in DSpace on 2015-04-14T14:49:09Z (GMT). No. of bitstreams: 1
415011.pdf: 9818822 bytes, checksum: 000259a328a840b445d92337ab6707ce (MD5)
Previous issue date: 2009-01-09 / Esta tese apresenta uma ferramenta de resolu??o de sistemas lineares densos pontuais e intervalares. As principais caracter?sticas desta ferramenta s?o rapidez, confiabilidade e precis?o. Esta ferramenta ? baseada em um m?todo de resolu??o de sistemas densos verificado usando arredondamentos direcionados e aritm?tica intervalar associados a bibliotecas otimizadas e primitivas MPI para prover resultados confi?veis e alto desempenho. A primeira vers?o paralela foi desenvolvida usando a biblioteca C-XSC. Esta vers?o n?o alcan?ou o desempenho global esperado uma vez que n?o foi paralelizada totalmente devido a particularidades do C-XSC (vari?veis especiais e produto escalar ?timo). Como o C-XSC n?o se mostrou eficiente para aplica??es de grande porte, foi proposta e implementada uma nova vers?o seq?encial para sistemas lineares densos usando tanto a aritm?tica de ?nfimo e supremo como a aritm?tica de ponto m?dio e raio, baseada nas bibliotecas BLAS e LAPACK. Testes de desempenho mostraram que o algoritmo que implementa a aritm?tica de ponto m?dio e raio possui um desempenho melhor do que o algoritmo que implementa a aritm?tica de ?nfimo e supremo. Considerando este resultado, a aritm?tica de ponto m?dio e raio foi escolhida para a pr?xima etapa: a implementa??o paralela. Uma vers?o paralela para solu??o de sistemas lineares pontuais e intervalares densos foi ent?o desenvolvida utilizando a aritm?tica de ponto m?dio e raio, arredondamentos direcionados e as bibliotecas otimizadas PBLAS e ScaLAPACK. Os resultados mostraram que foi poss?vel alcan?ar um bom desempenho utilizando um n?mero de processadores variado e proporcionando consider?vel acelera??o na obten??o dos resultados para diferentes tamanhos de matrizes (pontuais e intervalares). A fim de superar as limita??es impostas pelo uso da mem?ria na gera??o de toda a matriz em um s? processador, uma nova vers?o foi implementada. Esta vers?o gera as sub-matrizes da matriz principal em cada processador, permitindo uma melhor utiliza??o da mem?ria global disponibilizada pelo Cluster. Estas altera??es tornaram poss?vel resolver sistemas densos de dimens?o 100 000. Para investigar a portabilidade da solu??o proposta, os testes foram realizados em 3 Clusters diferentes na Alemanha (ALiCEnext, XC1 e IC1). Cada um destes Clusters possui configura??es distintas e apresentaram resultados significativos, indicando que a vers?o paralela possui uma boa escalabilidade para sistemas lineares muito grandes usando um n?mero variado de processadores. Outros estudos foram realizados em duas dire??es. O primeiro diz respeito ao uso de threads dedicadas para aumentar o desempenho da solu??o de sistemas lineares usando mem?ria compartilhada (em especial para processadores dual-core). Tamb?m foi estudada a utiliza??o dessas id?ias para aumentar o desempenho da solu??o usando C-XSC.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5055
Date09 January 2009
CreatorsKolberg, Mariana Luderitz
ContributorsClaudio, Dalcidio Moraes
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.0018 seconds