Global ETD Search

81	Um metodo numerico com paralelismo no tempo para aproximar solucoes de EDPs / A numerical method with parallelism in time to approximate solutions to PDEs Washington Santos da Silva 10 June 2014 (has links) Este trabalho de pesquisa tem por objetivo apresentar e investigar a viabilidade de um método numérico que contempla o paralelismo no tempo. Este método numérico está associado a problemas de condição inicial e de contorno para equações diferenciais parciais (evolutivas). Diferentemente do método proposto neste trabalho, a maioria dos métodos numéricos associados a equações diferencias parciais evolutivas e tradicionalmente encontrados, contemplam apenas o paralelismo no espaço. Daí, a motivação em realizar o presente trabalho de pesquisa, buscando não somente um método com paralelismo no tempo mas, sobretudo, um método viável do ponto de vista computacional. Para isso, a implementação do esquema numérico proposto está por conta de um algoritmo paralelo escrito na linguagem C e que utiliza a biblioteca MPI. A análise dos resultados obtidos com os testes de desempenho revelam um método numérico escalável e que exige pouco nível de comunicação entre processadores. / This research aims to present and investigate the feasibility of a numerical method that considers the parallelism in time. This numerical method is associated with problems of initial and boundary conditions for (evolutionary) partial differential equations. Unlike the method proposed in this work, most of the numerical methods associated with evolutionary partial diferential equations and traditionally found include only parallelism in space. Hence, the motivation for carrying out the present research work,seeking not only a method with parallelism in time but,above all, a viable method. The implementation of this proposed computational parallel algorithm was written with the language C and uses the MPI library. The results obtained from performance tests reveal a scalable and numerical method that requires little level of communication amount processors Algoritmos Paralelos Métodos numéricos Equação do Calor Equações diferenciais Parciais Equation of Heat Partial Differential Equations Numerical Methods Parallel Algorithms MATEMATICA DA COMPUTACAO
82	Alguns teoremas de existência e não-existência de gráficos compactos de curvatura média constante com bordo em planos paralelos Neves, Vera Suzana January 2002 (has links) Neste trabalho estabelecemos a existência de gráficos compactos de curvatura média constante H com bordo em planos paralelos, com hipóteses relacionando a geometria das curvas do bordo, a distância entre os planos, e H. / In this work we establish the existence of compact graphs with constant mean curvature H with boundary in parallel planes, with hypothesis that relates the geometry o f the boundary curves, the distance between the planes and H. Geometria diferencial Planos paralelos em R3 Superfícies de curvatura média Equacoes diferenciais parciais elipticas Gráficos de curvatura média constante
83	Alguns teoremas de existência e não-existência de gráficos compactos de curvatura média constante com bordo em planos paralelos Neves, Vera Suzana January 2002 (has links) Neste trabalho estabelecemos a existência de gráficos compactos de curvatura média constante H com bordo em planos paralelos, com hipóteses relacionando a geometria das curvas do bordo, a distância entre os planos, e H. / In this work we establish the existence of compact graphs with constant mean curvature H with boundary in parallel planes, with hypothesis that relates the geometry o f the boundary curves, the distance between the planes and H. Geometria diferencial Planos paralelos em R3 Superfícies de curvatura média Equacoes diferenciais parciais elipticas Gráficos de curvatura média constante
84	Teste de composição de web services: uma estratégia baseada em um modelo de teste de programas paralelos / Web services composition testing: a strategy based on a test model of parallel programs André Takeshi Endo 17 April 2008 (has links) WEb Services constituem uma tecnologia emergente utilizada para disponibilização de serviços na Web. Devido aos complexos processos de negócio existentes, esses serviços são combinados para que operem seguindo um fluxo de trabalho. Esse processo é chamado de composição de Web Services. Como no processo de desenvolvimento de um software tradicional, a atividade de teste é fundamental no processo de desenvolvimento da composição de Web Services. Neste trabalho é proposta uma estratégia de teste para a composição de Web Services, em que especificações de composições são transformadas para um modelo de teste de programas paralelos baseados em passagem de mensagens. É proposto o conceito de grupos de elementos requeridos para melhorar a cobertura dos critérios. Uma ferramenta de apoio à estratégia de teste foi desenvolvida. Alguns estudos experimentais para avaliar a aplicabilidade da estratégia proposta também são apresentados. Além disso, é proposto um método que utiliza redes de Petri para eliminar sincronizações não-executáveis no envio e recebimento de mensagens / WEb Services constitute an emerging technology for deploying services in the Web. Due to the complex business processes, these services are combined to operate, following a workflow. This process is named Web Services Composition. As in the development process of a traditional software, the testing activity is fundamental in the development process of Web Services Composition. This work proposes a test strategy for Web Services Composition, in that composition specifications are transformed into a test model of message-passing parallel programs. The concept of required elements groups is proposed to improve the criteria coverage. A tool that supports the test strategy was developed. Some experimental studies for evaluating the applicability of proposed strategy are also presented. Furthermore, it presents a method that uses Petri Nets to eliminate non-executable synchronizations in the sending and receiving of messages Composição de Web services Teste de programas paralelos Teste de software Teste estrutural Parallel programs testing Software testing Structural testing Web services composition
85	HCLogP: um modelo computacional para clusters heterogêneos Soares, Thiago Marques 09 March 2017 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-15T14:39:21Z No. of bitstreams: 1 thiagomarquessoares.pdf: 1372109 bytes, checksum: 0decc31aa35ac2d0364f017e2f671861 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-17T15:59:41Z (GMT) No. of bitstreams: 1 thiagomarquessoares.pdf: 1372109 bytes, checksum: 0decc31aa35ac2d0364f017e2f671861 (MD5) / Made available in DSpace on 2017-05-17T15:59:41Z (GMT). No. of bitstreams: 1 thiagomarquessoares.pdf: 1372109 bytes, checksum: 0decc31aa35ac2d0364f017e2f671861 (MD5) Previous issue date: 2017-03-09 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O modelo LogP foi desenvolvido em 1993 para medir os efeitos da latência de comunicação, ocupação dos processadores e banda passante em multiprocessadores com memória distribuída. A ideia era caracterizar multiprocessadores de memória distribuída usando estes parâmetros chave, analisando seus impactos no desempenho. Este trabalho propõe um novo modelo, baseado no LogP, que descreve a inﬂuência destes parâmetros no desempenho de aplicações regulares executadas em um agregado (cluster) de computadores heterogêneos. O modelo considera que um agregado heterogêneo é composto por diferentes tipos de processadores, aceleradores e controladores de rede. Os resultados mostram que o pior erro nas estimativas feitas pelo modelo para o tempo de execução paralelo foi de 19,2%, e, em muitos casos, a execução estimada foi igual ou próxima do tempo real. Além disso, com base neste modelo, foi desenvolvido um escalonador, que baseado nas características da aplicação e do ambiente, escolhe um subconjunto de componentes que minimizem o tempo total de execução paralelo. O escalonador obteve êxito na escolha da melhor conﬁguração para a execução de aplicações com diferentes comportamentos. / The LogP model was proposed in 1993 to measure the eﬀects of communication latency, processor occupancy and bandwidth in distributed memory multiprocessors. The idea was to characterize distributed memory multiprocessor using these key parameters and study their impact on performance in simulation environments. This work proposes a new model, based on LogP, that describes the impacts on performance of regular applications executing on a heterogeneous cluster. The model considers that a heterogeneous cluster is composed of distinct types of processors, accelerators and networks. The results show that the worst error in the estimations of the parallel execution time was about 19,2%, and, in many cases, the estimated execution time is equal to or very close to the real one. In addition, based on this model, a scheduler was developed. Based on the applications and computational environment characteristics, the scheduler chooses the subset of processors, accelerators and networks that minimize the parallel execution time. For applications with diﬀerent behaviors, the scheduler successfully chose the best conﬁguration. CNPQ::CIENCIAS EXATAS E DA TERRA Modelos paralelos Agregados de computadores Ambientes heterogêneos de computação Escalonador Parallel Models Cluster Heterogeneous computing Scheduler
86	ChipCflow - uma ferramenta para execução de algoritmos utilizando o modelo a fluxo de dados dinâmico em hardware reconfigurável / ChipCflow - a tool to executing algorithms using dynamic dataflow architecture in FPGA Joelmir José Lopes 29 June 2012 (has links) Devido à complexidade das aplicações, a demanda crescente por sistemas que usam milhões de transistores e hardware complexo; tem sido desenvolvidas ferramentas que convertem C em Linguagem de Descrição de Hardware, tais como VHDL e Verilog. Neste contexto, esta tese apresenta o projeto ChipCflow, o qual usa arquitetura a fluxo de dados, para implementar lógica de alto desempenho em Field Programmable Gate Array (FPGA). Maquinas a fluxo de dados são computadores programáveis, cujo hardware é otimizado para computação paralela de granularidade fina dirigida por dados. Em outras palavras, a execução de programas é determinado pela disponibilidade dos dados, assim, o paralelismo é intrínseco neste sistema. Por outro lado, com o avanço da tecnologia da microeletrônica, o FPGA tem sido utilizado principalmente devido a sua flexibilidade, facilidade para implementar sistemas complexos e paralelismo intrínseco. Um dos desafios é criar ferramentas para programadores que usam linguagem de alto nível (HLL), como a linguagem C, e produzir hardware diretamente. Essas ferramentas devem usar a máxima experiência dos programadores, o paralelismo das arquiteturas a fluxo de dados dinâmica, a flexibilidade e o paralelismo do FPGA, para produzir um hardware eficiente, otimizado para alto desempenho e baixo consumo de energia. O projeto ChipCflow é uma ferramenta que converte os programas de aplicação escritos em linguagem C para a linguagem VHDL, baseado na arquitetura a fluxo de dados dinâmica. O principal objetivo dessa tese é definir e implementar os operadores do ChipCflow, usando a arquitetura a fluxo de dados dinâmica em FPGA. Esses operadores usam tagged tokens para identificar dados, com base em instâncias de operadores. A implementação dos operadores e das instâncias usam um modelo de implementação assíncrono em FPGA para obter maior velocidade e menor consumo / Due to the complexity of applications, the growing demand for both systems using millions of transistors and consecutive complex hardware, tools that convert C into a Hardware Description Language (HDL), as VHDL and Verilog, have been developed. In this context this thesis presents the ChipCflow project, which uses dataflow architecture to implement high-performance logics in Field Programmable Gate Array (FPGA). Dataflow machines are programmable computers whose hardware is optimized for fine-grain data-flow parallel computation. In other words the execution of programs is determined by data availability, thus parallelism is intrinsic in these systems. On the other hand, with the advance of technology of microelectronics, the FPGA has been used mainly because of its flexibility, facilities to implement complex systems and intrinsic parallelism. One of the challenges is to create tools for programmers who use HLL (High Level Language), such as C language, producing hardware directly. These tools should use the utmost experience of the programmers, the parallelism of dynamic dataflow architecture and the flexibility and parallelism of FPGA to produce efficient hardware optimized for high performance and lower power consumption. The ChipCflow project is a tool that converts application programs written in C language into VHDL, based on the dynamic dataflow architecture. The main goal in this thesis is to define and implement the operators of ChipCflow using dynamic dataflow architecture in FPGA. These operators use tagged tokens to identify data based on instances of operators and their implementation and instances use an asynchronous implementation model in FPGA to achieve faster speed and lower consumption Arquiteturas a fluxo de dados dinâmicas Sistemas paralelos Dynamic dataflow architecture Parallel systems
87	REDES DE PROCESADORES GENÉTICOS Campos Frances, Marcelino 07 March 2016 (has links) [EN] In this research, a new model of computing is presented, within the framework of natural computing and computer models inspired by biology: Networks of Genetic Processors (NGP). This new model is based on the one hand, by the family of networks of bio-inspired processors, specifically Networks of Evolutionary Processors (NEP) and Networks of Splicing Processors (NSP), and on the other hand by Genetic Algorithms. We can define the new model as a network of biologically-inspired processors where operations used by processors are crossover and mutation. One of the major interests studying the NGP is the computational power of the operations of crossover and mutation acting together. The NEP is a complete model that uses operations of symbol mutation: insertion, substitution and deletion, the NSP is a complete model that uses splicing operations, but the NEP is no longer a complete model using only substitution operations, as it happens to the NSP if we restrict the context of its splicing rules to the empty context. The study of the new model presented here responds to what happens when we put together in a single model the substitution rules from the NEP (called mutation rules) and the splicing rules with empty context from the NSP (called crossover rules). When we work with networks of biologically-inspired processors there are two basic types of networks, accepting networks and generating networks. These types of networks are mainly used to work at a theoretical level or to solve decision problems. To work on a more practical level such as solving optimization problems, we propose a new type of network, Networks of Genetic processors as Parallel Genetic Algorithms, inspired by the Parallel Genetic Algorithms. In this work we prove the computational completeness of our new model by showing that it is equivalent to the Turing machine. We prove the computational completeness of Parallel Genetic Algorithms by using this result and the similarity between the NGP and Parallel Genetic Algorithms. Moreover, we propose a characterization of the Chomsky hierarchy by using the NGP. Here, we simulate every grammar in the language classes of the Chomsky's hierarchy by using a NGP with an small number of processors required for each simulation. Hence, it gives an appreciable idea of the descriptional complexity of the different families of languages. Finally, in this work there is an experimental study of the behavior of the model for the resolution of some practical problems. First, we design and implement a simulator that allows the execution of networks of Genetic Processors in any of its three defined types: accepting networks, generating networks or as Parallel Genetic Algorithms. This allows us to test the model with different optimization problems. Then, we make a study to see if the new model could solve NP problems in polynomial time. We use the decision problem of Hamiltonian cycle in a graph. Finally, we test the simulator with two optimization problems showing a good computational behavior. The problems are the Multidimensional Knapsack problem and the Traveling Salesman problem. / [ES] Desde la rama de la biocomputación, la computación con modelos inspirados en la biología, esta investigación presenta un nuevo modelo de computación: las Redes de Procesadores Genéticos (NGP). Este nuevo modelo parte, por un lado, de la familia de modelos de redes de procesadores, más concretamente de las Redes de Procesadores Evolutivos (NEP) y las Redes de Procesadores de Splicing (NSP), y por otra parte se inspira en los Algoritmos Genéticos. Así pues, se puede definir de manera informal el nuevo modelo como una red de procesadores bioinspirados donde las operaciones utilizadas por los procesadores son operaciones de cruce y mutación. Uno de los mayores intereses del estudio de las NGP es la capacidad conjunta de las operaciones de cruce y mutación, las NEP son un modelo completo que utiliza operaciones de evolución, es decir, inserción, substitución y borrado, las NSP son un modelo completo que utiliza operaciones de splicing, pero las NEP dejan de ser un modelo completo al usar sólo operaciones de substitución, al igual que le pasa a las NSP si restringimos el contexto de sus reglas de splicing a vacío. El estudio del nuevo modelo aquí presentado da respuesta a qué es lo que pasa cuando juntamos en un sólo modelo las operaciones de sustitución de las NEP (llamadas reglas de mutación) y las operaciones de splicing con contexto vacío de las NSP (llamadas reglas de cruce). Cuando se trabaja con redes de procesadores bioinspirados se definen principalmente dos tipos de redes, las redes aceptoras y las redes generadoras. Estos tipos de redes sirven principalmente para trabajar a un nivel teórico o para resolver problemas de decisión. Para trabajar a un nivel más práctico como por ejemplo con problemas de optimización, se propone un nuevo tipo de red, las Redes de Procesadores Genéticos como Algoritmos Genéticos Paralelos, llamadas así por inspirarse en los Algoritmos Genéticos Paralelos. A nivel teórico, se ha podido demostrar la completitud computacional del modelo, con lo que su potencia de computación se sitúa al mismo nivel que el de las maquinas de Turing. A raíz de este resultado y dada la gran similitud entre las NGP y los Algoritmos Genéticos Paralelos, en este trabajo se demuestra que éstos también son un modelo de computación completo. Por otra parte se ha podido realizar una caracterización de la jerarquía de Chomsky utilizando las NGP, para ello se simula cada una de las gramáticas que definen las cuatro familias de lenguajes de dicha jerarquía observando el mínimo número de procesadores necesarios para cada simulación, lo cual da una idea apreciable de la diferencia de complejidad entre las diferentes familias. No falta en este trabajo un estudio de la parte más práctica del modelo con la realización de algunas tareas. Primero se ha diseñado e implementado un simulador que permite la ejecución de Redes de Procesadores Genéticos en cualquiera de sus tres vertientes aquí definidas, como aceptoras, como generadoras o como Algoritmos Genéticos Paralelos, esto permite realizar pruebas con diferentes problemas de optimización. A continuación se ha realizado un estudio para ver si el nuevo modelo era capaz de resolver problemas NP en tiempo polinómico, para ello se ha trabajado con el problema de ver si existe algún ciclo Hamiltoniano en un grafo. Finalmente se ha probado el simulador con dos problemas de optimización en los que se ha detectado un buen comportamiento del mismo, los problemas utilizados han sido el problema de la mochila multidimensional y el problema del viajante de comercio. / [CAT] Des de la branca de la biocomputació (la computació amb models inspirats amb la biologia) aquesta investigació presenta un nou model de computació: Les Xarxes de Processadors Genètics (NGP). Aquest nou model ve, d'una banda, de la família de models de xarxes de processadors, més concretament de les Xarxes de Processadors Evolutius (NEP) i de les Xarxes de Processadors de Splicing (NSP) i d'altra banda s'inspira als Algoritmes Genètics. Així doncs, es pot definir d'una manera informal el nou model com una xarxa de processadors bioinspirats on les operacions utilitzades per els processadors són operacions de creuament i mutació. Un dels elements més interessants de l'estudi de les NGP és la capacitat conjunta de les operacions de creuament i mutació, les NEP són un model complet que utilitza operacions evolutives, és a dir, insercions, substitucions i esborrats, les NSP són un model complet que utilitza operacions de splicing, però les NEP deixen de ser un model complet al gastar sols operacions de substitució, al igual que li passa a les NSP si restringim el context de les seues regles de splicing a buit. L'estudi del nou model presentat ací dóna resposta a què és el que passa quan ajuntem a un sol model les operacions de substitució de les NEP (anomenades regles de mutació) i les operacions de splicing amb context buit de les NSP (anomenades regles de creuament). Quan es treballa amb xarxes de processadors bioinspirats es defineixen principalment dos tipus de xarxes, les xarxes aceptores i les xarxes generadores. Aquests tipus de xarxes s'utilitzen principalment per a treballar a nivell teòric o per a resoldre problemes de decisió. Per treballar a un nivell més pràctic, com per exemple amb problemes d'optimització, es proposa un nou tipus de xarxa, les Xarxes de Processadors Genètics com Algoritmes Genètics Paral·lels, anomenats així per estar inspirats en els Algoritmes Genètics Paral·lels. A nivell teòric, s'ha pogut demostrar la completitut computacional del model, amb el que la seua potència computacional es situa al mateix nivell que les màquines de Turing. Degut a aquest resultat i donada la gran similitud entre les NGP i els Algoritmes genètics Paral·lels, en aquest treball es demostra que aquestos també són un model computacional complet. D'altra banda, s'ha pogut realitzar una caracterització de la jerarquia de Chomsky utilitzant les NGP, aquest procés es realitza simulant cada una de les gramàtiques que defineixen les quatre famílies de llenguatges d'aquesta jerarquia observant el mínim nombre de processadors necessaris per a cada simulació, el que ens dóna una idea apreciable de la diferència de complexitat entre les diferents famílies. No falta a aquest treball un estudi de la part més pràctica del model com la realització d'algunes tasques. Primer s'ha dissenyat i implementat un simulador que permet l'execució de Xarxes de Processadors Genètics a qualsevol de les seues tres varietats ací definides, com aceptores, com a generadores o com a Algoritmes Genètics Paral·lels, amb el que podem realitzar proves amb diferents problemes d'optimització. A continuació s'ha realitzat un estudi per vore si el nou model era capaç de resoldre problemes NP en un temps polinòmic, estudi que hem realitzat utilitzant el problema de saber si existeix algun cicle Hamiltonià en un graf. Finalment s'ha provat el simulador amb dos problemes d'optimització als que s'ha comprovat que té un bon comportament, els problemes utilitzats són el problema de la motxilla multidimensional i el problema del viatjant de comerç. / Campos Frances, M. (2016). REDES DE PROCESADORES GENÉTICOS [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61452 / TESIS Algoritmos Genéticos Paralelos Redes de procesadores bioinspirados Redes de procesadores Genéticos Completitud computacional Complejidad descriptiva Problemas NP-completos LENGUAJES Y SISTEMAS INFORMATICOS
88	Identificación de parámetros dinámicos de robots paralelos basada en un conjunto de parámetros significativos Díaz Rodríguez, Miguel Ángel 04 November 2009 (has links) Las aplicaciones industriales demandan cada vez más de una mayor precisión por lo que se debe de disponer de robots con controladores robustos basados en el conocimiento del modelo dinámico. Por otra parte, si se requieren simulaciones realistas se debe disponer de modelos dinámicos precisos para así evaluar con mayor certeza los posibles escenarios de operación de dichos robots antes de su puesta en práctica en el proceso industrial. La precisión del modelo dinámico depende en gran medida de la certeza con la que se puedan determinar los parámetros dinámicos del modelo, esto es: masas, localización del centro de gravedad, términos de inercia y parámetros de fricción. Entre las técnicas que se han propuesto para su determinación, la identificación de parámetros dinámicos por medio de métodos experimentales es la que ha proporcionado mejores resultados. Dichas técnicas de identificación han sido aplicadas en mayor medida a la determinación de los parámetros dinámicos de los robots seriales, siendo su aplicación a robots paralelos más escasa. En la presente tesis se propone una metodología completa para la identificación de parámetros dinámicos de robots paralelos basada en un conjunto de parámetros significativos. Los aspectos más relevantes de la metodología propuesta se pueden resumir en: 1) A partir de la identificación de parámetros considerando un modelo dinámico subyacente completo, ir reduciendo dicho modelo a partir de consideraciones estadísticas, 2) Imponer la condición de factibilidad física a los parámetros que se van a identificar. Los experimentos han sido realizados sobre dos tipos de robots paralelos, específicamente, robots paralelos completos de tres grados de libertad, a saber; un robot de configuración 3-RPS, que se disponía de trabajos previos, y de un robot de configuración 3-PRS. Este último fue proyectado en el marco experimental del presente trabajo. La aplicación de la estrategia metodológica propuesta permitió obtener modelos reducidos, los cuales se han verificado mediante la resolución del problema dinámico inverso y posterior comparación entre las fuerzas generalizadas y las acciones de control reales. Así mismo, se ha procedido a la formulación del problema dinámico directo considerando los conjuntos de parámetros identificados. En ambos casos, la respuesta del sistema muestra un elevado grado de concordancia con los resultados reales. / Díaz Rodríguez, MÁ. (2009). Identificación de parámetros dinámicos de robots paralelos basada en un conjunto de parámetros significativos [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/6344 / Palancia Dinámica de robots Robots paralelos Identificación de parámetros INGENIERIA MECANICA 331315 - Diseño de máquinas 331312 - Equipo y maquinaria industrial 220501 - Mecánica analítica
89	Reconstrução de imagens por tomografia por impedância elétrica utilizando recozimento simulado massivamente paralelizado. / Image reconstruction through electrical impedance tomography using massively parallelized simulated annealing. Tavares, Renato Seiji 06 May 2016 (has links) A tomografia por impedância elétrica é uma modalidade de imageamento médico recente, com diversas vantagens sobre as demais modalidades já consolidadas. O recozimento simulado é um algoritmo que apresentada qualidade de solução, mesmo com a utilização de uma regularização simples e sem informação a priori. Entretanto, existe a necessidade de reduzir o tempo de processamento. Este trabalho avança nessa direção, com a apresentação de um método de reconstrução que utiliza o recozimento simulado e paralelização massiva em GPU. A paralelização das operações matriciais em GPU é explicada, com uma estratégia de agendamento de threads que permite a paralelização efetiva de algoritmos, até então, considerados não paralelizáveis. Técnicas para sua aceleração são discutidas, como a heurística de fora para dentro. É proposta uma nova representação de matrizes esparsas voltada para as características da arquitetura CUDA, visando um melhor acesso à memória global do dispositivo e melhor utilização das threads. Esta nova representação de matriz mostrou-se vantajosa em relação aos formatos mais utilizados. Em seguida, a paralelização massiva do problema inverso da TIE, utilizando recozimento simulado, é estudada, com uma proposta de abordagem híbrida com paralelização tanto em CPU quanto GPU. Os resultados obtidos para a paralelização do problema inverso são superiores aos do problema direto. A GPU satura em aproximadamente 7.000 nós, a partir do qual o ganho em desempenho é de aproximadamente 5 vezes. A utilização de GPUs é viável para a reconstrução de imagens de tomografia por impedância elétrica. / Electrical impedance tomography is a new medical imaging modality with remarkable advatanges over other stablished modalities. Simulated annealing is an algorithm that renders quality solutions despite the use of simple regularization methods and the absence of a priori information. However, it remains the need to reduce its processing time. This work takes a step in this direction, presenting a method for the reconstruction of EIT images using simulated annealing and GPU parallelization. The parallelization of matrix operations in GPU is explained, with a thread scheduling strategy that allows the effective parallelization of not-yet effectively parallelized algorithms. There are strategies for improving its performance, such as the presented outside-in heuristic. It is proposed a new sparse matrix representation focused on the CUDA architecture characteristics, with improved global memory access patterns and thread efficiency. This new matrix representation showed several advantages over the most common formats. The massive parallelization of the TIE\'s inverse problem using simulated annealing is studied, with a proposed hybrid approach that uses parallelization in both CPU and GPU. Results showed that the performance gain for the inverse problem is higher than the one obtained for the forward problem. The GPU device saturates with meshes of size of approximately 7,000 nodes, with a performance gain around 5 times faster than serial implementations. GPU parallelization may be used for the reconstruction of electrical impedance tomography images. Algoritmos paralelos CUDA CUDA Electrical impedance tomography GPU GPU Otimização estocástica Parallelized algorithms Problemas inversos Processamento de imagens Recozimento simulado Simulated annealing Tomografia
90	Increasing the energy efficiency of parallel manipulators by means of kinematic redundancy and Model Predictive Control / Aumentando a eficiência energética dos manipuladores paralelos por meio da redundância cinemática e do Modelo de Controle Preditivo Gómez Ruiz, Andrés 04 December 2017 (has links) The use of robotic manipulators in industrial applications is continuously growing. Therefore, the proposal of novel kinematic architectures for robotic manipulators can be a strategy for coping with the required performance of specific tasks. On this matter, the parallel manipulators represent an alternative to fulfill this gap. The objective of this manuscript is to prove that the energy efficiency of parallel manipulators can be increased by the use of kinematic redundancy. Due to the presence of kinematic redundancy, the number of solutions to the inverse kinematics problem become infinite. Hence, a redundancy resolution scheme is required to select a suitable one among the infinite solutions. In this work, a model predictive control (MPC) based method is proposed as redundancy resolution scheme. This proposal is evaluated numerically and experimentally by comparing the energy consumption of non-redundant and kinematically redundant manipulators during the execution of pre-defined tasks. The non-redundant manipulator under study is the planar parallel 3RRR manipulator. This manipulator consists of three identical kinematic chains containing one active revolute joint and two passive revolute joints. Kinematic redundancies were added to the manipulator by including one active prismatic joint in each kinematic chain. In this way, the kinematically redundant manipulator under study is the planar parallel 3PRRR manipulator. By activating or locking the prismatic joints, up to three levels of kinematic redundancy can be evaluated. Numerical kinematic and dynamic models of the manipulators under study were derived not only for their numerical evaluation but also for the derivation of the model-based redundancy resolution scheme. Experimental data was acquired using the prototype built at the Laboratory of Dynamics at São Carlos School of Engineering at University of São Paulo. This experimental data was exploited for assessing the usability of the MPC for deriving a redundancy resolution scheme and for evaluating the impact of several levels of kinematic redundancy on the manipulator\'s energy consumption. Based on this data, one can conclude that MPC can be a suitable alternative for solve redundancy resolution problems and that the redundant parallel manipulators presented a lower energy consumption than the non-redundant one to execute the pre-defined tasks. The rate of reduction on the energy consumption achieved by the redundant manipulators varied between 6% and 60% depending on the task. Nevertheless, the numerical and experimental data presented differences in some particular cases. / O número de aplicações realizadas pelos manipuladores robóticos cresce continuamente. Assim, o desenvolvimento de novas arquiteturas para os manipuladores robóticos mais adaptadas a aplicações concretas é necessário. Destarte, os manipuladores paralelos constituem uma alternativa a ser considerada. O objetivo deste texto é provar que a eficiência energética dos manipuladores paralelos pode ser incrementada por meio da redundância cinemática. A presença de redundância cinemática implica um número infinito de soluções no problema da cinemática inversa. Logo, é precisso um esquema de resolução de redundância para escolher uma das soluções. No presente texto, um método baseado no modelo de controle preditivo (MPC), é proposto como esquema de resolução de redundância. Esta proposta é avaliada tanto numérica como experimentalmente comparando o consumo energético dos manipuladores não redundante e redundantes durante a execução de umas trajetórias predefinidas. O manipulador paralelo não redundante estudado é o 3RRR. Este manipulador é composto por três cadeias cinemáticas idênticas que incluem uma junta rotativa ativa e duas juntas rotativas passivas. Redundâncias cinemáticas foram adicionadas ao manipulador incluindo uma junta prismática ativa em cada uma das três cadeias cinemáticas, obtendo assim, o manipulador redundante 3PRRR. Ativando ou bloqueando as juntas prismáticas podem ser avaliados até três níveis de redundância cinemática. Modelos matemáticos dos manipuladores foram propostos tanto para a estabelecer uma avaliação numérica como para a dedução do esquema de resolução de redundância. Um protótipo do manipulador 3PRRR construído na Escola da Engenharia de São Carlos foi usado para realizar os experimentos. Os dados experimentais foram utilizados para comprovar a utilidade do MPC como esquema de resolução de redundância, e para avaliar os efeitos da redundância cinemática no consumo energético. Com fundamento nos resultados é possível concluir que o MPC pode ser uma alternativa adequada para resolver problemas de resolução de redundância e que os manipuladores paralelos redundantes apresentaram um menor consumo energético para realizar a mesma tarefa quando comparados aos não redundante. A taxa de redução da energia em favor dos manipuladores redundantes varia entre 6% e 60% dependendo da tarefa. Por outro lado, a análise numérica mostrou discrepâncias com a análise experimental em certas circunstâncias. Eficiência energética Energy efficiency Esquema de resolução de redundância Kinematic redundancy Manipuladores robóticos paralelos Model predictive control Modelo de controle preditivo Parallel kinematic manipulators Redundância cinemática Redundancy resolution scheme

Search results