  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.

GPUHELP: um ambiente de apoio à execução de programas paralelos em arquiteturas de GPU / GPUHELP: an environment supporting to execution of parallel programs for GPU architectures

Borges, Douglas Pires 07 March 2014 (has links)
Faced with complex problems that involve scientific applications, researchers are looking for new ways to optimize the processing of these, using new concepts and paradigms for parallel and distributed programming. An emerging alternative to this scenario is the use of GPUs (Graphics Processing Unit) due to its high computational power. However, along with the benefits from the use of such techniques has been diverse and complex issues related to teaching and learning from them. Thus, researchers began to devote efforts to obtain better results in teaching these areas. So, the environments to support teaching of parallel programming have emerged. Such environments provide a set of tools for the development and testing of applications, thereby improving the educational experience. However, the current researches focuses on environments supporting teaching parallel programming for CPU architectures, not exist environments to teaching support teaching oriented architectures GPU. The absence of such environments has a negative impact, proven in various scientific researches. In this context, this work presents an environment for supporting parallel programming in GPU, called GPUHelp. The GPUHelp provides to users a complete solution for developing and codes test for GPU architectures, the CUDA and OpenCL, even for those users that do not have graphics cards on their computers, which was not possible before, given the need to graphics card compatible with such architectures. Evaluations have shown that GPUHelp is a feasible solution with different applicability scenarios in education and training on parallel programming GPU. / Frente às complexas dificuldades que envolvem as aplicações científicas, pesquisadores buscam novos meios de otimizar o processamento destas, utilizando-se de novos conceitos e paradigmas em programação paralela e distribuída. Uma alternativa emergente a este cenário, é a utilização de GPUs (Graphics Processing Unit) devido a seu alto poder computacional. Contudo, juntamente com os benefícios advindos da utilização de tais técnicas, tem-se diversas e complexas questões relacionadas ao ensino e aprendizado das mesmas. Desse modo, pesquisadores passaram a dedicar esforços para obter um melhor resultado no ensino destas áreas. Assim, surgiram os ambientes de apoio ao ensino de programação paralela. Tais ambientes provêem um conjunto de ferramentas para o desenvolvimento e teste de aplicações, aprimorando assim a experiência educacional. Entretanto, as pesquisas atuais focam em ambientes de apoio a programação paralela para arquiteturas de CPU, não existindo assim, ambientes de apoio voltados as arquiteturas de GPU. A inexistência de tais ambientes tem impacto negativo, durante o processo de aprendizado, comprovado em diferentes pesquisas científicas. Neste contexto, este trabalho apresenta um ambiente de apoio a programação paralela em GPU, intitulado GPUHelp. O GPUHelp proporciona aos usuários uma solução completa para o desenvolvimento e teste de códigos para arquiteturas de GPU, o CUDA e OpenCL, mesmo para aqueles usuários que não possuem placas gráficas em seus computadores, o que não era possível até então, visto a necessidade de uma placa gráfica compatível com tais arquiteturas. As avaliações realizadas demonstraram que o GPUHelp é uma solução viável com aplicabilidades distintas nos cenários de ensino e treinamento de programação paralela em GPU.

Efficient techniques to provide scalability for token-based cache coherence protocols

Cuesta Sáez, Blas Antonio 17 July 2009 (has links)
Cache coherence protocols based on tokens can provide low latency without relying on non-scalable interconnects thanks to the use of efficient requests that are unordered. However, when these unordered requests contend for the same memory block, they may cause protocols races. To resolve the races and ensure the completion of all the cache misses, token protocols use a starvation prevention mechanism that is inefficient and non-scalable in terms of required storage structures and generated traffic. Besides, token protocols use non-silent invalidations which increase the latency of write misses proportionally to the system size. All these problems make token protocols non-scalable. To overcome the main problems of token protocols and increase their scalability, we propose a new starvation prevention mechanism named Priority Requests. This mechanism resolves contention by an efficient, elegant, and flexible method based on ordered requests. Furthermore, thanks to Priority Requests, efficient techniques can be applied to limit the storage requirements of the starvation prevention mechanism, to reduce the total traffic generated for managing protocol races, and to reduce the latency of write misses. Thus, the main problems of token protocols can be solved, which, in turn, contributes to wide their efficiency and scalability. / Cuesta Sáez, BA. (2009). Efficient techniques to provide scalability for token-based cache coherence protocols [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/6024

A New Index for Detecting and Avoiding Type II Singularities for the Control of Non-Redundant Parallel Robots

Pulloquinga Zapata, José Luis 16 June 2023 (has links)
[ES] Los robots paralelos (PR por sus siglas en inglés) son mecanismos donde el efector final está unido a la base, mediante al menos dos cadenas cinemáticas abiertas. Los PRs ofrecen una gran capacidad de carga y alta precisión, lo que los hace adecuados para diversas aplicaciones, entre ellas la interacción persona-robot. Sin embargo, en las proximidades de una singularidad Tipo II (singularidad dentro del espacio de trabajo), un PR pierde el control sobre los movimientos del efector final. La pérdida de control representa un riesgo importante para los usuarios, especialmente en rehabilitación robótica. En las últimas décadas, los PR se han popularizado en la rehabilitación de miembros inferiores debido al aumento del número de personas que viven con limitaciones físicas. Así, esta tesis trata sobre la detección y evitación de singularidades de Tipo II para asegurar total control de un PR no redundante para la rehabilitación y diagnóstico de rodilla, denominado 3UPS+RPU. En la literatura, existen varios índices para detectar y medir la cercanía a una singularidad basados en métodos analíticos y geométricos. Sin embargo, algunos de estos índices carecen de significado físico y son incapaces de identificar los actuadores responsables de la pérdida de control. Esta tesis aporta dos novedosos índices para detectar y medir la proximidad a una singularidad de Tipo II, capaces de identificar el par de actuadores responsables de la singularidad. Los dos índices son los ángulos entre los componentes lineal (T_i,j) y angular (O_i,j) de dos Twist Screw de Salida (OTS por sus siglas en inglés) normalizados i,j. Una singularidad Tipo II es detectada cuando T_i,j = O_i,j = 0 y su proximidad se mide mediante los mínimos ángulos T_i,j (minT) y O_i,j (minO) para los casos plano y espacial, respectivamente. La eficacia de los índices T_i,j y O_i,j se evalúa de forma teórica y experimental en un robot 3UPS+RPU y un mecanismo de cinco barras. Además, se propone un procedimiento experimental para el adecuado establecimiento del límite de cercanía a una singularidad de Tipo II mediante la aproximación progresiva del PR a una singularidad y la medición de la última posición controlable. Posteriormente, se desarrollan dos nuevos algoritmos deterministas para liberar y evitar una singularidad de Tipo II basados en minT y minO para PR no redundantes. minT y minO se utilizan para identificar los dos actuadores a mover para liberar o evitar el PR de una singularidad. Ambos algoritmos requieren una medición precisa de la pose alcanzada por el efector final. El algoritmo para liberar un PR de una configuración singular se aplica con éxito en un controlador híbrido basado en visión artificial para el PR 3UPS+RPU. El controlador utiliza un sistema de fotogrametría para medir la pose del robot debido a la degeneración del modelo cinemático en las proximidades de una singularidad. El algoritmo de evasión de singularidades Tipo II se aplica a la planificación offline y online de trayectorias no singulares para un mecanismo de cinco barras y el PR 3UPS+RPU. Estas aplicaciones verifican el bajo coste computacional y la mínima desviación introducida en la trayectoria original por los nuevos algoritmos. La implementación directa de un controlador de fuerza/posición en el PR 3UPS+RPU es insegura porque el paciente podría llevar involuntariamente al PR a una singularidad. Por lo tanto, esta tesis concluye presentando un novedoso controlador de fuerza/posición complementado con el algoritmo de evasión de singularidades de Tipo II. El nuevo controlador se evalúa durante rehabilitación activa de una pierna de maniquí y una pierna humana no lesionada. Los resultados muestran que el nuevo controlador combinado mantiene el PR 3UPS+RPU lejos de configuraciones singulares con una desviación mínima de la trayectoria original. Por lo tanto, esta tesis habilita el 3UPS+RPU PR para la rehabilitación segura de miembros inferiores lesionados. / [CAT] Els robots paral·lels (PR per les seues sigles en anglés) són mecanismes on l'efector final està unit a la base, mitjançant almenys dues cadenes cinemàtiques obertes. Els PRs ofereixen una gran capacitat de càrrega i alta precisió, la qual cosa els fa adequats per a diverses aplicacions, entre elles la interacció persona-robot. No obstant això, en les proximitats d'una singularitat Tipus II (singularitat dins de l'espai de treball), un PR perd el control sobre els moviments de l'efector final. La pèrdua de control representa un risc important per als usuaris, especialment en rehabilitació robòtica. En les últimes dècades, els PR s'han popularitzat en la rehabilitació de membres inferiors a causa de l'augment del nombre de persones que viuen amb limitacions físiques. Així, aquesta tesi tracta sobre la detecció i evació de singularitats de Tipus II per a assegurar total control d'un PR no redundant per a la rehabilitació i diagnòstic de genoll, denominat 3UPS+RPU. En la literatura, existeixen diversos índexs per a detectar i mesurar la proximitat a una singularitat basats en mètodes analítics i geomètrics. No obstant això, alguns d'aquests índexs manquen de significat físic i són incapaços d'identificar els actuadors responsables de la pèrdua de control. Aquesta tesi aporta dos nous índexs per a detectar i mesurar la proximitat a una singularitat de Tipus II, capaços d'identificar el parell d'actuadors responsables de la singularitat. Els dos índexs són els angles entre els components lineal (T_i,j) i angular (O_i,j) de dues Twist Screw d'Eixida (OTS per les seues sigles en engonals) normalitzats i,j. Una singularitat Tipus II és detectada quan T_i,j = O_i,j = 0 i la seua proximitat es mesura mitjançant els minimos angles T_i,j (minT) i O_i,j (minO) per als casos pla i espacial, respectivament. L'eficàcia dels índexs T_i,j i O_i,j es evalua de manera teòrica i experimental en un robot 3UPS+RPU i un mecanisme de cinc barres. A més, es proposa un procediment experimental per a l'adequat establiment del límit de proximitat a una singularitat de Tipus II mitjançant l'aproximació progressiva del PR a una singularitat i el mesurament de l'última posició controlable. Posteriorment, es desenvolupen dos nous algorismes deterministes per a alliberar i evadir una singularitat de Tipus II basats en minT i minO per a PR no redundants. minT i minO s'utilitzen per a identificar els dos actuadors a moure per a alliberar o evadir el PR d'una singularitat. Aquests algorismes requereixen un mesurament precís de la posa aconseguida per l'efector final. L'algorisme per a alliberar un PR d'una configuració singular s'aplica amb èxit en un controlador híbrid basat en visió artificial per al PR 3UPS+RPU. El controlador utilitza un sistema de fotogrametria per a mesurar la posa del robot a causa de la degeneració del model cinemàtic en les proximitats d'una singularitat. L'algorisme d'evació de singularitats Tipus II s'aplica a la planificació offline i en línia de trajectòries no singulars per a un mecanisme de cinc barres i el PR 3UPS+RPU. Aquestes aplicacions verifiquen el baix cost computacional i la mínima desviació introduïda en la trajectòria original pels nous algorismes. La implementació directa d'un controlador de força/posició en el PR 3UPS+RPU és insegura perquè el pacient podria portar involuntàriament al PR a una singularitat. Per tant, aquesta tesi conclou presentant un nou controlador de força/posició complementat amb l'algorisme d'evació de singularitats de Tipus II. El nou controlador s'avalua durant la rehabilitació activa d'una cama de maniquí i una cama humana no lesionada. Els resultats mostren que el nou controlador combinat manté el PR 3UPS+RPU lluny de configuracions singulars amb una desviació mínima de la trajectòria original. Per tant, aquesta tesi habilita el 3UPS+RPU PR per a la rehabilitació segura dels membres inferiors lesionats. / [EN] Parallel Robots (PR)s are mechanisms where the end-effector is linked to the base by at least two open kinematics chains. The PRs offer a high payload and high accuracy, making them suitable for various applications, including human robot interaction. However, in proximity to a Type II singularity (singularity within the workspace), a PR loses control over the movements of the end-effector. The loss of control represents a major risk for users, especially in robotic rehabilitation. In the last decades, PRs have become popular in lower limb rehabilitation because of the increment in the number of people living with physical limitations. Thus, this thesis is about the detection and avoidance of Type II singularities to ensure complete control of a non-redundant PR for knee rehabilitation and diagnosis named 3UPS+RPU. In the literature, several indices exist to detect and measure the closeness to a singular configuration based on analytical and geometrical methods. However, some of these indices have no physical meaning, and they are unable to identify the actuators responsible for the loss of control. This thesis contributes two novel indices to detect and measure the proximity to a Type II singularity capable of identifying the pair of actuators responsible for the singularity. The two indices are the angles between the linear (T_i,j) and the angular (O_i,j) components of two i,j normalised Output Twist Screws (OTSs). A Type II singularity is detected when the angles T_i,j = O_i,j = 0 and its closeness is measured by the minimum T_i,j (minT) and minimum O_i,j (minO) for planar and spatial cases, respectively. The effectiveness of the indices T_i,j and O_i,j is evaluated from a theoretical and experimental perspective in a 3UPS+RPU and a five bars mechanism. Moreover, an experimental procedure is proposed for setting a proper limit of closeness to a Type II singularity by the progressive approach of the PR to singular configuration and measuring the last controllable pose. Subsequently, two novel deterministic algorithms for releasing and avoiding Type II singularities based on minT and minO are developed for non-redundant PRs. The minT and minO are used to identify the two actuators to move for release or prevent the PR from the singularity. Both algorithms require an accurate measuring of the pose reached by the end-effector. The algorithm to release a PR from a singular configuration is successfully applied in a vision-based hybrid controller for the 3UPS+RPU PR. The controller uses a photogrammetry system to measure the pose of the robot due to the degeneration of the kinematic model in the vicinity of a singularity. The Type II singularity avoidance algorithm is applied to offline and online free-singularity trajectory planning for a five-bar mechanism and the 3UPS+RPU PR. These applications verify the low computation cost and the minimum deviation introduced in the original trajectory for both novel algorithms. The direct implementation of a force/position controller in the 3UPS+RPU PR is unsafe because the patient could unintentionally drive the PR to a Type II singularity. Therefore, this thesis concludes by presenting a novel force/position controller complemented with the Type II singularity avoidance algorithm. The complemented controller is evaluated during patient-active exercises in a mannequin leg and an uninjured human limb. The results show that the novel combined controller keeps the 3UPS+RPU PR far from singular configurations with a minimum deviation on the original trajectory. Hence, this thesis enables the 3UPS+RPU PR for the safe rehabilitation of injured lower limbs. / Pulloquinga Zapata, JL. (2023). A New Index for Detecting and Avoiding Type II Singularities for the Control of Non-Redundant Parallel Robots [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/194271


RENATA MACHADO AIEX 13 June 2003 (has links)
[pt] GRASP (Greedy Randomized Adaptive Search Procedure)é uma metaeurística de partidas múltiplas usada para obter soluções para problemas de otimização combinatória. Nesse trabalho. A metaheurística GRASP tem sido usada para obter soluções de qualidade para muitos problemas de otimização combinatória. Nesse trabalho é proposta uma metodologia para análise do comportamento da metaheurística GRASP. Também são propostas estratégias de hibridização com o religamento de caminhos. Essas estratégias foram desenvolvidas para o problema de atribuição de três índices (AP3) e para o problema de escalonamento de tarefas conhecido na literatura como job-shop schedulling problem (JSP) e são analisadas de acordo com a metodologia proposta. A metodologia para análise do comportamento do método GRASP pode ser usada para prever a partir da versão seqüencial do algoritmo, como a qualidade da solução do algoritmo implementado em paralelo irá variar. Os algoritmos GRASPs desenvolvidos para AP3 e para JSP foram paralelizados e os resultados são comparados aos resultados obtidos usando a metodologia proposta. / [en] GRASP (Greedy Randomized Adaptive Search Procedure) is a multi-start metaheuristic for combinatorial optimization problems. GRASP has been used to find quality solutions of several combinatorial optimization problems. In this work we describe a methodology for analysis of GRASP. Hybrid strategies of GRASP with path relinking are also proposed. These strategies are studied for the 3-index assignment problem (AP3) and for the job-shop schedulling problem (JSP) and are analyzed according to the methodology proposed. The methodology for analysis of GRASP is used to predict qualitatively how the quality of the solution varies in a parallel independent GRASP, using the data of the GRASP sequential version as input. The GRASPs for the AP3 and for the JSP are parallelized and the computational results are compared to the results obtained using the methodology proposed.

El Folleto de cursos de idiomas para extranjeros: análisis contrastivo (alemán-español) por tipos de emisor y subtextos

Fernández Sánchez, Francesc 14 January 2005 (has links)
The translationally relevant aim of this PhD is to account for the genre conventions of the LCLF mainly related to the persuasive and directive functions, by analyzing a bilingual corpus of parallel texts according to the method of contrastive textology. Genre conventions in this case are considered by sender types (public vs. private) and subtexts (text constituents functionally, semantically and formally defined) on the hypothesis that they will vary more depending on the sender type than on the language.The intralinguistic and interlinguistic analysis of the macrostructure and the recurrent textual segments, as well as of the functions (persuasive, referential and directive) characterizing both the LCLF as a persuasive leaflet and its three subtexts does not confirm the hypothesis. It does reflect, however, that the directive and persuasive functions prevail respectively in the public and private sender leaflets, as well as in those belonging to the Spanish and German subcorpora. / Esta tesis se plantea el objetivo traductivamente relevante de dar cuenta de las convenciones del FCIE, vinculadas principalmente a las funciones persuasiva y directiva, analizando un corpus bilingüe de textos paralelos según el método de la textología contrastiva. Dichas convenciones se ven consideradas por tipos de emisor (público y privado) y subtextos (unidades constitutivas del texto funcional, semántica y formalmente definidas) a partir de la hipótesis de que diferirán más dependiendo del tipo de emisor que de la lengua.El análisis intralingüístico e interlingüístico de la macroestructura y los segmentos textuales recurrentes, así como de las funciones (persuasiva, referencial y directiva) que caracterizan tanto el FCIE, en cuanto que folleto persuasivo, como sus tres subtextos no permite confirmar esa hipótesis. No obstante, sí evidencia cómo las funciones directiva y persuasiva priman respectivamente en los ejemplares de emisor público y privado, así como en los de los subcorpus español y alemán.

INTERFACE DE ANÁLISE DA INTERCONEXÃO EM UMA LAN USANDO CORBA / Software development (graphical user interface) that makes possible to analyze the interconnection in a LAN (Local Area Network) using CORBA (Common Object Request Broker Architecture)

MONTEIRO, Milson Silva 07 June 2002 (has links)
Made available in DSpace on 2016-08-17T14:52:43Z (GMT). No. of bitstreams: 1 Milson Monteiro.pdf: 1924077 bytes, checksum: 78f931b493f756dec0edee7a465e1099 (MD5) Previous issue date: 2002-06-07 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / This works concern software development (graphical user interface) that makes possible to analyze the interconnection in a LAN (Local Area Network) using CORBA (Common Object Request Broker Architecture) on distributed and heterogeneous environment among several outlying machines. This works presents paradigms of graphs theory: shortest paths problems (Dijkstra-Ford-Moore-Belman), maximum flow problems (Edmonds-Karp) and minimum cost flow problems (Busacker-Gowen) to formalize the interface development. We discoursed on the graphs theory and networks flows that are essentials to guarantee theoretical insight. / O objeto de estudo deste trabalho é o desenvolvimento de um software (interface gráfica do usuário) que possibilita analisar a interconexão de uma LAN (Local Area Network) usando CORBA (Common Object Request Broker Architecture) em ambientes distribuídos e heterogêneos entre diversas máquinas periféricas. Este trabalho apresenta os paradigmas da teoria de grafos: menor caminho (Dijkstra, Ford-Moore-Belman), fluxo máximo (Edmonds-Karp) e fluxo de custo mínimo (Busacker-Gowen) para formalizar o desenvolvimento da interface. Discorremos sobre a teoria de grafos e fluxos em redes que são relevantes para garantir o embasamento teórico.

Sistemas de arquivos paralelos: alternativas para a redução do gargalo no acesso ao sistema de arquivos / Parallel File Systems: alternatives to reduce the bottleneck in accessing the file system

Carvalho, Roberto Pires de 23 September 2005 (has links)
Nos últimos anos, a evolução dos processadores e redes para computadores de baixo custo foi muito maior se comparada com o aumento do desempenho dos discos de armazenamento de dados. Com isso, muitas aplicações estão encontrando dificuldades em atingir o pleno uso dos processadores, pois estes têm de esperar até que os dados cheguem para serem utilizados. Uma forma popular para resolver esse tipo de empecílio é a adoção de sistemas de arquivos paralelos, que utilizam a velocidade da rede local, além dos recursos de cada máquina, para suprir a deficiência de desempenho no uso isolado de cada disco. Neste estudo, analisamos alguns sistemas de arquivos paralelos e distribuídos, detalhando aqueles mais interessantes e importantes. Por fim, mostramos que o uso de um sistema de arquivos paralelo pode ser mais eficiente e vantajoso que o uso de um sistema de arquivos usual, para apenas um cliente. / In the last years, the evolution of the data processing power and network transmission for low cost computers was much bigger if compared to the increase of the speed of getting the data stored in disks. Therefore, many applications are finding difficulties in reaching the full use of the processors, because they have to wait until the data arrive before using. A popular way to solve this problem is to use a parallel file system, which uses the local network speed to avoid the performance bottleneck found in an isolated disk. In this study, we analyze some parallel and distributed file systems, detailing the most interesting and important ones. Finally, we show the use of a parallel file system can be more efficient than the use of a usual local file system, for just one client.

Sistemas de arquivos paralelos: alternativas para a redução do gargalo no acesso ao sistema de arquivos / Parallel File Systems: alternatives to reduce the bottleneck in accessing the file system

Roberto Pires de Carvalho 23 September 2005 (has links)
Nos últimos anos, a evolução dos processadores e redes para computadores de baixo custo foi muito maior se comparada com o aumento do desempenho dos discos de armazenamento de dados. Com isso, muitas aplicações estão encontrando dificuldades em atingir o pleno uso dos processadores, pois estes têm de esperar até que os dados cheguem para serem utilizados. Uma forma popular para resolver esse tipo de empecílio é a adoção de sistemas de arquivos paralelos, que utilizam a velocidade da rede local, além dos recursos de cada máquina, para suprir a deficiência de desempenho no uso isolado de cada disco. Neste estudo, analisamos alguns sistemas de arquivos paralelos e distribuídos, detalhando aqueles mais interessantes e importantes. Por fim, mostramos que o uso de um sistema de arquivos paralelo pode ser mais eficiente e vantajoso que o uso de um sistema de arquivos usual, para apenas um cliente. / In the last years, the evolution of the data processing power and network transmission for low cost computers was much bigger if compared to the increase of the speed of getting the data stored in disks. Therefore, many applications are finding difficulties in reaching the full use of the processors, because they have to wait until the data arrive before using. A popular way to solve this problem is to use a parallel file system, which uses the local network speed to avoid the performance bottleneck found in an isolated disk. In this study, we analyze some parallel and distributed file systems, detailing the most interesting and important ones. Finally, we show the use of a parallel file system can be more efficient than the use of a usual local file system, for just one client.

