• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 245
  • 55
  • 3
  • Tagged with
  • 304
  • 304
  • 187
  • 175
  • 107
  • 86
  • 78
  • 76
  • 57
  • 56
  • 55
  • 40
  • 33
  • 32
  • 30
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

As conseqüências de culturas de alto desempenho para os profissionais de organizações do segmento químico e farmacêutico

Bayma, Lígia Helena Fürbringer 18 May 2011 (has links)
Made available in DSpace on 2016-04-25T20:20:13Z (GMT). No. of bitstreams: 1 Ligia Helena Furbringer Bayma.pdf: 424359 bytes, checksum: 16b586cc6c7319e538146e84382ae327 (MD5) Previous issue date: 2011-05-18 / The dissertation is about the Consequences of High performance targets for the company workers (employees), in companies that has it as basic premises, that let those premises very clear for anyone, through their attitudes, through their speeches, values and which are exposed everywhere, to be reached to every single person inside the company. These high performance values are also formal and frequently disseminated to all employees. To explain this subject, high performance culture, we will use as focal point for exemples, the pharmaceutical industry as well as employees interviewed to build a sample, which objectives are: To analyze the consequences of such high performance exigencies to employees in companies that has high performance aim, as overuse of pressure and its consequences for people; in their behavior , attitudes, analyzing the permissive behavior to achieve high performance results, where everything becomes possible and valid; and finally, how these consequences are seen (if loss of quality of life or an illness) and dealed as an individual limit and not a result of overuse of work limits, work processes. To conclude, we will be able to realize that as much as we still having a matrix that has this aims and therefore stimulates this kind of behavior for extreamly high results, we will still have these over stimulation for workers in the present time and also for the future generation, because this is part of the culture. The proposal of this research is to help companies to check and to begin to analyze high performance measures, that can be stablished to minimize such high performance impacts to the workers, and that through people they still can have high organizational results with better quality of life for the employees, and better than that, they will be able to develop healthy companies, which are made basically by people / A dissertação aqui apresentada trata das consequências das culturas de alto desempenho ou performance para as pessoas que estão dentro das organizações onde essas culturas são utilizadas como premissa básica. Essas organizações exprimem seu desejo de alto desempenho, por meio de suas atitudes, discursos presentes na descrição de seus valores, divulgados amplamente em todos os espaços de ampla circulação e de fácil visualização. Esses valores são ainda divulgados formalmente e com frequência a todos os seus funcionários. Para tratar desse assunto, teremos como ponto focal e como exemplo dessa cultura a indústria farmacêutica, assim como os respondentes de uma amostra qualitativa sistemática, que são os profissionais que nela trabalham ou trabalharam. Com isso, temos por objetivo: Analisar as consequências das exigências da cultura de alto desempenho para os profissionais que trabalham em organizações que as explicitam, evidenciando a pressão sofrida pelos indivíduos trabalhadores; o desconforto gerado por essa pressão; os comportamentos e atitudes de alto desempenho, fundamentados na permissividade na busca de resultados. Analisar também o modo como as consequências geradas para os indivíduos são tratadas: como limites individuais e não como um resultado do processo de trabalho. Concluiremos que, enquanto houver a gestão matriz incentivando a continuidade desses hábitos, eles continuarão presentes nas futuras gerações, e isso está inserido na cultura vigente. A proposta desta pesquisa é auxiliar as corporações com relação às medidas que podem ser tomadas para minimizar esses impactos na condução de seus profissionais. Tem-se também o intuito de que as organizações se tornem mais saudáveis, proporcionando aos seus funcionários melhor qualidade de vida e, consequentemente, de trabalho
72

As conseqüências de culturas de alto desempenho para os profissionais de organizações do segmento químico e farmacêutico

Bayma, Lígia Helena Fürbringer 18 May 2011 (has links)
Made available in DSpace on 2016-04-26T14:53:02Z (GMT). No. of bitstreams: 1 Ligia Helena Furbringer Bayma.pdf: 424359 bytes, checksum: 16b586cc6c7319e538146e84382ae327 (MD5) Previous issue date: 2011-05-18 / The dissertation is about the Consequences of High performance targets for the company workers (employees), in companies that has it as basic premises, that let those premises very clear for anyone, through their attitudes, through their speeches, values and which are exposed everywhere, to be reached to every single person inside the company. These high performance values are also formal and frequently disseminated to all employees. To explain this subject, high performance culture, we will use as focal point for exemples, the pharmaceutical industry as well as employees interviewed to build a sample, which objectives are: To analyze the consequences of such high performance exigencies to employees in companies that has high performance aim, as overuse of pressure and its consequences for people; in their behavior , attitudes, analyzing the permissive behavior to achieve high performance results, where everything becomes possible and valid; and finally, how these consequences are seen (if loss of quality of life or an illness) and dealed as an individual limit and not a result of overuse of work limits, work processes. To conclude, we will be able to realize that as much as we still having a matrix that has this aims and therefore stimulates this kind of behavior for extreamly high results, we will still have these over stimulation for workers in the present time and also for the future generation, because this is part of the culture. The proposal of this research is to help companies to check and to begin to analyze high performance measures, that can be stablished to minimize such high performance impacts to the workers, and that through people they still can have high organizational results with better quality of life for the employees, and better than that, they will be able to develop healthy companies, which are made basically by people / A dissertação aqui apresentada trata das consequências das culturas de alto desempenho ou performance para as pessoas que estão dentro das organizações onde essas culturas são utilizadas como premissa básica. Essas organizações exprimem seu desejo de alto desempenho, por meio de suas atitudes, discursos presentes na descrição de seus valores, divulgados amplamente em todos os espaços de ampla circulação e de fácil visualização. Esses valores são ainda divulgados formalmente e com frequência a todos os seus funcionários. Para tratar desse assunto, teremos como ponto focal e como exemplo dessa cultura a indústria farmacêutica, assim como os respondentes de uma amostra qualitativa sistemática, que são os profissionais que nela trabalham ou trabalharam. Com isso, temos por objetivo: Analisar as consequências das exigências da cultura de alto desempenho para os profissionais que trabalham em organizações que as explicitam, evidenciando a pressão sofrida pelos indivíduos trabalhadores; o desconforto gerado por essa pressão; os comportamentos e atitudes de alto desempenho, fundamentados na permissividade na busca de resultados. Analisar também o modo como as consequências geradas para os indivíduos são tratadas: como limites individuais e não como um resultado do processo de trabalho. Concluiremos que, enquanto houver a gestão matriz incentivando a continuidade desses hábitos, eles continuarão presentes nas futuras gerações, e isso está inserido na cultura vigente. A proposta desta pesquisa é auxiliar as corporações com relação às medidas que podem ser tomadas para minimizar esses impactos na condução de seus profissionais. Tem-se também o intuito de que as organizações se tornem mais saudáveis, proporcionando aos seus funcionários melhor qualidade de vida e, consequentemente, de trabalho
73

High performance trace replay event simulation of parallel programs behavior / Ferramenta de alto desempenho para análise de comportamento de programas paralelos baseada em rastos de execução

Korndorfer, Jonas Henrique Muller January 2016 (has links)
Sistemas modernos de alto desempenho compreendem milhares a milhões de unidades de processamento. O desenvolvimento de uma aplicação paralela escalável para tais sistemas depende de um mapeamento preciso da utilização recursos disponíveis. A identificação de recursos não utilizados e os gargalos de processamento requere uma boa análise desempenho. A observação de rastros de execução é uma das técnicas mais úteis para esse fim. Infelizmente, o rastreamento muitas vezes produz grandes arquivos de rastro, atingindo facilmente gigabytes de dados brutos. Portanto ferramentas para análise de desempenho baseadas em rastros precisam processar esses dados para uma forma legível e serem eficientes a fim de permitirem uma análise rápida e útil. A maioria das ferramentas existentes, tais como Vampir, Scalasca e TAU, focam no processamento de formatos de rastro com semântica associada, geralmente definidos para lidar com programas desenvolvidos com bibliotecas populares como OpenMP, MPI e CUDA. No entanto, nem todas aplicações paralelas utilizam essas bibliotecas e assim, algumas vezes, essas ferramentas podem não ser úteis. Felizmente existem outras ferramentas que apresentam uma abordagem mais dinâmica, utilizando um formato de arquivo de rastro aberto e sem semântica específica. Algumas dessas ferramentas são Paraver, Pajé e PajeNG. Por outro lado, ser genérico tem custo e assim tais ferramentas frequentemente apresentam baixo desempenho para o processamento de grandes rastros. O objetivo deste trabalho é apresentar otimizações feitas para o conjunto de ferramentas PajeNG. São apresentados o desenvolvimento de um estratégia de paralelização para o PajeNG e uma análise de desempenho para demonstrar nossos ganhos. O PajeNG original funciona sequencialmente, processando um único arquivo de rastro que contém todos os dados do programa rastreado. Desta forma, a escalabilidade da ferramenta fica muito limitada pela leitura dos dados. Nossa estratégia divide o arquivo em pedaços permitindo seu processamento em paralelo. O método desenvolvido para separar os rastros permite que cada pedaço execute em um fluxo de execução separado. Nossos experimentos foram executados em máquinas com acesso não uniforme à memória (NUMA).Aanálise de desempenho desenvolvida considera vários aspectos como localidade das threads, o número de fluxos, tipo de disco e também comparações entre os nós NUMA. Os resultados obtidos são muito promissores, escalando o PajeNG cerca de oito a onze vezes, dependendo da máquina. / Modern high performance systems comprise thousands to millions of processing units. The development of a scalable parallel application for such systems depends on an accurate mapping of application processes on top of available resources. The identification of unused resources and potential processing bottlenecks requires good performance analysis. The trace-based observation of a parallel program execution is one of the most helpful techniques for such purpose. Unfortunately, tracing often produces large trace files, easily reaching the order of gigabytes of raw data. Therefore tracebased performance analysis tools have to process such data to a human readable way and also should be efficient to allow an useful analysis. Most of the existing tools such as Vampir, Scalasca, TAU have focus on the processing of trace formats with a fixed and well-defined semantic. The corresponding file format are usually proposed to handle applications developed using popular libraries like OpenMP, MPI, and CUDA. However, not all parallel applications use such libraries and so, sometimes, these tools cannot be useful. Fortunately, there are other tools that present a more dynamic approach by using an open trace file format without specific semantic. Some of these tools are the Paraver, Pajé and PajeNG. However the fact of being generic comes with a cost. These tools very frequently present low performance for the processing of large traces. The objective of this work is to present performance optimizations made in the PajeNG tool-set. This comprises the development of a parallelization strategy and a performance analysis to set our gains. The original PajeNG works sequentially by processing a single trace file with all data from the observed application. This way, the scalability of the tool is very limited by the reading of the trace file. Our strategy splits such file to process several pieces in parallel. The created method to split the traces allows the processing of each piece in each thread. The experiments were executed in non-uniform memory access (NUMA) machines. The performance analysis considers several aspects like threads locality, number of flows, disk type and also comparisons between the NUMA nodes. The obtained results are very promising, scaling up the PajeNG about eight to eleven times depending on the machine.
74

Cell selection to minimize power in high-performance industrial microprocessor designs / Seleção de portas lógicas para minimização de potência em projetos de microprocessadores de alto desempenho

Reimann, Tiago Jose January 2016 (has links)
Este trabalho aborda o problema de dimensionamento portas lógicas e assinalamento de Vt para otimização de potência, área e temporização em circuitos integrados modernos. O fluxo proposto é aplicado aos conjuntos de circuitos de teste dos Concursos do International Symposium on Physical Design (ISPD) de 2012 e 2013. Este fluxo também é adapatado e avaliado nos estágios pós posicionamento e roteamento global em projetos industriais de circuitos integrados, que utilizam uma ferramenta precisa de análise estática de temporização. As técnicas propostas geram as melhores soluções para todos os circuitos de teste do Concurso do ISPD 2013 (no qual foi a ferramenta vencedora), com em média 8% menos consumo de potência estática quando comparada com os outros concorrentes. Além disso, após algumas modificações nos algoritmos, nós reduzimos o consumo em mais 10% em média a pontência estáticas com relação aos resultados do concurso. O foco deste trabalho é desenvolver e aplicar um algoritmo estado-da-arte de seleção portas lógicas para melhorar ainda mais projetos industriais de alto desempenho já otimizados após as fases de posicionamento e roteamento do fluxo de projeto físico industrial. Vamos apresentar e discutir vários problemas encontrados quando da aplicação de técnicas de otimização global em projetos industriais reais que não são totalmente cobertos em publicações encontradas na literatura. Os métodos propostos geram as melhores soluções para todos os circuitos de referência no Concurso do ISPD 2013, no qual foi a solução vencedora. Considerando a aplicação industrial, as técnicas propostas reduzem a potência estática em até 18,2 %, com redução média de 10,4 %, sem qualquer degradação na qualidade de temporização do circuito. / This work addresses the gate sizing and Vt assignment problem for power, area and timing optimization in modern integrated circuits (IC). The proposed flow is applied to the Benchmark Suites of the International Symposium on Physical Design (ISPD) 2012 and 2013 Contests. It is also adapted and evaluated in the post placement and post global routing stage of an industrial IC design flow using a sign-off static timing analysis engine. The proposed techniques are able to generate the best solutions for all benchmarks in the ISPD 2013 Contest (in which we were the winning team), with on average 8% lower leakage with respect to all other contestants. Also, after some refinements in the algorithms, we reduce leakage by another 10% on average over the contest results. The focus of this work is to develop and apply a state-of-the-art cell selection algorithm to further improve already optimized high-performance industrial designs after the placement and routing stages of the industrial physical design flow. We present the basic concepts involved in the gate sizing problem and how earlier literature addresses it. Several problems found when applying global optimization techniques in real-life industrial designs, which are not fully covered in publications found in literature, are presented and discussed. Considering the industrial application, the proposed techniques reduce leakage power by up to 18.2%, with average reduction of 10.4% without any degradation in timing quality.
75

A benchmark suite for distributed stream processing systems / Um benchmark suite para sistemas distribuídos de stream processing

Bordin, Maycon Viana January 2017 (has links)
Um dado por si só não possui valor algum, a menos que ele seja interpretado, contextualizado e agregado com outros dados, para então possuir valor, tornando-o uma informação. Em algumas classes de aplicações o valor não está apenas na informação, mas também na velocidade com que essa informação é obtida. As negociações de alta frequência (NAF) são um bom exemplo onde a lucratividade é diretamente proporcional a latência (LOVELESS; STOIKOV; WAEBER, 2013). Com a evolução do hardware e de ferramentas de processamento de dados diversas aplicações que antes levavam horas para produzir resultados, hoje precisam produzir resultados em questão de minutos ou segundos (BARLOW, 2013). Este tipo de aplicação tem como característica, além da necessidade de processamento em tempo-real ou quase real, a ingestão contínua de grandes e ilimitadas quantidades de dados na forma de tuplas ou eventos. A crescente demanda por aplicações com esses requisitos levou a criação de sistemas que disponibilizam um modelo de programação que abstrai detalhes como escalonamento, tolerância a falhas, processamento e otimização de consultas. Estes sistemas são conhecidos como Stream Processing Systems (SPS), Data Stream Management Systems (DSMS) (CHAKRAVARTHY, 2009) ou Stream Processing Engines (SPE) (ABADI et al., 2005). Ultimamente estes sistemas adotaram uma arquitetura distribuída como forma de lidar com as quantidades cada vez maiores de dados (ZAHARIA et al., 2012). Entre estes sistemas estão S4, Storm, Spark Streaming, Flink Streaming e mais recentemente Samza e Apache Beam. Estes sistemas modelam o processamento de dados através de um grafo de fluxo com vértices representando os operadores e as arestas representando os data streams. Mas as similaridades não vão muito além disso, pois cada sistema possui suas particularidades com relação aos mecanismos de tolerância e recuperação a falhas, escalonamento e paralelismo de operadores, e padrões de comunicação. Neste senário seria útil possuir uma ferramenta para a comparação destes sistemas em diferentes workloads, para auxiliar na seleção da plataforma mais adequada para um trabalho específico. Este trabalho propõe um benchmark composto por aplicações de diferentes áreas, bem como um framework para o desenvolvimento e avaliação de SPSs distribuídos. / Recently a new application domain characterized by the continuous and low-latency processing of large volumes of data has been gaining attention. The growing number of applications of such genre has led to the creation of Stream Processing Systems (SPSs), systems that abstract the details of real-time applications from the developer. More recently, the ever increasing volumes of data to be processed gave rise to distributed SPSs. Currently there are in the market several distributed SPSs, however the existing benchmarks designed for the evaluation this kind of system covers only a few applications and workloads, while these systems have a much wider set of applications. In this work a benchmark for stream processing systems is proposed. Based on a survey of several papers with real-time and stream applications, the most used applications and areas were outlined, as well as the most used metrics in the performance evaluation of such applications. With these information the metrics of the benchmark were selected as well as a list of possible application to be part of the benchmark. Those passed through a workload characterization in order to select a diverse set of applications. To ease the evaluation of SPSs a framework was created with an API to generalize the application development and collect metrics, with the possibility of extending it to support other platforms in the future. To prove the usefulness of the benchmark, a subset of the applications were executed on Storm and Spark using the Azure Platform and the results have demonstrated the usefulness of the benchmark suite in comparing these systems.
76

Reforço de pilares de concreto armado por meio de encamisamento com concreto de alto desempenho. / Strengthening of reinforced concrete columns by means of high-performance concrete jacketing

Takeuti, Adilson Roberto 22 March 1999 (has links)
Este estudo apresenta os resultados de uma investigação experimental constituída de três séries de ensaio, cada uma envolvendo dois modelos: um pilar básico de concreto armado, representando o pilar a ser reforçado e um pilar reforçado por camisa de concreto de alto desempenho com várias características. Todos os pilares básicos tinham a seção quadrada de 150 mm x 150 mm com altura de 1200 mm. Eles foram produzidos com concreto de 18 MPa de resistência nominal à compressão, armadura longitudinal com quatro barras de 8 mm de diâmetro e armadura transversal com estribos de 6.3mm de diâmetro com espaçamento de 90 mm. Os parâmetros que foram variados nas camisas de reforço foram: a) dois valores de espessura (tj); b) três valores de taxa de armadura transversal (*sw) utilizando telas soldadas ou armadura de estribos; c) adição de fibras curtas de aço. A resistência nominal à compressão do concreto utilizado em todas as camisas foi de 65 MPa, caracterizando-se portanto um concreto de alta resistência. Os pilares foram submetidos à compressão axial por meio de uma máquina hidráulica servo-controlada. Os ensaios foram realizados com controle de deslocamento, adotando-se uma velocidade de 0.005mm/s para o deslocamento do pistão. A força aplicada e as deformações continuaram sendo medidas após o alcance da força de ruína, para se avaliar o comportamento pós-pico, até se atingir uma força residual de cerca de 50% da força de pico. Modelos de cálculo da resistência última dos pilares reforçados foram analisados. Também foram testados modelos de confinamento e ductilidade para os elementos reforçados. / This study presents the results of an experimental investigation in three series of tests, each one involving two models: a basic reinforced concrete column, which represents the column to ge strengthened, and an identical basic column strengthned by a high-performance concrete jacket with variable characteristics. All the basic columns had a 150 mm x 150 mm square section and a 1,200 mm length. They were made of a 18 MPa nominal strength concrete and reinforced with four 8 mm diameter steel bars and 6.3mm diameter stirrups each. The jacket characteristics varied as follows: a) two thickness values(tj); b) three values of transverse reinforcement ratio (*sw) using welded wire steel meshes or ordinary stirrups; c) addition of short steel fibers. The nominal concrete compressive strength used in all the jackets was 65 MPa, therefore a high-strength concrete. The columns were subjected to monotonic axial compression by means of a servo-controlled hydraulic machine. A displacement increasing rate of 0.005 mm/sec at the top of the column was adopted. Load and strain measurements continued after the ultimate load to evaluate the post-peak behavior, up to a residual load-bearing capacity of about 50% of the peak load. Several calculation hypotheses were tested to evaluate the ultime strength of the rehabilitated columns. Also confinement mechanisms and ductility of the members were analyzed.
77

Study of load distribution measures for high-performance applications / Estudos de medidas de distribuição de carga para aplicação de alto desempenho

Rodrigues, Flavio Alles January 2016 (has links)
Balanceamento de carga é essencial para que aplicações paralelas tenham desempenho adequado. Conforme sistemas de computação paralelos crescem, o custo de uma má distribuição de carga também aumenta. Porém, o comportamento dinâmico que a carga computacional possui em certas aplicações pode induzir disparidades na carga atribuída a cada recurso. Portanto, o repetitivo processo de redistribuição de carga realizado durante a execução é crucial para que problemas de grande escala que possuam tais características possam ser resolvidos. Medidas que quantifiquem a distribuição de carga são um importante aspecto desse procedimento. Por estas razões, métricas frequentemente utilizadas como indicadores da distribuição de carga em aplicações paralelas são investigadas nesse estudo. Dado que balanceamento de carga é um processo dinâmico e recorrente, a investigação examina como tais métricas quantificam a distribuição de carga em intervalos regulares durante a execução da aplicação paralela. Seis métricas são avaliadas: percent imbalance, imbalance percentage, imbalance time, standard deviation, skewness e kurtosis. A análise revela virtudes e deficiências que estas medidas possuem, bem como as diferenças entres as mesmas como descritores da distribuição de carga em aplicações paralelas. Uma investigação como esta não tem precedentes na literatura especializada. / Load balance is essential for parallel applications to perform at their highest possible levels. As parallel systems grow, the cost of poor load distribution increases in tandem. However, the dynamic behavior the distribution of load possesses in certain applications can induce disparities in computational loads among resources. Therefore, the process of repeatedly redistributing load as execution progresses is critical to achieve the performance necessary to compute large scale problems with such characteristics. Metrics quantifying the load distribution are an important facet of this procedure. For these reasons, measures commonly used as load distribution indicators in HPC applications are investigated in this study. Considering the dynamic and recurrent aspect in load balancing, the investigation examines how these metrics quantify load distribution at regular intervals during a parallel application execution. Six metrics are evaluated: percent imbalance, imbalance percentage, imbalance time, standard deviation, skewness, and kurtosis. The analysis reveals the virtues and deficiencies each metric has, as well as the differences they register as descriptors of load distribution progress in parallel applications. As far as we know, an investigation as the one performed in this work is unprecedented.
78

Inferência de redes de regulação gênica usando algoritmo de busca exaustiva em clusters de GPUs

Borelli, Fabrizio Ferreira January 2013 (has links)
Orientador: Luiz Carlos da Silva Rozante / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Pós-Graduação em Ciência da Computação, 2013
79

Escalonamento on-line eficiente de programas fork-join recursivos do tipo divisão e conquista em MPI / Efficent on-line scheduling of recursive fork-join programs on MPI

Mor, Stefano Drimon Kurz January 2010 (has links)
Esta Dissertação de Mestrado propõe dois novos algoritmos para tornar mais eficiente o escalonamento on-line de tarefas com dependências estritas em agregados de computadores que usam como middleware para troca de mensagens alguma implementação da MPI (até a versão 2.1). Esses algoritmos foram projetados tendo-se em vista programas construídos no modelo de programação fork/join, onde a operação de fork é usada sobre uma chamada recursiva da função. São eles: 1. O algoritmo RatMD, implementado através de uma biblioteca de primitivas do tipo map-reduce, que funciona para qualquer implementação MPI, com qualquer versão da norma. Utilizado para minimizar o tempo de execução de uma computação paralela; e 2. O algoritmo RtMPD, implementado através de um sistema distribuído sobre daemons gerenciadores de processos criados dinamicamente com a implementação MPICH2 (que implementa a MPI-2). Utilizado para permitir execuções de instâncias maiores de programas paralelos dinâmicos. Ambos se baseiam em roubo de tarefas, que é a estratégia de balanceamento de carga mais difundida na literatura. Para ambos os algoritmos apresenta-se modelagem téorica de custos. Resultados experimentais obtidos ficam dentro dos limites teóricos calculados. RatMD provê uma redução no tempo de execução de até 80% em relação ao algoritmo usual (baseado em round-robin), com manutenção do speedup próximo ao linear e complexidade espacial idêntica à popular implementação com round-robin. RtMPD mantém, no mínimo, o mesmo desempenho que a implementação canônica do escalonamento em MPICH2, dobrando-se o limite físico de processos executados simultaneamente por cada nó. / This Master’s Dissertation proposes two new algorithms for improvement on on-line scheduling of dynamic-created tasks with strict dependencies on clusters of computers using MPI (up to version 2.1) as its middleware for message-passing communication. These algorithms were built targeting programs written on the fork-join model, where the fork operation is always called over an recursive function call. They are: 1. RatMD, implemented as a map-reduce library working for any MPI implementation, on whatever norm’s version. Used for performance gain; and 2. RtMPD, implemented as a distributed system over dynamic-generated processes manager daemons with MPICH2 implentation of MPI. Used for executing larger instances of dynamic parallel programs. Both algorithms are based on the (literature consolidated) work stealing technique and have formal guarantees on its execution time and load balancing. Experimental results are within theoretical bounds. RatMD shows an improvement on the performance up to 80% when paired with more usual algorithms (based on round-robin strategy). It also provides near-linear speedup and just about the same space-complexity on similar implementations. RtMPD keeps, at minimum, the very same performance of the canonical MPICH2 implementation, near doubling the physical limit of simultaneous program execution per cluster node.
80

Code profiling and optimization in transactional memory systems / Profiling e otimização de código em sistemas de memória transacional

Cordeiro, Silvio Ricardo January 2014 (has links)
Memória Transacional tem se demonstrado um paradigma promissor na implementação de aplicações concorrentes sob memória compartilhada que busquem evitar um modelo de sincronização baseado em locks. Em vez de sujeitar a execução a um acesso exclusivo com base no valor de um lock que é compartilhado por threads concorrentes, uma aplicação sob Memória Transacional tenta executar seções críticas de modo otimista, desfazendo as modificações no caso de um conflito de acesso à memória. Entretanto, apesar de a abordagem baseada em locks ter adquirido um número significativo de ferramentas automatizadas para a depuração, profiling e otimização automatizados (por ser uma das técnicas de sincronização mais antigas e mais bem pesquisadas), o campo da Memória Transacional ainda é comparativamente recente, e programadores frequentemente precisam adaptar manualmente suas aplicações transacionais ao encontrar problemas de eficiência. Este trabalho propõe um sistema no qual o profiling de código em uma implementação de Memória Transacional simulada é utilizado para caracterizar uma aplicação transacional, formando a base para uma parametrização automatizada do respectivo sistema especulativo para uma execução eficiente do código em questão. Também é proposta uma abordagem de escalonamento de threads guiado por profiling em uma implementação de Memória Transacional baseada em software, usando dados coletados pelo profiler para prever a probabilidade de conflitos e determinar que thread escalonar com base nesta previsão. São apresentados os resultados de experimentos sob ambas as abordagens. / Transactional Memory has shown itself to be a promising paradigm for the implementation of shared-memory concurrent applications that eschew a lock-based model of data synchronization. Rather than conditioning exclusive access on the value of a lock that is shared across concurrent threads, Transactional Memory attempts to execute critical sections optimistically, rolling back the modifications in the event of a data access conflict. However, while the lock-based approach has acquired a significant body of debugging, profiling and automated optimization tools (as one of the oldest and most researched synchronization techniques), the field of Transactional Memory is still comparably recent, and programmers are usually tasked with an unguided manual tuning of their transactional applications when facing efficiency problems. We propose a system in which code profiling in a simulated hardware implementation of Transactional Memory is used to characterize a transactional application, which forms the basis for the automated tuning of the underlying speculative system for the efficient execution of that particular application. We also propose a profile-guided approach to the scheduling of threads in a software-based implementation of Transactional Memory, using collected data to predict the likelihood of conflicts and determine what thread to schedule based on this prediction. We present the results achieved under both designs.

Page generated in 0.0741 seconds