• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 41
  • 9
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 58
  • 21
  • 21
  • 18
  • 18
  • 13
  • 12
  • 10
  • 9
  • 9
  • 9
  • 9
  • 9
  • 9
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Um mecanismo de busca especulativa de múltiplos fluxos de instruções / A multistreamed speculative instruction fetch mechanism

Santos, Rafael Ramos dos January 1997 (has links)
Este trabalho apresenta um novo modelo de busca especulativa de múltiplos fluxos de instruções em arquiteturas superescalares. A avaliação de desempenho de uma arquitetura superescalar com esta característica é também apresentada como forma de validar o modelo proposto e comparar seu desempenho frente a uma arquitetura superescalar real. O modelo em questão pretende eliminar a latência de busca de instruções introduzida pela ocorrência de comandos de desvio em pipelines superescalares. O desempenho de uma arquitetura superescalar dotada de escalonamento dinâmico de instruções, previsão de desvios e execução especulatva é bastante inferior ao desempenho máximo teórico esperado. Como demonstrado em outros trabalhos, isto ocorre devido às constantes quebras de fluxo, derivadas de instruções de desvio, e do conseqüente esvaziamento da fila de instruções. O emprego desta técnica permite encadear instruções pertencentes a diferentes fluxos lógicos, logo após a identificação de uma instrução de desvio, disponibilizando um maior número de instruções ao mecanismo de escalonamento dinâmico e diminuindo o número de ciclos com despacho nulo devido as quebras de fluxo. Algumas considerações sobre a implementação do modelo descrito são apresentadas ao final do trabalho assim como sugestões para trabalhos futuros. / This work presents a new model to fetch instructions along multiple streams in superscalar pipelines. Also, the performance evaluation of a superscalar architecture including this feature is presented in order to validate the model and to compare its performance with a real superscalar architecture. The proposed technique intents to eliminate the instruction fetch latency introduced by branch instructions in superscalar pipelines. The performance delivered by a superscalar architecture which incorporate dynamic instruction scheduling, branch prediction and speculative execution is not the expected one which should be at least proportional to the number of functional units. Related works have shown that constant stream breaks caused by disruptions in the sequential flow of control reduce the amount of instructions into the instruction queue. This technique allows instruction fetch through different logic streams, as soon as the branch instruction has been detected during the fetch. The scheduler needs a large instruction window to be able to schedule efficiently consequently the instructions window should hold as many instructions as possible to allow an efficient schedule. The improvement realized by the proposed scheme is to increase the size of the instruction window by putting there more instructions avoiding interruptions on the event of branch occurrence. Some considerations about the implementation of this model are presented at final as well as suggestions to future works.
32

DCE: the dynamic conditional execution in a multipath control independent architecture / DCE: execução dinâmica condicional em uma arquitetura de múltiplos fluxos com independência de controle

Santos, Rafael Ramos dos January 2003 (has links)
Esta tese apresenta DCE, ou Execução Dinâmica Condicional, como uma alternativa para reduzir o custo da previsão incorreta de desvios. A idéia básica do modelo apresentado é buscar e executar todos os caminhos de desvios que obedecem à certas restrições no que diz respeito a complexidade e tamanho. Como resultado, tem-se um número menor de desvios sendo previstos e consequentemente um número menor de desvios previstos incorretamente. DCE busca todos os caminhos dos desvios selecionados evitando quebras no fluxo de busca quando estes desvios são buscados. Os caminhos buscados dos desvios selecionados são então executados mas somente o caminho correto é completado. Nesta tese nós propomos uma arquitetura para executar múltiplos caminhos dos desvios selecionados. A seleção dos desvios ocorre baseada no tamanho do desvio e em outras condições. A seleção de desvios simples e complexos permite a predicação dinâmica destes desvios sem a necessidade da existência de um conjunto específico de instruções nem otimizações especiais por parte do compilador. Além disso, é proposta também uma técnica para reduzir a sobrecarga gerada pela execução dos múltiplos caminhos dos desvios selecionados. O desempenho alcançado atinge níveis de até 12% quando um previsor de desvios Local é usado no DCE e um previsor Global é usado na máquina de referência. Quando ambas as máquinas empregam previsão Local, há um aumento de desempenho da ordem de 3-3.5%. / This thesis presents DCE, or Dynamic Conditional Execution, as an alternative to reduce the cost of mispredicted branches. The basic idea is to fetch all paths produced by a branch that obey certain restrictions regarding complexity and size. As a result, a smaller number of predictions is performed, and therefore, a lesser number of branches are mispredicted. DCE fetches through selected branches avoiding disruptions in the fetch flow when these branches are fetched. Both paths of selected branches are executed but only the correct path commits. In this thesis we propose an architecture to execute multiple paths of selected branches. Branches are selected based on the size and other conditions. Simple and complex branches can be dynamically predicated without requiring a special instruction set nor special compiler optimizations. Furthermore, a technique to reduce part of the overhead generated by the execution of multiple paths is proposed. The performance achieved reaches levels of up to 12% when comparing a Local predictor used in DCE against a Global predictor used in the reference machine. When both machines use a Local predictor, the speedup is increased by an average of 3-3.5%.
33

RST: Reuse through Speculation on Traces / RST: Reuso Especulativo de Traces

Pilla, Mauricio Lima January 2004 (has links)
Na presente tese, apresentamos uma nova abordagem para combinar reuso e prvisão de seqüências dinâmicas de instruções, chamada Reuso por Especulação em traces (RST). Esta técnica permite a identificação dinâmica de traces de instruções redundantes ou previsíveis e o reuso (especulativo ou não) desses traces. RST procura resolver a questão de traces que não são reusados por seus valores de entradas de Traces (DTM). Em estudo anteriores, esses traces foram contabilizados como sendo cerca de 69% de todos os traces reusáveis. Uma das maiores vantagens de RST sobre a combinação de um mecanismo de previsão com uma técnica de reuso de valores em que mecanismos não são relacionados é que RST não necessita de tabelas adicionais para o armazenamento dos valores a serem previstos. A aplciação de reuso e previsão de valores pela simples combinação de mecanismos pode necessitar de uma quantidade proibitiva de espaço de armazenamento. No mecanismo RST, os valores já estão presentes na Tabela de Memorização de Traces, não incorrendo em custos adicionais para lê-los se comparado com uma técnica não-especulativa de reuso de traces. O contexto de entrada de cada trace (os valores de entrada de todas as instruções contidas no trace) já armazenam os valores para o teste de reuso, os quais podem ser também utilizados para previsão de valores para o teste de reuso, os quais podem ser também utilizados para previsão de valores. As principais contribuições de nosso trabalho incluem: (i) um framework de reuso especulativo de traces que pode ser modificado para diferentes arquiteturas de processadores; (ii) definição das modificações necessárias em um processador superescalar e superpipeline para implementar nosso mecanismo; (iii) estudo de questões de implementação relacionadas à essa arquitetura; (iv) estudo dos limites de desempenho da nossa técnica; (v) estudo de uma implementação RST limitada por fatores realísticos; e (vi) ferramentas de simulação que podem ser utilizadas em outros estudos, representando um processador superescalar e superpipeline em detalhes. Salientamos que, em uma arquitetura utilizando mecanismos realistas de estimativa de confiança das previsões, nossa técnica RST consegue atingir speedups médios (médias harmônicas) de 1.29 sobre uma arquitetura sem reuso e 1.09 sobre uma técnica não-especulativa de reuso de traces (DTM). / In this thesis, we present a novel approach to combine both reuse and prediction of dynamic sequences of instructions called Reuse through Speculation on Traces (RST). Our technique allows the dynamic identification of instruction traces that are redundant or predictable, and the reuse (speculative or not) of these traces. RST addresses the issue, present on Dynamic Trace Memoization (DTM), of traces not being reused because some of their inputs are not ready for the reuse test. These traces were measured to be 69% of all reusable traces in previous studies. One of the main advantages of RST over just combining a value prediction technique with an unrelated reuse technique is that RST does not require extra tables to store the values to be predicted. Applying reuse and value prediction in unrelated mechanisms but at the same time may require a prohibitive amount of storage in tables. In RST, the values are already stored in the Trace Memoization Table, and there is no extra cost in reading them if compared with a non-speculative trace reuse technique. . The input context of each trace (the input values of all instructions in the trace) already stores the values for the reuse test, which may also be used for prediction. Our main contributions include: (i) a speculative trace reuse framework that can be adapted to different processor architectures; (ii) specification of the modifications in a superscalar, superpipelined processor in order to implement our mechanism; (iii) study of implementation issues related to this architecture; (iv) study of the performance limits of our technique; (v) a performance study of a realistic, constrained implementation of RST; and (vi) simulation tools that can be used in other studies which represent a superscalar, superpipelined processor in detail. In a constrained architecture with realistic confidence, our RST technique is able to achieve average speedups (harmonic means) of 1.29 over the baseline architecture without reuse and 1.09 over a non-speculative trace reuse technique (DTM).
34

Reusing values in a dynamic conditional execution architecture / Reusando Valores em uma Arquitetura com Execução Condicional Dinâmica

Santos, Tatiana Gadelha Serra dos January 2004 (has links)
A Execução Condicional Dinâmica (DCE) é uma alternativa para redução dos custos relacionados a desvios previstos incorretamente. A idéia básica é buscar todos os fluxos produzidos por um desvio que obedecem algumas restrições relativas à complexidade e tamanho. Como conseqüência, um número menor de previsões é executado, e assim, um número mais baixo de desvios é incorretamente previsto. Contudo, tal como outras soluções multi-fluxo, o DCE requer uma estrutura de controle mais complexa. Na arquitetura DCE, é observado que várias réplicas da mesma instrução são despachadas para as unidades funcionais, bloqueando recursos que poderiam ser utilizados por outras instruções. Essas réplicas são geradas após o ponto de convergência dos diversos fluxos em execução e são necessárias para garantir a semântica correta entre instruções dependentes de dados. Além disso, o DCE continua produzindo réplicas até que o desvio que gerou os fluxos seja resolvido. Assim, uma seção completa do código pode ser replicado, reduzindo o desempenho. Uma alternativa natural para esse problema é reusar essas seções (ou traços) que são replicadas. O objetivo desse trabalho é analisar e avaliar a efetividade do reuso de valores na arquitetura DCE. Como será apresentado, o princípio do reuso, em diferentes granularidades, pode reduzir efetivamente o problema das réplicas e levar a aumentos de desempenho. / The Dynamic Conditional Execution (DCE) is an alternative to reduce the cost of mispredicted branches. The basic idea is to fetch all paths produced by a branch that obey certain restrictions regarding complexity and size. As a consequence, a smaller number of predictions is performed, and therefore, a lower number branches is mispredicted. Nevertheless, as other multipath solutions, DCE requires a more complex control engine. In a DCE architecture, one may observe that several replicas of the same instruction are dispatched to the functional units, blocking resources that might be used by other instructions. Those replicas are produced after the join point of the paths and are required to guarantee the correct semantic among data dependent instructions. Moreover, DCE continues producing replicas until the branch that generated the paths is resolved. Thus, a whole section of code may be replicated, harming performance. A natural alternative to this problem is the attempt to reuse those replicated sections, namely the replicated traces. The goal of this work is to analyze and evaluate the effectiveness of value reuse in DCE architecture. As it will be presented, the principIe of reuse, in different granularities, can reduce effectively the replica problem and lead to performance improvements.
35

Tópicos em cosmologia com campos escalares

Santos, José Jamilton Rodrigues dos 20 May 2011 (has links)
Made available in DSpace on 2015-05-14T12:13:59Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 989729 bytes, checksum: 3e97939bd59206a6ed90c89ca0467d17 (MD5) Previous issue date: 2011-05-20 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Cosmological models involving scalar fields allow the description of a phase of accelerated cosmic expansion and thus appear as a promising alternative for the study of the cosmic inflation and dark energy. We are interested here in analyzing these cosmological models. In particular, we will explore cosmological solutions based on the first order formalism. The inclusion of this method favors the search for analytic solutions with scalar fields in cosmology, and this is particularly important when we consider the component of nonrelativistic matter (dust) in the presence of dark energy, in order to construct a cosmological model capable of explaining, in good agreement with observational data, the current phase of cosmic acceleration. Considering a regime of Lorentz violation, the use of this method allowed us to verify that new considerations must be implemented so that the inflationary regime can now solve the problem of initial conditions. Another question of interest, which can be addressed with the aid of the first order formalism, takes into account the possibility of the dark energy equation of state parameter to be a constant other than −1 and in this case we get that a lot of fine-tuning is needed, which should be interpreted as strong evidence in favor of a dynamic model of dark energy. We also introduce the so-called deformation method on the slow-roll inflationary models, and we explore this framework in applications of current interest to this branch of research. / Modelos cosmológicos envolvendo campos escalares permitem a descrição de uma fase de expansão cósmica acelerada e, portanto, se apresentam como uma alternativa promissora no estudo da inflação cósmica e da energia escura. Estamos aqui interessados em analisar esses modelos cosmológicos; em especial, vamos explorar soluções cosmológicas baseadas no formalismo de primeira ordem. A inclusão desse método favorece a busca por soluções analíticas na cosmologia com campos escalares e isso é particularmente interessante no caso em que consideramos o componente de matéria não relativística (poeira) na presença da energia escura, afim de construir um modelo cosmológico capaz de explicar, em bom acordo com os dados observacionais, a atual fase de aceleração cósmica. Considerando um regime de violação de Lorentz, a utilização desse método nos permitiu verificar que novas considerações devem ser implementadas, para que o regime inflacionário possa resolver o problema das condições iniciais. Outra questão de interesse, que pode ser analisada com auxílio do formalismo de primeira ordem, leva em conta a possibilidade da equação de estado da energia escura ser um constante qualquer diferente de −1 e, nesse caso, obtemos que uma grande quantidade de ajuste fino é necessária, o que deve ser interpretado como uma forte evidência em favor de um modelo dinâmico de energia escura. Também introduzimos o chamado método de deformação a modelos inflacionários sob o regime de rolagem lenta e exploramos essa ferramenta em aplicações de corrente interesse na literatura.
36

Modelos gêmeos em teorias de campos escalares

Dantas, Joseclécio Dutra 13 March 2012 (has links)
Made available in DSpace on 2015-05-14T12:14:03Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 3752182 bytes, checksum: 63a51d4864db299b4b98e396d8d6e622 (MD5) Previous issue date: 2012-03-13 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / In this work we do an investigation of new features of so-called k-defects, which are topological defects with non-canonical kinetic term. Specifically, we study a class of k-defects in models of scalar field theories distinct from standard theory but discribing, case to case, the very same defect structure with the very same energy density as that described by the theory governed by standard Lagrange density. In teories which presents such relationships, distinct models support the same topological structure; why call them of twinlike models. We then build a model of twin theory, which we call ALTW model, and find the relationships between them, including relations between the potentials of both, which, although distinct, they present minima that are connected by the same field solution, for the case of static and stable configurations. The results are ilustrated with several examples. In order to distinguish between theories, we analyze the situation in which the component T11 of the energy-momentum tensor is nonzero, which is equivalent to breaking the pressureless condition required to ensure stability of static solutions. With the same purpose of distinction, we did a study of linear stability of defects and we found that, although representing the same defect structure, case to case, a theory is not a simple reparametrization of the other. We also made an extension of the twin nature between more general models of real scalar field theries and an application to braneworld scenario. We also investigated the behavior twin between standard and tachyonic models in FRW cosmology, where the scalar field evolves over time. / No presente trabalho fazemos uma investigação de novas características dos chamados kdefeitos, que são defeitos topológicos com termo cinético não-canônico. Especificamente, estudamos uma classe de k-defeitos em modelos de teorias de campos escalares distintos da teoria padrão mas que descrevem, caso a caso, o mesmo defeito com a mesma densidade de energia daquele descrito pela teoria governada pela densidade lagrangiana padrão. Em teorias que apresentam tais relações, modelos distintos suportam a mesma estrutura topológica; daí chamá-los de modelos gêmeos. Construímos, então, um modelo de teoria gêmea, que denominamos modelo ALTW, e encontramos as relações existentes entre eles, incluindo as relações entre os potenciais de ambos, que, embora distintos, apresentam mínimos conectados pelo mesmo campo solução, para o caso de configurações estáticas e estáveis. Os resultados são ilustrados com vários exemplos. Com a finalidade de distinguir as teorias, analisamos a situação em que a componente T11 do tensor energia-momento é não-nula, o que é equivalente a quebrar a condição de pressão nula necessária para garantir a estabilidade das soluções estáticas. Com o mesmo objetivo de distinção, fizemos um estudo da estabilidade linear dos defeitos e obtivemos que, embora representem o mesmo defeito, caso a caso, uma teoria não é uma simples reparametrização da outra. Fizemos ainda uma extensão da natureza gêmea entre modelos mais gerais de teorias de campo escalar real e uma aplicação ao cenário de brana. Investigamos também o comportamento gêmeo entre os modelos padrão e taquiônico em cosmologia FRW, onde o campo escalar evolui com o tempo.
37

Princípio de equivalência, partículas não massivas com E = 0 e partículas massivas com E < m'c POT.2' em espaços curvos e aplicações /

Castiñeiras, Jorge. January 2002 (has links)
Orientador: George Emanuel Avraam Matsas / Banca: Elcio Adballa / Banca: Adilson José da Silva / Banca: Patricio Letelier Sotomayor / Banca: Alberto Vasquez Saa / Resumo:Este trabalho é motivado pelo caráter relativo da radiação emitida por cargas aceleradas e em especial pela possibilidade da existência dum análogo quântico para o princípio de equivalência. Para tanto, discutimos, primeiramente, a quantização do setor de baixas energias de um campo escalar sem massa no espaço-tempo de Reissner-Nordstrom. Isto nos permite a análise de processos envolvendo partículas escalares de baixas energias ("soft") presentes no exterior de buracos negros. Em particular, calculamos a resposta de uma fonte escalar estática em interação com a radiação Hawking, considerando tanto o caso em que o campo encontra-se no vácuo de Unruh quanto no de Hartle-Hawking. Esta resposta é comparada com aquela obtida quando a fonte está uniformemente acelerada no vácuo usual no espaço-tempo de Minkowski com a mesma aceleração própria. Mostramos que ambas as respostas são, em geral, diferentes. A igualdade é verificada no limite em que a carga do buraco vai para zero. Ou seja, quando o buraco negro de Reissner-Nordstrom transforma-se num buraco negro de Schwarzschild. A relevância conceitual destes resultados é analisada. Seguidamente analisamos a possibilidade de detectar partículas de baixa energia no caso em que estas possuem massa de repouso m e energia total E < m'c POT.2' no "Rindler wedge", fora de buracos negros de Reissner-Nordstrom e nos espaços-tempos de estrelas relativísticas e não relativísticas. Para tanto, usamos detectores do tipo UnruhDeWitt para calcular a taxa de detecção correspondente em cada caso. A posição média das partículas é identificada com a média espacial da probabilidade de excitação dos detectores, os quais supõem-se distribuídos em todo o espaço. Mostramos que os nossos resultados estão em concordância com as predições clássicas da Relatividade... / Abstract:The present work is motivated by the relative character of the radiation emited by an acelerated charge and in particular by the possibility of the existence of a quantum equivalence principle. For this purpose we discuss the quantization of the low-energy sector of a massless scalar field in the Reissner-Nordstrom spacetime. This allows the analysis of processes involving soft scalar particles occurring outside charged black holes. In particular, we compute the response of a static scalar source interacting with Hawking radiation using the Unruh (and the Hartle-Hawking) vacuum. This response is compared with the one obtained when the source is uniformly accelerated in the usual vacuum of the Minkowski spacetime with the same proper acceleration. We show that both responses are in general different in opposition to the result obtained when the Reissner-Nordstrom black hole is replaced by a Schwarzschild one. The conceptual relevance of this result is commented. Next, we analyze the possibility of detecting free low energy elementary particles with rest mass m and total energy E < m'c POT.2' in the Rindler wedge, outside Reissner-Nordstrom black holes and in the spacetime of relativistic (and non-relativistic) stars, and use Unruh-DeWitt-like detectors to calculate the associated particle detection rate in each case. The (mean) particle position is identified with the spatial average of the excitation probability of the detectors, which are supposed to cover the whole space. Our results are shown to be in harmony with General Relativity classical predictions. Eventually we reconcile our conclusions with Earth-based experiments which are in good agreement with E'> OU =' m'c POT.2' / Doutor
38

Aspectos quânticos e clássicos da instabilidade de campos fundamentais em espaços-tempos astrofísicos /

MENDES, R. F. P., (Raissa Fernandes Pessoa) January 2014 (has links)
Orientador: George Emanuel Avraam Matsas / Banca: Alberto Vazquez Saa / Banca: Luis Raul Weber Abramo / Banca: Elcio Abdalla / Banca: Eduardo Cantero Marino / Resumo: Campos escalares, além de possibilitarem uma descrição efetiva de interações mais complexas, surgem como extensões interessantes da Relatividade Geral, candidatos para matéria escura ou como peças-chave em modelos cosmológicos. Sua fenomenologia é rica e pode, a princípio, ser acessada por meio de experimentos e observações. Em particular, configurações astrofísicas que seriam estáveis de acordo com a Relatividade Geral podem se tornar instáveis devido à presença, na Natureza, de certos campos escalares não minimamente acoplados com a gravitação. Recentemente, mostrou-se que essa instabilidade pode se manifestar quanticamente por meio da amplificação das flutuações quânticas do campo e da densidade de energia de vácuo. Esse efeito de dominância do vácuo induzida pela gravitação evidencia o importante papel que podem ter efeitos quânticos em espaços-tempos curvos. O trabalho apresentado nesta Tese tem como objetivo contribuir para um maior entendimento desse efeito, em duas frentes principais. Primeiramente, buscamos esclarecer a relação entre a descrição quântica da instabilidade e a análise clássica dos modos quasinormais do sistema. Em particular, mostramos como flutuações quânticas podem ser simuladas por perturbações clássicas com uma amplitude adequada. Em segundo lugar, estudamos a estabilidade de campos não minimamente acoplados no espaço-tempo de cascas finas esferoidais e com rotação. O objetivo principal desse estudo é caracterizar, em modelos simples, como o espaço de parâmetros da instabilidade se altera quando relaxamos hipóteses assumidas anteriormente, como estaticidade e simetria esférica do espaço-tempo de fundo. A consideração desses aspectos é motivada principalmente pela possibilidade de se colocar vínculos sobre os acoplamentos permitidos na Natureza com base em dados observacionais... / Abstract: Besides serving as effective models for more complex interactions, scalar fields also arise as interesting extensions of General Relativity, candidates for dark matter or key ingredients in cosmological models. Their phenomenology is rich and may, in principle, be tested by experiments and observations. In particular, generalrelativistic stable spacetimes can be made unstable under the presence of certain nonminimally coupled free scalar fields. It has been shown that this instability may express itself quantum-mechanically through the amplification of quantum fluctuations and of the vacuum energy density of those fields. This effect of vacuum dominance induced by gravity illustrates the important role that quantum effects in curved spacetimes may have. The work presented in this Thesis aims at contributing to a deeper understanding of this effect, along two main lines. First, we clarify the relationship between the quantum approach to instability and the classical analysis of quasinormal modes. In particular, we show how quantum fluctuations can be simulated by classical perturbations of a certain amplitude. Second, we study the stability of nonminimally coupled fields in the spacetime of spheroidal and rotating thin shells of matter, in order to characterize how the parameter space of the instability changes when we drop previously assumed assumptions such as staticity and spherical symmetry of the background spacetime. The consideration of these aspects is mainly motivated by the possibility of using observational data of relativistic stars to constrain the field couplings present in Nature. Possible observational implications of the instability and its relation to other results in the literature are also discussed / Doutor
39

DCE: the dynamic conditional execution in a multipath control independent architecture / DCE: execução dinâmica condicional em uma arquitetura de múltiplos fluxos com independência de controle

Santos, Rafael Ramos dos January 2003 (has links)
Esta tese apresenta DCE, ou Execução Dinâmica Condicional, como uma alternativa para reduzir o custo da previsão incorreta de desvios. A idéia básica do modelo apresentado é buscar e executar todos os caminhos de desvios que obedecem à certas restrições no que diz respeito a complexidade e tamanho. Como resultado, tem-se um número menor de desvios sendo previstos e consequentemente um número menor de desvios previstos incorretamente. DCE busca todos os caminhos dos desvios selecionados evitando quebras no fluxo de busca quando estes desvios são buscados. Os caminhos buscados dos desvios selecionados são então executados mas somente o caminho correto é completado. Nesta tese nós propomos uma arquitetura para executar múltiplos caminhos dos desvios selecionados. A seleção dos desvios ocorre baseada no tamanho do desvio e em outras condições. A seleção de desvios simples e complexos permite a predicação dinâmica destes desvios sem a necessidade da existência de um conjunto específico de instruções nem otimizações especiais por parte do compilador. Além disso, é proposta também uma técnica para reduzir a sobrecarga gerada pela execução dos múltiplos caminhos dos desvios selecionados. O desempenho alcançado atinge níveis de até 12% quando um previsor de desvios Local é usado no DCE e um previsor Global é usado na máquina de referência. Quando ambas as máquinas empregam previsão Local, há um aumento de desempenho da ordem de 3-3.5%. / This thesis presents DCE, or Dynamic Conditional Execution, as an alternative to reduce the cost of mispredicted branches. The basic idea is to fetch all paths produced by a branch that obey certain restrictions regarding complexity and size. As a result, a smaller number of predictions is performed, and therefore, a lesser number of branches are mispredicted. DCE fetches through selected branches avoiding disruptions in the fetch flow when these branches are fetched. Both paths of selected branches are executed but only the correct path commits. In this thesis we propose an architecture to execute multiple paths of selected branches. Branches are selected based on the size and other conditions. Simple and complex branches can be dynamically predicated without requiring a special instruction set nor special compiler optimizations. Furthermore, a technique to reduce part of the overhead generated by the execution of multiple paths is proposed. The performance achieved reaches levels of up to 12% when comparing a Local predictor used in DCE against a Global predictor used in the reference machine. When both machines use a Local predictor, the speedup is increased by an average of 3-3.5%.
40

RST: Reuse through Speculation on Traces / RST: Reuso Especulativo de Traces

Pilla, Mauricio Lima January 2004 (has links)
Na presente tese, apresentamos uma nova abordagem para combinar reuso e prvisão de seqüências dinâmicas de instruções, chamada Reuso por Especulação em traces (RST). Esta técnica permite a identificação dinâmica de traces de instruções redundantes ou previsíveis e o reuso (especulativo ou não) desses traces. RST procura resolver a questão de traces que não são reusados por seus valores de entradas de Traces (DTM). Em estudo anteriores, esses traces foram contabilizados como sendo cerca de 69% de todos os traces reusáveis. Uma das maiores vantagens de RST sobre a combinação de um mecanismo de previsão com uma técnica de reuso de valores em que mecanismos não são relacionados é que RST não necessita de tabelas adicionais para o armazenamento dos valores a serem previstos. A aplciação de reuso e previsão de valores pela simples combinação de mecanismos pode necessitar de uma quantidade proibitiva de espaço de armazenamento. No mecanismo RST, os valores já estão presentes na Tabela de Memorização de Traces, não incorrendo em custos adicionais para lê-los se comparado com uma técnica não-especulativa de reuso de traces. O contexto de entrada de cada trace (os valores de entrada de todas as instruções contidas no trace) já armazenam os valores para o teste de reuso, os quais podem ser também utilizados para previsão de valores para o teste de reuso, os quais podem ser também utilizados para previsão de valores. As principais contribuições de nosso trabalho incluem: (i) um framework de reuso especulativo de traces que pode ser modificado para diferentes arquiteturas de processadores; (ii) definição das modificações necessárias em um processador superescalar e superpipeline para implementar nosso mecanismo; (iii) estudo de questões de implementação relacionadas à essa arquitetura; (iv) estudo dos limites de desempenho da nossa técnica; (v) estudo de uma implementação RST limitada por fatores realísticos; e (vi) ferramentas de simulação que podem ser utilizadas em outros estudos, representando um processador superescalar e superpipeline em detalhes. Salientamos que, em uma arquitetura utilizando mecanismos realistas de estimativa de confiança das previsões, nossa técnica RST consegue atingir speedups médios (médias harmônicas) de 1.29 sobre uma arquitetura sem reuso e 1.09 sobre uma técnica não-especulativa de reuso de traces (DTM). / In this thesis, we present a novel approach to combine both reuse and prediction of dynamic sequences of instructions called Reuse through Speculation on Traces (RST). Our technique allows the dynamic identification of instruction traces that are redundant or predictable, and the reuse (speculative or not) of these traces. RST addresses the issue, present on Dynamic Trace Memoization (DTM), of traces not being reused because some of their inputs are not ready for the reuse test. These traces were measured to be 69% of all reusable traces in previous studies. One of the main advantages of RST over just combining a value prediction technique with an unrelated reuse technique is that RST does not require extra tables to store the values to be predicted. Applying reuse and value prediction in unrelated mechanisms but at the same time may require a prohibitive amount of storage in tables. In RST, the values are already stored in the Trace Memoization Table, and there is no extra cost in reading them if compared with a non-speculative trace reuse technique. . The input context of each trace (the input values of all instructions in the trace) already stores the values for the reuse test, which may also be used for prediction. Our main contributions include: (i) a speculative trace reuse framework that can be adapted to different processor architectures; (ii) specification of the modifications in a superscalar, superpipelined processor in order to implement our mechanism; (iii) study of implementation issues related to this architecture; (iv) study of the performance limits of our technique; (v) a performance study of a realistic, constrained implementation of RST; and (vi) simulation tools that can be used in other studies which represent a superscalar, superpipelined processor in detail. In a constrained architecture with realistic confidence, our RST technique is able to achieve average speedups (harmonic means) of 1.29 over the baseline architecture without reuse and 1.09 over a non-speculative trace reuse technique (DTM).

Page generated in 0.0528 seconds