1 |
Geração de código otimizado visando a exploração de paralelismo na arquitetura IPNoSysCouto, Juliene Vieira do 09 September 2016 (has links)
Submitted by Lara Oliveira (lara@ufersa.edu.br) on 2017-04-07T22:12:32Z
No. of bitstreams: 1
JulieneVC_DISSERT.pdf: 3209854 bytes, checksum: 18b673023a841a782fbe0c6f32a66254 (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-04-13T15:05:50Z (GMT) No. of bitstreams: 1
JulieneVC_DISSERT.pdf: 3209854 bytes, checksum: 18b673023a841a782fbe0c6f32a66254 (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-04-13T15:05:59Z (GMT) No. of bitstreams: 1
JulieneVC_DISSERT.pdf: 3209854 bytes, checksum: 18b673023a841a782fbe0c6f32a66254 (MD5) / Made available in DSpace on 2017-04-13T15:06:08Z (GMT). No. of bitstreams: 1
JulieneVC_DISSERT.pdf: 3209854 bytes, checksum: 18b673023a841a782fbe0c6f32a66254 (MD5)
Previous issue date: 2016-09-09 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Parallel architectures require optimized code that exploits its new features. Some architectures follow the paradigm of Von Neumann machine, while others differ from this model, such as IPNoSys processor. This processor is based on network-on-chip and features a package-driven computer model driven which reflects in its programming model. Initially, this architecture had an assembler and a simulator and needed a compiler. In later papers compilers for IPNoSys have been developed, but none fully explored the features of this architecture. Thus, the objective of this paper is to define a code optimization step in IPNoSys compiler, considering characteristics unexploited as parallelism and improving your generated code. The optimization module offers three levels of optimization. In order to evaluate the created module, made a comparison of the execution time and the size of codes generated in the three levels of optimization. It was obtained that an optimization level showed better run time, but generated applications with a larger size, while another level showed a smaller size. Furthermore, there was an improvement in the generated code / As arquiteturas paralelas necessitam de código otimizado que explore seus novos recursos. Algumas arquiteturas seguem o paradigma da máquina de Von Neumann, enquanto que outras divergem desse modelo, um exemplo é o processador IPNoSys. Esse processador foi baseado em redes-em-chip e apresenta um modelo de computação dirigido a pacotes o que reflete no seu modelo de programação. Inicialmente, essa arquitetura possuía um montador e um simulador e necessitava de um compilador. Em trabalhos posteriores compiladores para a IPNoSys foram desenvolvidos, mas nenhum explorou completamente as características dessa arquitetura. Com isso, o objetivo deste trabalho é definir uma etapa de otimização de código no compilador IPNoSys, considerando características não exploradas como o paralelismo e melhorando seu código gerado. O módulo de otimização oferece três níveis de otimização. A fim de avaliar o módulo criado, efetuou-se uma comparação do tempo de execução e do tamanho dos códigos gerados nos três níveis de otimização. Foi obtido que um nível de otimização apresentou melhor tempo de execução, porém gerou aplicações com um maior tamanho, enquanto que outro nível apresentou um menor tamanho. Além disso, houve uma melhoria nos códigos gerados / 2017-04-07
|
2 |
O impacto da hierarquia de memória sobre a arquitetura IPNoSysDamasceno, Alexandro Lima 27 July 2016 (has links)
Submitted by Lara Oliveira (lara@ufersa.edu.br) on 2017-04-10T21:22:16Z
No. of bitstreams: 1
AlexandroLD_DISSERT.pdf: 4478017 bytes, checksum: b25b015c0ae937a3ba2f2718697a3977 (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-04-13T14:42:00Z (GMT) No. of bitstreams: 1
AlexandroLD_DISSERT.pdf: 4478017 bytes, checksum: b25b015c0ae937a3ba2f2718697a3977 (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-04-13T15:00:20Z (GMT) No. of bitstreams: 1
AlexandroLD_DISSERT.pdf: 4478017 bytes, checksum: b25b015c0ae937a3ba2f2718697a3977 (MD5) / Made available in DSpace on 2017-04-13T15:07:49Z (GMT). No. of bitstreams: 1
AlexandroLD_DISSERT.pdf: 4478017 bytes, checksum: b25b015c0ae937a3ba2f2718697a3977 (MD5)
Previous issue date: 2016-07-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Over the years, with the as technology advances, the search for improvements in the
performance of computer systems is notable. The computer systems have evolved in
both processing capacity and complexity of the implemented architectures. In such
systems it is crucial to use memories since they are responsible for storing data to be
processed. Considering an ideal environment, the memories should have a unlimited
storage capacity, instant data access and the extremely low cost per bit. But in real
systems the memories do not exhibit these characteristics. Storage capacity, speed and
cost per bit are factors that increase in proportion to each other. One technique that
is used to balance these factors and improve the performance of computer systems
is the memory hierarchy. In the scenario of new technologies and proposals for new
organizations of processors, a model that has been adopted by designers of computer
systems is the use of MPSoCs (multiprocessor systems on chip), which has a higher
energy and computational e ciency. In this scenario with many processing elements,
networks using on-chip (NoC - networks-on-chip) is more e cient use of the buses.
An NoC consists of a set of routers and interconnected channels forming a switched
network. The cores are connected to network terminals and communication occurs
through the exchange of packets. These NoCs have traditionally been exclusively
designed for communication SoCs. However, a project of an unconventional architecture
decided to integrate processing and communication in an NoC. This architecture is
known for IPNoSys. The IPNoSys (Integrated Processing NoC System) architecture is an
unconventional processor that uses networks on chip and implements processing units
and routing to handle and process instructions. It takes advantage of the characteristics
of NoC, such as scalability and parallel communication, for implement e ectively runs
programs that exploit parallelism-level threads. Currently, IPNoSys architecture has
four memory physically distributed at the corners of the network, but represent a
unified addressing. Each memory module is associated with an access unit in charge of
managing it. Given the current organization of IPNoSys memories, this work proposes
to develop a new memory hierarchy system for IPNoSys and investigate the possible
impact on performance and the programming model / Aolongo dos anos,coma ascensão das tecnologias, a busca por melhorias no desempenho
dos sistemas computacionais é algo notável. Os sistemas computacionais evoluíram
tanto em capacidade de processamento como em complexidade das arquiteturas
implementadas. Nesses sistemas é crucial a utilização de memórias uma vez que elas são
responsáveis pelo armazenamento de dados que serão processados. Considerando um
ambiente ideal, as memórias deveriam ter uma capacidade de armazenamento ilimitado,
o acesso de dados imediato e o custo por bit extremamente baixo. Porém nos sistemas
reais as memórias não apresentam essas características. Capacidade de armazenamento,
velocidade e custo por bit são fatores que crescem proporcionalmente entre si. Uma
técnica que é utilizada para balancear esses fatores e melhorar o desempenho dos
sistemas computacionais é a hierarquia de memória. No cenário de novas tecnologias
e propostas de novas organizações de processadores, um modelo que vem sendo
adotada pelos projetistas de sistemas computacionais é o uso de MPSoCs (sistemas
multiprocessados integrados em chip), que apresenta uma maior eficiência energética e
computacional. Nesse cenário com muitos elementos de processamento, a utilização
de redes em chip (NoC - networks-on-chip) se mostra mais eficiente que o uso de
barramentos. Uma NoC consiste em um conjunto de roteadores e canais interligados
formando uma rede chaveada. Os núcleos são conectados aos terminais da rede e
a comunicação ocorre pela troca de pacotes. Essas NoCs foram tradicionalmente
projetadas exclusivamente para a comunicação em SoCs. Entretanto, um projeto de uma
arquitetura não convencional resolveu integrar processamento e comunicação em uma
NoC. Essa arquitetura é conhecida por IPNoSys. A arquitetura IPNoSys (Integrated
Processing NoC System) é um processador não convencional que utiliza redes em chip e
implementa unidades de processamento e roteamento para tratar e processar instruções.
Aproveita as características das NoCs, como escalabilidade e comunicação paralela, para
implementar de maneira eficiente execuções de programas que exploram paralelismo em
nível de threads. Atualmente, a arquitetura IPNoSys possui quatro memórias fisicamente
distribuidas nos cantos da rede, mas que representam um endereçamento unificado.
Cada módulo de memória é associado a uma unidade de acesso que se encarregam
de gerenciá-la. Diante da atual organização de memórias da IPNoSys, esse trabalho
desenvolveu um novo sistema de hierarquia de memórias para o IPNoSys e investigou
os possíveis impactos sobre o desempenho e o modelo de programação / 2017-04-10
|
3 |
Implementa??o da t?cnica de software pipelining na rede em chip IPNoSySMedeiros, Aparecida Lopes de 21 February 2014 (has links)
Made available in DSpace on 2014-12-17T15:48:10Z (GMT). No. of bitstreams: 1
AparecidaLM_DISSERT.pdf: 8059053 bytes, checksum: a243ee0772a785a00c8a0670955a7cae (MD5)
Previous issue date: 2014-02-21 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / Alongside the advances of technologies, embedded systems are increasingly
present in our everyday. Due to increasing demand for functionalities, many
tasks are split among processors, requiring more efficient communication
architectures, such as networks on chip (NoC). The NoCs are structures that
have routers with channel point-to-point interconnect the cores of system on
chip (SoC), providing communication. There are several networks on chip in the
literature, each with its specific characteristics. Among these, for this work was
chosen the Integrated Processing System NoC (IPNoSyS) as a network on chip
with different characteristics compared to general NoCs, because their routing
components also accumulate processing function, ie, units have functional able
to execute instructions. With this new model, packets are processed and routed
by the router architecture. This work aims at improving the performance of
applications that have repetition, since these applications spend more time in
their execution, which occurs through repeated execution of his instructions.
Thus, this work proposes to optimize the runtime of these structures by
employing a technique of instruction-level parallelism, in order to optimize the
resources offered by the architecture. The applications are tested on a
dedicated simulator and the results compared with the original version of the
architecture, which in turn, implements only packet level parallelism / Com os avan?os tecnol?gicos os sistemas embarcados est?o cada vez mais
presentes em nosso cotidiano. Devido a crescente demanda por
funcionalidades, as fun??es s?o distribu?das entre os processadores,
demandando arquiteturas de comunica??o mais eficientes, como as redes em
chip (Network-on-Chip - NoC). As NoCs s?o estruturas que possuem
roteadores com canais ponto-a-ponto que interconectam os cores do SoC
(System-on-Chip), provendo comunica??o. Existem diversas redes em chip na
literatura, cada uma com suas caracter?sticas espec?ficas. Dentre essas, para
este trabalho foi a escolhida a IPNoSyS (Integrated Processing NoC System)
por ser uma rede em chip com caracter?sticas diferenciadas em rela??o ?s
NoCs em geral, pois seus componentes de roteamento acumulam tamb?m a
fun??o de processamento, ou seja, possuem unidades funcionais capazes de
executar instru??es. Com esse novo modelo, pacotes s?o processados e
roteados pela arquitetura do roteador. Este trabalho visa melhorar o
desempenho das aplica??es que possuem repeti??o, pois essas aplica??es
gastam um tempo maior na sua execu??o, o que se d? pela repetida execu??o
de suas instru??es. Assim, este trabalho prop?e otimizar o tempo de execu??o
dessas estruturas, atrav?s do emprego de uma t?cnica de paralelismo em n?vel
de instru??es, visando melhor aproveitar os recursos oferecidos pela
arquitetura. As aplica??es s?o testadas em um simulador dedicado, e seus
resultados comparados com a vers?o original da arquitetura, a qual prov?
paralelismo apenas em n?vel de pacotes
|
4 |
Projeto de Sistemas Integrados de Prop?sito Geral Baseados em Redes em Chip Expandindo as Funcionalidades dos Roteadores para Execu??o de Opera??es: A plataforma IPNoSysAra?jo, S?lvio Roberto Fernandes de 30 March 2012 (has links)
Made available in DSpace on 2014-12-17T15:47:00Z (GMT). No. of bitstreams: 1
SilvioRFA_TESE.pdf: 5797455 bytes, checksum: 65da3be6db5be8c8185888e31c1f294c (MD5)
Previous issue date: 2012-03-30 / It bet on the next generation of computers as architecture with multiple processors and/or
multicore processors. In this sense there are challenges related to features interconnection, operating
frequency, the area on chip, power dissipation, performance and programmability. The mechanism of
interconnection and communication it was considered ideal for this type of architecture are the
networks-on-chip, due its scalability, reusability and intrinsic parallelism. The networks-on-chip
communication is accomplished by transmitting packets that carry data and instructions that
represent requests and responses between the processing elements interconnected by the network.
The transmission of packets is accomplished as in a pipeline between the routers in the network, from
source to destination of the communication, even allowing simultaneous communications between
pairs of different sources and destinations. From this fact, it is proposed to transform the entire
infrastructure communication of network-on-chip, using the routing mechanisms, arbitration and
storage, in a parallel processing system for high performance. In this proposal, the packages are
formed by instructions and data that represent the applications, which are executed on routers as
well as they are transmitted, using the pipeline and parallel communication transmissions. In
contrast, traditional processors are not used, but only single cores that control the access to memory.
An implementation of this idea is called IPNoSys (Integrated Processing NoC System), which has an
own programming model and a routing algorithm that guarantees the execution of all instructions in
the packets, preventing situations of deadlock, livelock and starvation. This architecture provides
mechanisms for input and output, interruption and operating system support. As proof of concept
was developed a programming environment and a simulator for this architecture in SystemC, which
allows configuration of various parameters and to obtain several results to evaluate it / Aposta-se na pr?xima gera??o de computadores como sendo de arquitetura com m?ltiplos
processadores e/ou processadores com v?rios n?cleos. Neste sentido h? desafios relacionados aos
mecanismos de interconex?o, frequ?ncia de opera??o, ?rea ocupada em chip, pot?ncia dissipada,
programabilidade e desempenho. O mecanismo de interconex?o e comunica??o considerado ideal
para esse tipo de arquitetura s?o as redes em chip, pela escalabilidade, paralelismo intr?nseco e
reusabilidade. A comunica??o nas redes em chip ? realizada atrav?s da transmiss?o de pacotes que
carregam dados e instru??es que representam requisi??es e respostas entre os elementos
processadores interligados pela rede. A transmiss?o desses pacotes acontece como em um pipeline
entre os roteadores da rede, da origem at? o destino da comunica??o, permitindo inclusive
comunica??es simult?neas entre pares de origem e destinos diferentes. Partindo desse fato, prop?ese
transformar toda a infraestrutura de comunica??o de uma rede em chip, aproveitando os
mecanismos de roteamento, arbitragem e memoriza??o em um sistema de processamento paralelo
de alto desempenho. Nessa proposta os pacotes s?o formados por instru??es e dados que
representam as aplica??es, os quais s?o executados nos roteadores enquanto s?o transmitidos,
aproveitando o pipeline das transmiss?es e a comunica??o paralela. Em contrapartida, n?o s?o
utilizados processadores tradicionais, mas apenas n?cleos simples que controlam o acesso a
mem?ria. Uma implementa??o dessa ideia ? a arquitetura intitulada IPNoSys (Integrated Processing
NoC System), que conta com um modelo de programa??o pr?prio e um algoritmo de roteamento que
garante a execu??o de todas as instru??es presentes nos pacotes, prevenindo situa??es de deadlock,
livelock e starvation. Essa arquitetura apresenta mecanismos de entrada e sa?da, interrup??o e
suporte ao sistema operacional. Como prova de conceito foi desenvolvido um ambiente de
programa??o e simula??o para esta arquitetura em SystemC, o qual permite a configura??o de v?rios
par?metros da arquitetura e obten??o dos resultados para avalia??o da mesma
|
5 |
Estudo da viabilidade do desenvolvimento de sistemas integrados baseados em redes em chip sem processadores: sistema IPNoSys / The study of viability of development of no processor integrated system based on network-on-chip: IPNoSys systemAra?jo, S?lvio Roberto Fernandes de 11 April 2008 (has links)
Made available in DSpace on 2014-12-17T15:47:45Z (GMT). No. of bitstreams: 1
SilvioRFA.pdf: 3522539 bytes, checksum: 0e7ac6eda46a29d5f5968d779986fb03 (MD5)
Previous issue date: 2008-04-11 / The increase of capacity to integrate transistors permitted to develop completed systems, with several components, in single chip, they are called SoC (System-on-Chip). However, the interconnection subsystem cans influence the scalability of SoCs, like buses, or can be an ad hoc solution, like bus hierarchy. Thus, the ideal interconnection subsystem to SoCs is the Network-on-Chip (NoC). The NoCs permit to use simultaneous point-to-point channels between components and they can be reused in other projects. However, the NoCs can raise the complexity of project, the area in chip and the dissipated power. Thus, it is necessary or to modify the way how to use them or to change the development paradigm. Thus, a system based on NoC is proposed, where the applications are described through packages and performed in each router between source and destination, without traditional processors. To perform applications, independent of number of instructions and of the NoC dimensions, it was developed the spiral complement algorithm, which finds other destination until all instructions has been performed.
Therefore, the objective is to study the viability of development that system, denominated IPNoSys system. In this study, it was developed a tool in SystemC, using accurate cycle, to simulate the system that performs applications, which was implemented in a package description language, also developed to this study. Through the simulation tool, several result were obtained that could be used to evaluate the system performance. The methodology used to describe the application corresponds to transform the high level application in data-flow graph that become one or more packages. This methodology was used in three applications: a counter, DCT-2D and float add. The counter was used to evaluate a deadlock solution and to perform parallel application. The DCT was used to compare to STORM platform. Finally, the float add aimed to evaluate the efficiency of the software routine to perform a unimplemented hardware instruction. The results from simulation confirm the viability of development of IPNoSys system. They showed that is possible to perform application described in packages, sequentially or parallelly, without interruptions caused by deadlock, and also showed that the execution time of IPNoSys is more efficient than the STORM platform / O aumento na capacidade de integra??o de transistores permitiu o desenvolvimento de sistemas completos, com in?meros componentes, dentro de um ?nico chip, s?o os chamados SoCs (System-on-Chip). No entanto, o subsistema de interconex?o utilizado pode limitar a escalabilidade dos SoCs, como os barramentos, ou ser uma solu??o ad hoc, como a hierarquia de barramentos. Desse modo, a solu??o ideal para interconex?o no SoCs s?o as redes em chip ou NoCs (Network-on-Chip). As NoCs permitem m?ltiplas conex?o ponto-a-ponto entre os componente e podem ser reusadas em projetos diversos. Entretanto, o uso de NoCs pode representar o aumento na complexidade do projeto do sistema, da ?rea em chip e/ou pot?ncia dissipada. Dessa forma, ? necess?rio ampliar o horizonte de utiliza??o dos sistemas ou quebrar o paradigma do seu desenvolvimento. Assim, ? proposto um sistema baseado em uma NoC, onde as aplica??es s?o descritas em forma de pacotes e executadas de roteador em roteador durante o percurso entre origem e destino dos pacotes, sem a necessidade do uso de processadores convencionais. Para permitir a execu??o de aplica??es, independente do n?mero de instru??es e das dimens?es da rede, foi desenvolvido o algoritmo spiral complement, que permite re-rotear pacotes at? que todas as instru??es contidas nele sejam executadas. Portanto, o objetivo desse trabalho foi estudar a viabilidade do desenvolvimento de tal sistema, denominado sistema IPNoSys. Nesse estudo, foi desenvolvida em SystemC, com precis?o de ciclo, uma ferramenta para simula??o do sistema, a qual permite executar aplica??es implementadas na linguagem de descri??o de pacotes, tamb?m desenvolvida para esse fim. Atrav?s da ferramenta podem ser obtidos diversos resultados que permitem avaliar o funcionamento e desempenho do sistema. A metodologia empregada para descri??o das aplica??es corresponde, a priori, em obter o grafo de fluxo de dados da aplica??o em alto n?vel, e desse grafo descrev?-la em um ou mais pacotes. Utilizando essa metodologia, foram realizados tr?s estudos de casos: contador, DCT-2D e adi??o de ponto flutuante. O contador foi usado para avaliar a capacidade do sistema em tratar situa??es de deadlock e executar aplica??es em paralelo. A DCT-2D foi utilizada para realizar compara??es com a plataforma STORM. E, finalmente, a adi??o de ponto flutuante teve como objetivo ser usada como rotina de tratamento de uma instru??o n?o implementada em hardware. Os resultados de simula??o apontam favoravelmente com rela??o ? viabilidade do desenvolvimento do sistema IPNoSys. Mostrando que ? poss?vel executar aplica??es em forma de pacotes, inclusive paralelamente, sem interrup??es provocadas por eventuais deadlocks, e ainda indicam maior efici?ncia do sistema IPNoSys a respeito do tempo de execu??o comparada a plataforma STORM
|
Page generated in 0.0272 seconds