Global ETD Search

61	Servi?os de comunica??o diferenciados em sistemas multiprocessados em chip baseados em redes intra-chip Carara, Everton Alceu 25 August 2011 (has links) Made available in DSpace on 2015-04-14T14:49:34Z (GMT). No. of bitstreams: 1 433647.pdf: 4232185 bytes, checksum: c4bc7e337648060436ec9e548192a2e2 (MD5) Previous issue date: 2011-08-25 / Sistemas multiprocessados em chip (MPSoCs - Multiprocessor Systems-on-Chip) est?o sendo considerados como prov?vel padr?o para implementar os sistemas embarcados futuros. O poder computacional destas plataformas possibilita a execu??o simult?nea de diversas aplica??es com diferentes requisitos. O emprego de redes intrachip (NoCs Networks-on-Chip) como infraestrutura de comunica??o em tais plataformas ? uma realidade em pesquisas acad?micas e projetos industriais. NoCs s?o comumente vistas como alternativa aos tradicionais barramentos, oferecendo como principais vantagens escalabilidade e suporte a diversas comunica??es em paralelo. Contudo, a motiva??o para o seu emprego em SoCs (Systems-on-Chip) vai al?m dessas vantagens ?bvias, visto que NoCs podem suportar diversos servi?os de comunica??o com diferentes n?veis de qualidade. Visto que comumente as aplica??es que executam em MPSoCs s?o compostas por diferentes tarefas comunicantes, o eficiente suporte ? comunica??o tem um papel fundamental no desempenho destas e ? uma ?rea estrat?gica no desenvolvimento de plataformas multiprocessadas. Muitos trabalhos t?m sido conduzidos na ?ltima d?cada nas ?reas de NoCs e MPSoCs, entretanto poucos tratam a lacuna existente entre os n?veis de rede (servi?os de comunica??o) e de aplica??o em MPSoCs baseados em NoC. Este trabalho tem por objetivo a implementa??o de diferentes servi?os de comunica??o no n?vel de rede e a disponibiliza??o destes no n?vel de aplica??o, preenchendo assim a lacuna existente entre tais n?veis atrav?s de uma melhor integra??o hardware/software. A metodologia de projeto seguida neste trabalho parte da implementa??o de mecanismos espec?ficos no n?vel da rede, os quais d?o suporte a servi?os de comunica??o diferenciados. Tais servi?os s?o expostos no n?vel de aplica??o atrav?s de primitivas que comp?em a API (Application Programming Interface) de comunica??o. O prop?sito desta abordagem ? oferecer ao desenvolvedor de aplica??es meios, em software, para satisfazer os requisitos de comunica??o das aplica??es, especialmente daquelas com restri??es temporais. As avalia??es realizadas mostram o funcionamento e os benef?cios obtidos atrav?s da utiliza??o dos servi?os implementados, al?m de apontar alguns cen?rios onde estes n?o se adequam t?o bem. INFORM?TICA MULTIPROCESSADORES REDES DE COMPUTADORES REDES DE COMUNICA??O DE DADOS
62	Mapeamento din?mico de aplica??es para MPSOCS homog?neos Mandelli, Marcelo Grandi 23 March 2011 (has links) Made available in DSpace on 2015-04-14T14:49:40Z (GMT). No. of bitstreams: 1 435006.pdf: 1798120 bytes, checksum: e9da2fa29967e8e1d389bc264f9b5bef (MD5) Previous issue date: 2011-03-23 / The advance in manufacturing technology of integrated circuits enables smaller transistors, making possible the development of SoCs (System-on-Chip). Many applications require multi-processor SoCs in order to meet their performance requirements. A SoC containing several processing elements (PEs) is called MPSoC. An MPSoC can be classified as homogeneous, when all their PEs has the same architecture; or heterogeneous, when they have different architectures. . As communication infrastructure, the MPSoC can use NoCs as a way to interconnect the PEs. NoCs may be used to replace busses, due to their advantages of higher scalability and communication parallelism. One of the main problems related to MPSoC projects is to define a PE of the system that will run each task. This problem is called task mapping. The mapping can be classified into static, which occurs at design time, and dynamic that occurs at runtime. The dynamic mapping approach requires firstly the mapping of the initial tasks of an application (which does not depend on any other task). The other tasks, in this approach, are mapped dynamically when requested. The mapping can be also classified by the number of tasks running in a PE. The mapping is classified as single task, when only one task is executed by a PE, and as multitask, when multiple tasks can be executed in a same PE. This work proposes new single task and multitask dynamic task mapping heuristics, in order to reduce communication energy. Results are evaluated using the MPSoC HeMPS, which executes application code generated from a model-based simulation environment. These heuristics are compared with mapping heuristic presented in literature, obtaining, in the evaluated scenarios, an average communication energy reduction of 9.8%, for the single task approach, and 18.6%, for the multitask approach. This work also evaluates the inclusion of dynamic load on the system, which makes necessary the implementation of an initial tasks mapping heuristic. This heuristic is an innovative contribution, since a similar approach is not found in any other work in literature. / O avan?o na tecnologia de fabrica??o de circuitos integrados permite obter transistores cada vez menores, tornando poss?vel o desenvolvimento de sistemas completos em um ?nico chip (System-on-Chip - SoC). Muitas aplica??es requerem SoCs com v?rios processadores para poder suprir seus requisitos de desempenho. Um SoC que cont?m diversos elementos de processamento (Processing Element - PEs) ? chamado de MPSoC. Um MPSoC pode ser classificado em homog?neo, quando todos seus PEs s?o iguais; ou heterog?neo, quando seus PEs s?o diferentes. Como infraestrutura de comunica??o, o MPSoC pode utilizar NoCs como forma de interconectar os PEs. O uso de NoCs deve-se a suas vantagens em rela??o a barramentos, entre as quais maior escalabilidade e paralelismo na comunica??o. Um dos principais problemas relativos ao projeto de MPSoCs ? a defini??o de qual dos PEs do sistema ser? respons?vel pela execu??o de cada tarefa de uma aplica??o. Este problema ? chamado de mapeamento de tarefas. O mapeamento pode ser classificado em est?tico, que ocorre em tempo de projeto, ou em din?mico que ocorre em tempo de execu??o. A abordagem de mapeamento din?mico requer primeiramente o mapeamento de tarefas iniciais de uma aplica??o (que n?o dependem de nenhuma outra tarefa) das aplica??es, sendo que as outras tarefas s?o mapeadas dinamicamente quando solicitadas. Tamb?m se pode classificar o mapeamento quanto ao n?mero de tarefas que executam em um PE do sistema. O mapeamento ? dito monotarefa, quando apenas uma tarefa ? executada por PE, e multitarefa, quando m?ltiplas tarefas podem ser executadas em um mesmo PE. Este trabalho prop?e novas heur?sticas de mapeamento din?mico monotarefa e multitarefa, visando ? redu??o de energia de comunica??o. Resultados s?o avaliados atrav?s do MPSoC HeMPS, que executa c?digos de aplica??es geradas a partir de um ambiente de simula??o baseado em modelos. Estas heur?sticas s?o comparadas com heur?sticas de mapeamento apresentadas na literatura, apresentando uma redu??o m?dia de energia de comunica??o nos cen?rios avaliados de at? 9,8% na abordagem monotarefa e 18,6% na multitarefa. Este trabalho tamb?m avalia a inser??o din?mica de carga no sistema, utilizando para isto a implementa??o de uma heur?stica de mapeamento din?mico de tarefas iniciais. Esta heur?stica ? uma contribui??o inovadora, visto que uma abordagem parecida n?o ? encontrada em nenhum outro trabalho da literatura. INFORM?TICA MULTIPROCESSADORES ARQUITETURA DE COMPUTADOR
63	Particionamento e mapeamento de MPSOCS homog?neos baseados em NOCS Antunes, Eduardo de Brum 29 February 2012 (has links) Made available in DSpace on 2015-04-14T14:49:42Z (GMT). No. of bitstreams: 1 437796.pdf: 2125944 bytes, checksum: 5e312ec4db3f55dac8ce8c7388128326 (MD5) Previous issue date: 2012-02-29 / The increasing complexity of the applications demands more processing capacity, which boosts the development of a computational system composed of modules, such as processors, memories and specific hardware cores, called Multi-Processor System-on- Chip (MPSoC). If the modules of this system are connected through a Network-on-Chip (NoC) communication infrastructure and all processors are of the same type, they are known by homogeneous NoC based MPSoC. One of the main problems relating to MPSoCs design is the definition of which processors of the system will be responsible for each application task execution, objecting to meet the design requirements, such as the energy consumption minimization and the application execution time reduction. This work aims to carry out quickly and efficiently partitioning and mapping activities for the design of homogeneous MPSoCs. More specifically, the partitioning application's task into groups, and mapping of tasks or task groups into a target architecture type homogeneous NoC-based MPSoC. These activities are guided by requirements of energy consumption minimization and load balancing, and delimited by constraints of maximum energy consumption, maximum processing load and maxima areas of data and code of each processor. The work shows the complexity of partitioning and mapping activities separately and jointly. It also shows that the mapping is more efficient on energy consumption minimization, when compared to partitioning, yet the effect of partitioning cannot be neglected. Moreover, the joint effect of both activities saves in average 37% of energy. The mapping when performed at runtime may be inefficient, due to the short time and the large number of solutions to be explored. Having an approach that applies a static partition before the dynamic mapping, it is possible to achieve more efficient mappings / O aumento da complexidade das aplica??es demanda maior capacidade de processamento, impulsionando o desenvolvimento de um sistema computacional compostos por m?dulos como processadores, mem?rias e n?cleos de hardware espec?ficos, chamado de Multi-Processor System-on-Chip (MPSoC). Se os m?dulos deste sistema forem conectados por uma infraestrutura de comunica??o do tipo Network-on- Chip (NoC) e todos os processadores forem de um ?nico tipo, este ? chamado de MPSoC homog?neo baseado em NoC. Um dos principais problemas relativo ao projeto de MPSoCs ? a defini??o de qual dos processadores do sistema ser? respons?vel pela execu??o de cada tarefa de uma aplica??o, visando atender os requisitos de projeto, tais como a redu??o do consumo de energia e a redu??o do tempo de execu??o da aplica??o. Este trabalho tem como objetivo a realiza??o de forma r?pida e eficiente das atividades de particionamento e mapeamento para o projeto de MPSoCs homog?neos. Mais especificamente o particionamento de tarefas de uma aplica??o em grupos, e o mapeamento de tarefas ou grupos de tarefas em processadores homog?neos de uma arquitetura alvo do tipo MPSoC baseado em NoC. Sendo estas atividades guiadas por requisitos de redu??o do consumo de energia e balanceamento de carga, e delimitadas por restri??es de m?ximo consumo de energia, m?xima carga de processamento e m?ximas ?reas de dados e c?digo associadas a cada processador. O trabalho mostra a complexidade das atividades de particionamento e mapeamento, separadas e conjuntamente. Mostra tamb?m que o mapeamento ? mais eficiente na redu??o de consumo de energia, quando comparado com o particionamento, mas mesmo assim o efeito do particionamento n?o pode ser negligenciado. Al?m disto, o efeito conjunto de ambas as atividades reduz em m?dia 37% o consumo de energia. O mapeamento, quando realizado em tempo de execu??o, pode ser pouco eficiente, devido ao tempo ex?guo e ao grande n?mero de solu??es a serem exploradas. Utilizando uma abordagem que aplica um particionamento est?tico anterior ao mapeamento din?mico, permite obter mapeamentos mais eficientes. Isto porque o particionamento est?tico de tarefas em grupos reduz o espa?o de busca que o mapeamento necessita realizar. Experimentos com v?rias aplica??es sint?ticas e quatro aplica??es embarcadas mostram que a redu??o m?dia do consumo de energia ? de 23,5%. Este trabalho apresenta o framework PALOMA que realiza o particionamento de tarefas em grupos e o framework CAFES para fazer o mapeamento destes em posi??es da arquitetura alvo, onde cada posi??o cont?m um processador. Estas atividades permitem planejar sistemas com menor consumo de energia, mais velozes e em tempo de projeto aceit?vel INFORM?TICA MULTIPROCESSADORES ENERGIA EL?TRICA - CONSUMO
64	Reduction of energy consumption in MPSOCS through a dynamic frequency scaling technique Rosa, Thiago Raupp da 27 March 2012 (has links) Made available in DSpace on 2015-04-14T14:49:50Z (GMT). No. of bitstreams: 1 439390.pdf: 3101139 bytes, checksum: 42025c16dd319c48f3a185f5f4c5dbc5 (MD5) Previous issue date: 2012-03-27 / NoC-based MPSoCs are employed in several embedded systems due to the high performance, achieved by using multiple processing elements (PEs). However, power and energy restrictions, especially in mobile applications, may render the design of MPSoCs over-constrained. Thus, the use of power management techniques is mandatory. Moreover, due to the high variability present in application workloads executed by these devices, this management must be performed dynamically. The use of traditional dynamic voltage and frequency scaling (DVFS) techniques proved to be useful in several scenarios to save energy. Nonetheless, due to technology scaling that limits the voltage variation and to the slow response of DVFS schemes, the use of such technique may become inadequate in newer DSM technology nodes. As alternative, the use of dynamic frequency scaling (DFS) may provide a good trade-off between power savings and power overhead. This work proposes a self-adaptable distributed DFS scheme for NoC-Based MPSoCs. Both NoC and PEs have an individual frequency control scheme. The DFS scheme for PEs takes into account the PE computation and communication loads to dynamically change the operating frequency. In the NoC, a DFS controller uses packet information and router activity to decide the router operating frequency. Also, the clock generation module is designed to provide a clock signal to PEs and NoC routers. The clock generation method is simple, based on local selective clock gating of a single global clock, provides a wide range of generated clocks, induces low area and power overheads and presents small response time. Synthetic and real applications were used to evaluate the proposed scheme. Results show that the number of executed instructions can be reduced by 65% (28% in average), with an execution time overhead up to only 14% (9% in average). The consequent power dissipation reduction in PEs reaches up to 52% (23% in average) and in the NoC up to 76% (71% in average). The power overhead induced by the proposed scheme is around 3% in PEs and around 10% in the NoC / MPSoCs baseados em NoC t?m sido empregados em sistemas embarcados devido ao seu alto desempenho, atingido atrav?s do uso de m?ltiplos elementos de processamento (PEs). Entretanto, a especifica??o da funcionalidade, agregada a especifica??o de requisitos de consumo de energia em aplica??es m?veis, pode comprometer o processo de projeto em termos de tempo e/ou custo. Dessa forma, a utiliza??o de t?cnicas para gerenciamento de consumo de energia ? essencial. Al?m disso, aplica??es que possuam carga de trabalho din?mica podem realizar esse gerenciamento dinamicamente. A utiliza??o de t?cnicas para escalonamento din?mico de tens?o e frequ?ncia (DVFS) mostrou-se adequada para a redu??o do consumo de energia em sistemas computacionais. No entanto, devido ? evolu??o da tecnologia, a varia??o m?nima de tens?o ? menor, e o tempo de resposta elevado dos m?todos de DVFS pode tornar esta t?cnica inadequada em tecnologias DSM (deep sub-micron). Como alternativa, a utiliza??o de t?cnicas para escalonamento din?mico de frequ?ncia (DFS) pode prover uma boa rela??o custo-benef?cio entre economia e consumo de energia. O presente trabalho apresenta um esquema de escalonamento din?mico de frequ?ncia distribu?do auto-adapt?vel para MPSoCs baseados em NoC. Ambos os elementos do MPSoC (NoC e PEs) possuem um esquema espec?fico. O esquema para os PEs leva em considera??o as cargas de computa??o e comunica??o do mesmo. Na NoC, o esquema ? controlado atrav?s de informa??es provenientes do pacote que trafega na rede e da atividade do roteador. Al?m disso, um m?dulo para gera??o local de rel?gio ? apresentado, o qual ? respons?vel por prover o sinal de rel?gio para PEs e roteadores da NoC. O esquema de gera??o do sinal de rel?gio ? simples, baseado em roubo de ciclo de um sinal de rel?gio global. Este ainda fornece uma ampla variedade de frequ?ncias, induz baixo custo adicional de ?rea e consumo e responde rapidamente a uma nova configura??o. Para avaliar o esquema proposto, aplica??es sint?ticas e reais foram simuladas. Os resultados mostram que a redu??o no n?mero de instru??es executadas ? de at? 65% (28% em m?dia), com um custo adicional de no m?ximo 14% no tempo de execu??o (9% em m?dia). Em rela??o ? dissipa??o de pot?ncia, os resultados mostram que a redu??o ? de at? 52% nos PEs (23% em m?dia) e de at? 76% na NoC (71% em m?dia). O overhead de consumo apresentado pelo esquema dos PEs ? de 3% e pelo esquema da NoC ? de 10% INFORM?TICA MULTIPROCESSADORES ARQUITETURA DE COMPUTADOR
65	Um MPSOC GALS baseado em rede intrachip com gera??o local de rel?gio Heck, Guilherme 27 August 2012 (has links) Made available in DSpace on 2015-04-14T14:49:57Z (GMT). No. of bitstreams: 1 445336.pdf: 3946436 bytes, checksum: 1e6fa2914e52a5786113539640cd4a99 (MD5) Previous issue date: 2012-08-27 / Due to the evolution of deep submicron technologies for semiconductor fabrication, it is possible nowadays to manufacture increasingly complex systems inside a single sili-con die. However, this evolution in some cases mandates the abandonment of traditional design techniques. The development of purely synchronous complex systems begins to be influenced by relatively long intrachip distances as well as by parasitic effects in wires with growingly small cross-sections. Besides, it is important to enable the design of devices with enhanced processing capabilities to fulfill the demand for multiple applications in re-search and industry environments, while at the same time improving energy efficiency. This is motivated by the significant increase on the demand for multifunctional portable equipments like tablets and smart phones that must everyday become faster and yet present reasonable battery life. In view of these facts, new paradigms for the design of globally asynchronous locally synchronous (GALS) systems come to the forefront in the construction of multiprocessor systems on chip (MPSoCs). This work has as main strateg-ic objective to explore GALS MPSoC architectures that target the control of power dissipa-tion. The decision to work with MPSoCs comes from the natural need to increase the number of processing elements in current designs, as a way to take full advantage of the silicon technological evolution. During the development of this work five distinct contribu-tions are worth mentioning. First, the architectures of the Hermes-GLP NoC router and of the HeMPS MPSoC were subject to a set of corrections and modifications, to provide these modules with better support to the implementation of GALS systems. This allowed the proposition of a new MPSoCs, called HeMPS-GLP. Second, a set of changes in the embedded processor microkernel of the HeMPS MPSoC enabled the smooth interconnec-tion and configuration of new hardware structures to the system processors. Third, a new high-level language verification environment for the HeMPS-GLP MPSoC was made avail-able, which supports up to 256 distinct operating frequencies for the NoC, together with the independent definition of each processing element?s clock. Fourth, there is the propo-sition of a new local clock generator targeting minimum area, low power dissipation, oper-ating frequency stability and insensitivity to process, voltage and temperature variations. Finally, this work provides a simulation and code generation environment for silicon im-plementations of the HeMPS-GLP MPSoC. This environment emulates the local clock ge-nerators, based on the designed local clock generator. / Devido ? evolu??o das tecnologias nanom?tricas profundas em semicondutores, hoje ? poss?vel a fabrica??o de sistemas cada vez mais complexos em um ?nico chip. Entretanto, esta evolu??o est? inviabilizando, em alguns casos, pr?ticas de projeto tradi-cionais. O desenvolvimento de sistemas complexos puramente s?ncronos come?a a ser influenciado por dist?ncias intrachip relativamente longas, bem como por efeitos parasitas em fios com ?reas de sec??o reta cada vez menores. Adicionalmente, ganha destaque em pesquisa e na ind?stria a necessidade de projetar dispositivos com elevada capacida-de de processamento para atender a demanda de m?ltiplas aplica??es, enquanto aprimo-ram-se os n?veis de efici?ncia energ?tica. Isto ? motivado pelo significativo aumento da procura por equipamentos port?teis multifun??es como tablets e celulares inteligentes mais velozes e com durabilidade de bateria razo?vel. ? luz destes fatos, novos paradig-mas de projeto de sistemas globalmente ass?ncronos e localmente s?ncronos (GALS) ga-nham destaque para construir sistemas multiprocessados em chip (MPSoCs). Este traba-lho tem como principal objetivo estrat?gico explorar arquiteturas GALS para MPSoCs com alvo no controle da pot?ncia dissipada. Escolhe-se trabalhar sobre MPSoCs devido ao aumento significativo de m?dulos de processamento em projetos atuais como uma forma de tirar vantagem plena da evolu??o das tecnologias de fabrica??o baseadas em sil?cio. Ao longo das atividades, cinco contribui??es podem ser destacadas oriundas cada uma de um conjunto de trabalhos pr?ticos desenvolvidos. Primeiro, prop?s-se um conjunto de corre??es e modifica??es nas arquiteturas do roteador da NoC Hermes-GLP e do MPSoC HeMPS, visando transformar estes em um melhor suporte ? implementa??o de sistemas GALS. Isto produziu uma nova arquitetura de MPSoC, denominado HeMPS-GLP. Segun-do, altera??es na estrutura do microkernel embarcado dos processadores do MPSoC HeMPS possibilitaram a interconex?o e configura??o corretas de novas estruturas em hardware aos processadores em quest?o. Terceiro, disponibilizou-se um ambiente de ve-rifica??o em linguagem de alto n?vel para o MPSoC HeMPS-GLP, com suporte a at? 256 n?veis distintos de frequ?ncia para a rede, bem como a defini??o do rel?gio de cada IP de processamento de forma independente. Em quarto lugar, foram realizados o estudo e o projeto de um gerador local de rel?gio visando obter ?rea m?nima, baixa dissipa??o de pot?ncia, estabilidade em frequ?ncia e insensibilidade a varia??es de processo, tens?o de alimenta??o e temperatura. Quinto e ?ltimo, foi desenvolvido um ambiente de simula??o e gera??o de c?digo sintetiz?vel em sil?cio para o MPSoC HeMPS-GLP. Este prov? a emu-la??o do sistema de gera??o local de rel?gio, baseado no gerador local projetado. INFORM?TICA ARQUITETURA DE REDES MULTIPROCESSADORES
66	Ger?ncia distribu?da de recursos em MPSoCs : mapeamento e migra??o de tarefas Castilhos, Guilherme Machado de 25 January 2013 (has links) Made available in DSpace on 2015-04-14T14:49:58Z (GMT). No. of bitstreams: 1 446499.pdf: 3192902 bytes, checksum: af9202a54e6b226976f5b76a00764782 (MD5) Previous issue date: 2013-01-25 / The design of MPSoCs is a clear trend in the semiconductor industry. Such MPSoCs are able to execute several applications in parallel, with support to dynamic workload, i.e., applications may start at any moment. Another important feature is QoS (quality of service), because multimedia and telecom applications have tight performance requirements that must be respected by the system. The constantly growth in the number of cores in MPSoCs implies in an important issue: scalability. Despite the scalability offered by NoCs and distributed processing, the MPSoC resources must be managed to deliver the expected performance. Management tasks include access to input/output devices, task mapping, task migration, monitoring, DVFS. One processing element (PE) responsible for resource management may become a bottleneck, since this PE will serve all other PEs of the system, increasing its computation load and creating a communication hot-spot region. An alternative to ensure scalability is to decentralize or distribute the management functions of the system. Two main approaches are discussed in the literature: one manager per application, and one manager per MPSoC region. The second approach is preferable, since the number of management resources remains constant, regardless the number of applications executing in the MPSoC. The regions are defined as clusters. All application tasks are executed in the cluster, if possible. Regarding the size of the cluster, it may have its size modifiable at runtime to allow the mapping of applications with a greater number of tasks than their available resources. This work proposes a distributed resource management in NoC-based MPSoCs, using a clustering method, enabling the modification of the cluster size at runtime. At system start-up each cluster has a fixed size, and at runtime clusters may borrow resources from neighbor clusters to map applications. Results are evaluated using the HeMPS MPSoC, comparing the performance of the centralized versus distributed management approaches. Results show an important reduction in the total execution time of applications, and a reduced number of hops between tasks (smaller communication energy). Results also evaluate the reclustering method, through monitoring and task migration. / O projeto de MPSoCs ? uma clara tend?ncia na ind?stria de semicondutores. Os MPSoCs s?o capazes de executar v?rias aplica??es em paralelo, suportando carga din?mica de trabalho, ou seja, aplica??es podem iniciar a qualquer momento. Outra caracter?stica importante em MPSoCs ? QoS (qualidade de servi?o), pois aplica??es multim?dia e de telecomunica??es possuem requisitos estritos de desempenho, os quais devem ser respeitados pelo sistema. O crescimento constante do n?mero de n?cleos em MPSoCs implica em uma quest?o importante: escalabilidade. Apesar da escalabilidade oferecida por NoCs, e o processamento distribu?do permitindo a execu??o de carga din?mica de trabalho, os recursos dos MPSoCs devem ser gerenciados para proporcionar o desempenho esperado. Tarefas de gerenciamento incluem acesso de entrada/sa?da a dispositivos externos ao MPSoC, mapeamento de tarefas, migra??o de tarefas, monitoramento, DVFS, dentre outras. Um ?nico elemento de processamento (PE), respons?vel pela ger?ncia dos recursos pode se tornar um gargalo no desempenho do sistema, j? que este PE vai servir a todos os PEs do sistema, aumentando sua carga de trabalho e criando regi?es com congestionamento de tr?fego (hot-spots). Uma alternativa para garantir escalabilidade ? descentralizar ou distribuir as fun??es de gerenciamento do sistema. Duas abordagens principais de ger?ncia s?o discutidas na literatura: um gerente por aplica??o, ou um gerente por regi?o do MPSoC. A segunda abordagem ? prefer?vel, j? que o n?mero de recursos utilizados no gerenciamento permanece constante, independentemente do n?mero de aplica??es em execu??o na MPSoC. As regi?es s?o definidas como clusters. Todas as tarefas das aplica??es s?o executadas em um cluster, se poss?vel. Em rela??o ao tamanho do cluster, ele pode ter seu tamanho modific?vel em tempo de execu??o para permitir o mapeamento de aplica??es com um n?mero de tarefas maior do que seus recursos dispon?veis. Este trabalho prop?e uma ger?ncia distribu?da de recursos em MPSoCs, utilizando um m?todo de clusteriza??o, permitindo que o tamanho do cluster seja modificado dinamicamente. Esse sistema inicializa cada cluster com um tamanho fixo, e durante a execu??o das aplica??es, os clusters podem requerer recursos a seus clusters vizinhos para mapear tarefas. Os testes foram executados utilizando a plataforma HeMPS, e foram comparados o desempenho do m?todo de ger?ncia centralizado contra o m?todo de ger?ncia distribu?do. Os resultados mostram uma importante redu??o no tempo total de execu??o das aplica??es e no n?mero de hops entre as tarefas (menor energia de comunica??o) utilizando o m?todo de ger?ncia distribu?da. Os resultados tamb?m avaliam o m?todo de reclusteriza??o, utilizando monitora??o de desempenho e migra??o de tarefas. INFORM?TICA MULTIPROCESSADORES ARQUITETURA DE COMPUTADOR
67	Suporte para aplica??es din?micas em sistemas multiprocessados intra-chip homog?neos Johann Filho, Sergio 15 March 2012 (has links) Made available in DSpace on 2015-04-14T14:50:02Z (GMT). No. of bitstreams: 1 449233.pdf: 5384117 bytes, checksum: e5e7f7074f9334b3b3534e2949e5bfe7 (MD5) Previous issue date: 2012-03-15 / Modern MPSoC systems use resources previously available only in general purpose computers providing more functionalities for the applications. The architectural evolution enables more resources to be implemented on these embedded systems and determines an increased complexity of new hardware and software designs. In addition to the increased design complexity of current MPSoC systems, it is evident the difficulty in efficient use of computational resources found on such platforms. As well as the determinism and response time prioritized in many embedded systems, the programmability of MPSoCs is very relevant. Thus, well-defined software interfaces help developers to create applications that utilize optimally the computational resources found in these systems. Most embedded applications are divided into tasks and statically mapped to processing elements at design time, in order to optimize a set of pre-stablished metrics. However, the dynamic nature of new applications requires efficient strategies for the dynamic mapping and task migration to be implemented. In this context, this thesis presents a model for dynamic applications and distributed management of these in homogeneous MPSoC systems. The system management uses task migration concepts and timing constraints, where tasks characterization parameters are used in scheduling decision making and optimization at runtime. In this work we used a homogeneous MPSoC architecture, consisting of processing elements with a local memory interconected by a NoC. This environment allows the execution of applications managed by a distributed operating system that implements the proposed model and offers many services for the development and optimization of embedded applications. Many works in this field make use of a centralized manager to perform the system optimization at runtime, however such solutions tend to be not very scalable. Results show that the use of distributed managers present greater efficiency in systems with a large number of processing elements and tasks, with a reduction in the system stabilization time and reduction of deadline misses for applications with realtime constraints. / Sistemas MPSoC modernos fazem uso de recursos que eram disponibilizados apenas em computadores de prop?sito geral provendo mais funcionalidades para as aplica??es. A evolu??o arquitetural possibilita que mais recursos sejam implementados nestes sistemas embarcados e determina um aumento na complexidade dos novos projetos de hardware e software. Al?m do aumento da complexidade de projeto em sistemas MPSoC atuais, torna-se evidente a dificuldade na utiliza??o eficiente dos recursos computacionais encontrados em tais plataformas. Assim como o determinismo e o tempo de resposta priorizado em muitos sistemas embarcados, a programabilidade de MPSoCs ? muito relevante. Dessa forma, interfaces bem definidas de software ajudam o desenvolvedor a criar aplica??es que utilizam de maneira otimizada os recursos computacionais encontrados nestes sistemas. A maior parte das aplica??es embarcadas s?o divididas em tarefas e estaticamente mapeadas a elementos de processamento em tempo de projeto, de forma a otimizar um conjunto de m?tricas pr?-estabelecidas. No entanto, a natureza din?mica de novas aplica??es estabelece que estrat?gias eficientes de mapeamento din?mico e migra??o de tarefas sejam implementadas. Neste contexto, esta tese apresenta um modelo para aplica??es din?micas e gerenciamento distribu?do destas em sistemas MPSoC homog?neos. O gerenciamento do sistema faz uso dos conceitos de migra??o de tarefas e restri??es temporais, onde par?metros de caracteriza??o das tarefas s?o utilizados nas tomadas de decis?o de escalonamento e otimiza??o em tempo de execu??o. Neste trabalho ? utilizada uma arquitetura MPSoC homog?nea, composta por elementos de processamento com mem?rias locais interconectados por uma NoC. Este ambiente permite a execu??o de aplica??es gerenciadas por um sistema operacional distribu?do que implementa o modelo proposto e oferece diversos servi?os para o desenvolvimento e otimiza??o de aplica??es embarcadas. Muitos trabalhos na ?rea fazem uso de um gerente centralizado para realizar a otimiza??o do sistema em tempo de execu??o, no entanto tais solu??es tendem a ser pouco escal?veis. Os resultados obtidos mostram que o uso de gerentes distribu?dos apresentam maior efici?ncia para sistemas com um grande n?mero de elementos de processamento e tarefas, com redu??o nos tempos de estabiliza??o do sistema e redu??o nas perdas de deadline para aplica??es com restri??es de tempo real. INFORM?TICA MULTIPROCESSADORES ARQUITETURA DE COMPUTADOR
68	HC-MPSOC : plataforma do tipo cluster para sistemas embarcados Magalh?es, Felipe G?hring de 21 March 2013 (has links) Made available in DSpace on 2015-04-14T14:50:05Z (GMT). No. of bitstreams: 1 449349.pdf: 2535064 bytes, checksum: 9bc52234ef8a5c4987806932ce5619c9 (MD5) Previous issue date: 2013-03-21 / Multiprocessor System-on-Chip (MPSoC) can be found in virtually all market branches and the design of such systems typically has several restrictions such as chip area used, which hampers. State-of-art MPSoCs uses networks-on-chip as the primary means of communication, and the trend is that systems based on networks intrachip continue to be used for a long time, thanks to greater flexibility in their design and also a high capacity communication. However, such systems also have certain restrictions on its use, such as the location of the tasks that compose it. Mapping and partitioning techiniques seek to solve these problem, or at least decrease it to a non critical point, but are not always successful in this job. In this context, cluster-based architectures emerges as a viable alternative to MPSoCs. Such systems typically have a hybrid architecture in its constitution, using more than one communication medium, thus being able to group elements by questions of "affinity" and still using high-speed communication medias, such as networks-on-chip. Thus, this work introduces the HC-MPSoC, an architecture for cluster-based intrachip systems, which uses buses and networks-on-chip in a joint way, forming groups of elements independently distributed throughout the system. The HellfireOS is also presented, a real time operating system adapted to run on the platform, counting with a full set of drivers throughout a high-level API. All HC-MPSoC modules as well as the HellfireOS modules, and the results obtained using the platform are presented along the text. / Sistemas intrachip multiprocessados (MPSoCs) podem ser encontrados em praticamente todos os ramos do mercado e o projeto desses sistemas normalmente apresenta diversas restri??es, como por exemplo ?rea do chip utilizada, o que o dificulta. MPSoCs do estado da arte utilizam redes intrachip como meio de comunica??o principal, e a tend?ncia ? que sistemas baseados em redes intrachip continuem a ser utilizados por um longo tempo, gra?as a uma maior flexibilidade em seu projeto e tamb?m uma alta capacidade de comunica??o. Por?m, tais sistemas ainda apresentam certas restri??es em seu uso, como por exemplo a localiza??o das tarefas que o comp?em. T?cnicas de mapeamento e particionamento de tarefas de uma aplica??o buscam solucionar tais problemas, ou ao menos diminui-los a um ponto n?o cr?tico, mas nem sempre s?o bem sucedidos. Neste contexto, arquiteturas do tipo cluster surgem como uma alternativa vi?vel para MPSoCs, normalmente apresentando uma arquitetura h?brida em sua constitui??o, utilizando mais de um meio de comunica??o, podendo assim agrupar elementos por quest?es de "afinidade" e ainda assim utilizando meios de comunica??o com grande paralelismo, como redes intrachip. Desta maneira, este trabalho introduz o HC-MPSoC, uma arquitetura clusterizada para sistemas intrachip, que utiliza redes intrachip e barramentos de uma maneira conjunta, formando grupos de elementos distribu?dos de forma independente por todo sistema. ? apresentando ainda, o HellfireOS, sistema operacional de tempo real adaptado para executar sobre a arquitetura, com drivers disponibilizados para uso. Todos os m?dulos do HC-MPSoC, assim como do HellfireOS, e os resultados obtidos utilizando a arquitetura, s?o apresentados no decorrer do texto. INFORM?TICA MULTIPROCESSADORES ARQUITETURA DE COMPUTADOR
69	Modelagem e projeto de um gerador de rel?gio local baseado em DCO para MPSoCs GALS Heck, Leandro Sehnem 27 March 2013 (has links) Made available in DSpace on 2015-04-14T14:50:09Z (GMT). No. of bitstreams: 1 453324.pdf: 2410209 bytes, checksum: f4e4dbdab0416563f7afc5fbe9905155 (MD5) Previous issue date: 2013-03-27 / Currently, the use of multiprocessor systems on chip or MPSoCs are a trend in the electronic industry. Increasing numbers of processors and other Intellectual Property Cores (IP Cores) are integrated, which enable massive parallel processing, and allow achieving devices with increased performance. This trend to employ MPSoCs is driven, among other factors, by advances in networks on chip research, due to their higher scalability, when compared to other types of interconnection architectures. On the other hand, there is a growing demand for portable devices, with fierce competition for market shares of smartphones, tablets and ultrabooks, among other devices. However, increased performance in these devices leads to greater energy consumption. Such high consumption rates become a serious problem, because mobile platforms have limited amounts of energy available for immediate use. Therefore, the research of design techniques aimed at energy savings becomes relevant, once the evolution of energy source characteristics does not follow the evolution of electronic devices. Because a considerable amount of energy consumption in synchronous circuits is required for the generation, distribution and maintenance of the clock signal, this work capitalizes on the use of design techniques that avoid employing global clocks. One option to this consists in partitioning a complex electronic system into a set of synchronous modules that communicate asynchronously, in what are called globally asynchronous locally synchronous (GALS) systems. This Dissertation describes a proposal and the detailed design of a local clock generator circuit, which allows to produce and control the operating frequency of each module in a GALS system, the so called processing elements (PEs). This generator provides a mechanism for dynamically changing the module operating frequency (dynamic frequency scaling or DFS), which makes it able to save energy through the elimination of global clock distribution trees, as well as enabling localized reduction of the frequency of modules subject to reduced instantaneous computational demand. The generator was designed in a 65 nm technology from STMicroelectronics. Results from preliminary design evaluation show that the proposed circuit dissipates only 0,058 μW of static power and presents an average dynamic power dissipation around 159 μW. The area taken by the clock generator control circuit is 0,0024 mm2. This represents an area overhead which is only 5% of the area of a minimalist network on chip router. Such results indicate the feasibility of using the proposed generator for driving relatively small MPSoC modules. Thus, the work especially contributes to consolidate the viability of GALS systems. / Atualmente, o uso de sistemas multiprocessados em chip (do ingl?s Multiprocessor System-on- Chip ou MPSoCs) s?o uma tend?ncia na ind?stria eletr?nica. Integram-se n?meros crescentes de processadores e outros m?dulos de propriedade intelectual (do ingl?s Intellectual Property Cores ou IPs), o que habilita processamento paralelo maci?o, e permite o aumento de desempenho de dispositivos. Esta tend?ncia pela utiliza??o de MPSoCs ? movida entre outros fatores pelos avan?os nas pesquisas em redes intrachip, devido ? maior escalabilidade destas, se comparadas a outras arquiteturas de interconex?o. Por outro lado, h? uma crescente demanda por dispositivos port?teis, com competi??o acirrada por fatias nos mercados de smartphones, tablets e ultrabooks, entre outros equipamentos. Contudo, o aumento do desempenho nestes dispositivos leva necessariamente a um maior consumo de energia. Este consumo elevado ? um problema s?rio, pois plataformas port?teis atualmente disp?em de quantidade limitada de energia prontamente dispon?vel. Assim, a pesquisa de t?cnicas de projeto com foco na economia de energia ? necess?ria, visto que a evolu??o da capacidade de fontes de energia n?o acompanha o progresso de dispositivos eletr?nicos no mesmo passo. Dado que parte significativa da energia consumida em circuitos s?ncronos reside na gera??o, distribui??o e manuten??o do sinal de rel?gio, este trabalho baseia-se no uso de t?cnicas de projeto que prescindem do uso de um rel?gio global. Uma op??o consiste em dividir um sistema eletr?nico complexo em um conjunto de m?dulos s?ncronos que se comunicam assincronamente, no que se denomina sistemas globalmente ass?ncronos e localmente s?ncronos (do ingl?s Globally Asynchronous Locally Synchronous ou GALS). Esta disserta??o descreve a proposta e o projeto detalhado de um circuito gerador de rel?gio local, que permite produzir e controlar a frequ?ncia de opera??o de cada m?dulo processador de um sistema GALS, os chamados elementos de processamento (em ingl?s Processing Elements ou PEs). Este gerador disponibiliza um mecanismo para altera??o din?mica de frequ?ncia (em ingl?s Dynamic Frequency Scaling ou DFS), que o torna capaz de economizar energia atrav?s da elimina??o de ?rvores globais de distribui??o de rel?gio e da redu??o localizada da frequ?ncia em m?dulos com pouca demanda computacional instant?nea. O gerador foi projetado em tecnologia 65 nm da STMicroelectronics. Resultados de avalia??es preliminares mostram que o circuito proposto dissipa uma pot?ncia est?tica de apenas 0,058 μW e uma pot?ncia din?mica m?dia de apenas 159 μW. A ?rea ocupada pelo circuito de controle do gerador ? de 0,0024 mm2. Esta sobrecarga de ?rea representa menos de 5% da ?rea de um roteador de rede intrachip minimalista. Tais resultados indicam a factibilidade de uso do gerador proposto em m?dulos relativamente pequenos de MPSoCs. Assim, o trabalho contribui sobretudo para consolidar a viabilidade de sistemas GALS. INFORM?TICA ARQUITETURA DE COMPUTADOR MULTIPROCESSADORES
70	Runtime adaptive QOS management in NOC-based MPSOCS Ruaro, Marcelo 26 February 2014 (has links) Made available in DSpace on 2015-04-14T14:50:11Z (GMT). No. of bitstreams: 1 457714.pdf: 3058681 bytes, checksum: bf5c8f69d28b7aecb5cc89b8993abbc3 (MD5) Previous issue date: 2014-02-26 / Multiprocessor systems on chip (MPSoCs), using networks on chip (NoC) as the communication infrastructure, result from the continuous reduction in the transistors size and the need for increasing computational power. This increased computing capacity is obtained through the reuse of components (processors, memories, routers, etc.), which also provides scalability, and simplifies the design process. MPSoCs with hundreds of processing elements (PEs) follows the Moore's law, and according to the ITRS 2011 it is predicted up to 1000 PEs in a single chip at the end of 2025. This estimation is driven mainly by the telecommunications and multimedia market, which includes devices such as smartphones and mobile computers. Such devices require systems able to execute a wide range of applications, with different performance requirements. Thus, the system must be able to provide quality of service (QoS) to applications, and adjust the resources usage at runtime. Literature proposais provide runtime QoS adaptation taking finto consideration the use of only one or two QoS techniques. Considering the application diversity that may execute in MPSoCs, applications may have different QoS requirements, requiring more computing resources, communication resources, or both simultaneously. Therefore, this work aims to explore different QoS levels addressing four different adaptive QoS techniques managed at runtime according to the soft real-time applications' requirements. It is assumed that the MPSoC is partitioned in regions, named clusters, with one manager PE per cluster. This adaptive management is controlled through a heuristic that is executed by the OS of each cluster manager. A hybrid monitoring infrastructure provides the necessary information for the adaptive heuristic. This infrastructure is divided in two hierarchical levels, being scalable and with an intrusion levei that corresponda, in the worst case, to 0.8% of the link utilization. The runtime adaptive QoS management acta in computing, communication, or both, enabling soft real time applications to restore their performance after detected a performance decrease by monitoring. Furthermore, a debugging tool for NoC-based MPSoCs is proposed in this work. This tool provides a communication protocol level debugging, and helps the process of implementation, validation and extraction of results of new system protocols. / Sistemas multiprocessados em chip (MPSoCs), baseados em redes em chip (NoCs), s?o resultados da cont?nua redu??o no tamanho dos transistores e na busca por um crescente poder computacional. Este aumento da capacidade de computa??o ? alcan?ado atrav?s da replica??o de componentes (processadores, mem?rias, roteadores, etc.),o que tamb?m fornece escalabilidade e simplifica o projeto. A estimativa de MPSoCs com elevado n?mero de processadores acompanha a lei de Moore, e segundo o ITRS 2011 s?o previstos at? 1000 elementos de processamento (PE) em um ?nico chip at? o ano de 2025. Esta estimativa ? impulsionada principalmente pela mercado de telecomunica??es e multim?dia, que inclui dispositivos como smarthphones e computadores m?veis. Este tipo de emprego de MPSoCs exige que tais sistemas sejam capazes de suportar uma variada gama de aplica??es e com diversos requisitos de desempenho. Assim, o sistema deve ser capaz de fornecer qualidade de servi?o (QoS) para as aplica??es e ajust?-la em tempo de execu??o. As propostas atuais da literatura visam fornecer adapta??o de QoS em tempo de execu??o levando em considera??o o uso de poucas ou de somente uma t?cnica de QoS. Observada a variedade de aplica??es ? claramente percept?vel que certas aplica??es possuem requisitos diferenciados de QoS, podendo requisitar mais recursos de computa??o, comunica??o, ou ambos simultaneamente. Portanto, este trabalho prop?e explorar diferentes n?veis de QoS atrav?s do uso de quatro diferentes t?cnicas adaptativas de QoS que s?o gerenciadas em tempo de execu??o de acordo com os requisitos das aplica??es. O gerenciamento ? distribu?do atrav?s do particionamento do MPSoC em regi?es, denominadas clusters, havendo um PE respons?vel pela ger?ncia de cada cluster. Este gerenciamento adaptativo ? realizado atrav?s de uma heur?stica que ? executada em cada sistema operacional gerente de cluster. Uma infraestrutura de monitoramento h?brido fornece as informa??es necess?rias para a heur?stica adaptativa. Esta infraestrutura ? dividida em dois n?veis hier?rquicos, sendo escal?vel e com um n?vel de intrus?o que corresponde no pior caso a 0,8% de utiliza??o do enlace da NoC. O gerenciamento adaptativo de QoS em tempo de execu??o age na computa??o, comunica??o ou em ambos e faz com que aplica??es de tempo real flex?veis possam restaurar seu desempenho ap?s detectado uma queda do mesmo pelo monitoramento. Neste trabalho ? tamb?m proposta uma ferramenta de depura??o para MPSoCs baseados em NoC, esta ferramenta fornece depura??o no n?vel de protocolo de comunica??o ente os PEs,e facilita o processo de implementa??o, valida??o e obten??o de resultados de novos protocolos para o sistema. INFORM?TICA ARQUITETURA DE COMPUTADOR MULTIPROCESSADORES

Search results