Spelling suggestions: "subject:"distribuídos"" "subject:"distribuída""
161 |
Sobrevivência em arquiteturas de grade computacional baseadas em redes ópticas e gerenciadas por algoritmo de otimização por colônias de formigasFrederico, Andre Ricardo January 2017 (has links)
Orientador: Prof. Dr. Gustavo Sousa Pavani / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2017. / Algoritmos baseados em Otimização por Colonia de Formigas (Ant Colony Optimization
{ ACO) vem sendo usados com bastante sucesso no metaescalonamento distribuído
e integrado dos recursos de computação e de comunicação em ambientes de grade computacional baseadas em redes opticas (lambda grid ). Nesse ambiente sao utilizados infraestruturas de comunicações compostas por enlaces de fibras opticas e nós opticos, que são elementos sujeitos aos mais variados tipos de falhas. Com efeito, problemas decorrentes
dos equipamentos ou meios de transmissão podem interromper o trafego de informações
e, consequentemente, causam a indisponibilidade de recursos na grade.
A arquitetura proposta em [1] é capaz de gerenciar dinamicamente e de forma conjunta
os recursos de rede e processamento no ambiente de lambda grid, além de prover
agendamento e reserva futura desses recursos. Neste trabalho, considerar-se-à tambem
a capacidade de sobrevivencia da grade sob condições adversas de falhas. Para tanto,
a grade computacional deve prover mecanismos de restauração de forma a se recuperar
em caso de falhas de enlace ou nó. Simulações foram realizadas com os diversos algoritmos
de metaescalonamento propostos originalmente em [1], demonstrando o respectivo
desempenho em termos de capacidade de restauração e de atraso de execução das tarefas
restauradas. / Algorithms based on Ant Colony Optimization (ACO) have been successfully used
in distributed and integrated meta-scheduling of computing and networking resources in
lambda grids. The lambda grid environment is composed by optical fiber links and optical
nodes, which are susceptible to diferent types of failure. In eect, problems due to equipment
or transmission outages may interrupt the information trac and, consequently,
cause unavailability of grid resources.
The architecture proposed in [1] is capable of the dynamic, joint management of networking
and processing resources at the lambda grid. It can also provide scheduling and
advance reservation of those resources. In this work, we also consider the survivability
capacity of the lambda grid when a failure occurs. Therefore, the lambda grid has to provide
a restoration mechanism in order to recover from link and node failures. Simulations
carried with the meta-scheduling algorithms originally proposed in [1] demonstrate their
performance in terms of restorability and delay in scheduling the restored tasks.
|
162 |
Uma heuristica de agrupamento de caminhos para escalonamento de tarefas em grades computacionaisBittencourt, Luiz Fernando, 1981- 15 March 2006 (has links)
Orientador: Edmundo Roberto Mauro Madeira / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-06T12:20:00Z (GMT). No. of bitstreams: 1
Bittencourt_LuizFernando_M.pdf: 1217558 bytes, checksum: dcbdeb1eaf538ae17a83304451a73126 (MD5)
Previous issue date: 2006 / Resumo: Uma grade computacional é um sistema heterogêneo colaborativo, geograficamente distribuído, multi-institucional e dinâmico, onde qualquer recurso computacional ligado a uma rede, local ou não, é um potencial colaborador. Grades computacionais são atualmente um grande foco de estudos relacionados à execução de aplicações paralelas, tanto aquelas que demandam grande poder computacional quanto aquelas que se adaptam bem a ambientes distribuídos. Como os recursos de uma grade pertencem a vários domínios administrativos diferentes com políticas diferentes, cada recurso tem autonomia para participar ou deixar de participar da grade em qualquer momento. Essa característica dinâmica e a heterogeneidade tornam o escalonamento de aplicações, a gerência de recursos e a tolerância a falhas grandes desafios nesses sistemas. Particularmente, o escalonamento desempenha um papel de suma importância, pois é determinante no tempo de execução das aplicações. O escalonamento de tarefas é um problema NP-Completo [6], o que levou ao desenvolvimento de uma heurística para o problema de otimização associado. Neste trabalho apresentamos um escalonador de tarefas em grades computacionais baseado no Xavantes [3], um middleware que oferece suporte a execução de tarefas dependentes através de estruturas de controle hierárquicas chamadas controladores. O algoritmo desenvolvido, chamado de Path Clustering Heuristic (PCH), agrupa as tarefas com o objetivo de minimizar a comunicação entre os controladores e as tarefas, diminuindo o tempo de execução total do processo / Abstract: A computational grid is a collaborative heterogeneous, geographically distributed, multiinstitutional and dynamic system, where any computational resource with a network connection, local or remote, is a potential collaborator. In computational grids, problems related to the execution of parallel applications, those which need a lot of computational power, as well as those which fit well in distributed environments, are wide studied nowadays. As the grid resources belong to various different administrative domains with different policies, each resource has the autonomy to participate or leave the grid at any time. These dynamic and heterogeneous characteristics make the application scheduling, the resource management and the fault tolerance relevant issues on these systems. Particularly, the scheduler plays an important role, since it is determinative in the execution time of an application. The task scheduling problem is NP-Complete [6], what led to the development of a heuristic for the associated optimization problem. In this work we present a task scheduler for a computational grid based on Xavantes [3], a middleware that supports dependent task execution through control structures called controllers. The developed algorithm, called Path Clustering Heuristic (PCH), clusterizes tasks aiming to minimize the communication between controllers and tasks, reducing the process execution time / Mestrado / Sistemas de Computação / Mestre em Ciência da Computação
|
163 |
Uma arquitetura para acesso a serviços de telecomunicções baseada em TINA / A TINA-based architecture for accessing telecomunications servicesOliveira, Eduardo Jacob 09 March 1999 (has links)
Orientador: Eleri Cardozo / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-26T08:33:51Z (GMT). No. of bitstreams: 1
Oliveira_EduardoJacob_M.pdf: 7451976 bytes, checksum: be31a9be0d9d9c5f7aaa369f9c4010aa (MD5)
Previous issue date: 1999 / Resumo: Nos últimos anos o mercado de telecomunicações tem passado por mudanças profundas devido a fatores como desregulamentação, aumento da competição entre as operadoras e aumento da demanda para o oferecimento de novos serviços, mais avançados e complexos. Entretanto, a introdução desses novos serviços, no âmbito de telecomunicações, encontra uma forte barreira em uma infra-estrutura que tem sido voltada para a conexão de usuários, e não para o oferecimento de serviços. O consórcio TINA (Telecommunications Information Networking Architecture) define uma arquitetura de sojtware para serviços de telecomunicações, norteada por conceitos de "re-uso" de componentes de sojtware, transparência de distribuição e utilização de padrões abertos, visando o desenvolvimento e gerência de serviços de qualquer complexidade. Por sua vez, o crescimento da World Wide Web (WWW) na Internet, a partir de meados desta década, popularizou o uso dos browsers Web no acesso aos serviços de informação e comunicação, tornando-os padrão de facto para a interface e interação com o usuário, assim como peça-chave no desenvolvimento de aplicações. Este trabalho apresenta uma arquitetura para acesso a serviços de telecomunicações baseada nos conceitos da Arquitetura de Serviço TINA e implementada utilizando as tecnologias Web e de objetos distribuídos, por meio de uma plataforma CORBA (Common Object Request Broker A rchitecture ). ...Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: The telecommunications market has experienced dramatic changes pushed by factors such as deregulation, competition between operators, and the increasing demand for more advanced and complex services. However, the introduction of these new services is limited by the current telecommunications infrastructure, that was designed to connect end users, not to offer services to them. The Telecommunications Information Networking Architecture (TINA) consortium defines acommon software architecture for providing telecommunications services, using concepts of "reuse" of software components, distribution transparency, and open standards, and aiming at the implementation and management of services of any complexity. On the other hand, the explosion of the World Wide Web (WWW) in the Internet since the middle of the 90's has popularized the Web browsers as an access mechanism to information and communication services. Web browsers have become the de facto standard for interfacing and interacting with the user and a key tool for. the development of applications. ...Note: The complete abstract is available with the full electronic digital thesis or dissertations / Mestrado / Mestre em Engenharia Elétrica
|
164 |
Um sistema de video-conferencia para educação a distancia baseado em padrões abertosBosnardo, Raquel Cristina 30 July 2001 (has links)
Orientador : Eleri Cardozo / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-28T22:47:43Z (GMT). No. of bitstreams: 1
Bosnardo_RaquelCristina_M.pdf: 5414563 bytes, checksum: 544795dcf9e396a0241a2e0bb1dfee6c (MD5)
Previous issue date: 2001 / Resumo: Este trabalho descreve o desenvolvimento de um sistema de videoconferência para redes de alto desempenho, que pode ser integrado em sistemas de educação a distância os quais necessitam desta funcionalidade. O sistema é portável, não proprietário e distribuído e permite a interação entre professor e estudante (em um ambiente de educação a distância) através de transmissões em áudio e vídeo, e através de notificações por eventos.
Para a implementação, foram utilizadas a arquitetura CORBA (Common Object Request Broker Architecture) e a linguagem Java. Dois serviços CORBA foram empregados: AIV Streams para o transporte da mídia contínua e o Serviço de Eventos para a notificação de eventos. O projeto e desenvolvimento utiliza tecnologias modernas tais como UML (Unified Modeling Language), componentes de software, e orientação a objetos / Abstract:This dissertation deseribes the development of a videoconference system targeted to high speed networks that can be integrated into distance learning systems lacking of this functionality. The system is designed to be portable, open, and distributed, allowing the integration among teacher and students (in a distance Jearning environment) through live audio and video, and event notifications. The impJementation relies on the CORBA (Common Object Request Broker
Architecture) architecture and the Java language. Two CORBA services were employed: AIV Streams for eontinuous media transport and Event Service for event notification. The design and development employ modem technologies such as UML (Unified Modeling Language), software components, and object-orientation / Mestrado / Engenharia Eletrica / Mestre em Engenharia Elétrica
|
165 |
Desenvolvimento de sistemas TINA utilizando a linguagem de especificação formal SDL com geração automatica de codigo JavaGuimarães, Rafael Paoliello 31 July 2018 (has links)
Orientador : Walter da Cunha Borelli / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-31T15:19:09Z (GMT). No. of bitstreams: 1
Guimaraes_RafaelPaoliello_M.pdf: 1024865 bytes, checksum: 71e403fc82a4651fb1f0d61fa6da36be (MD5)
Previous issue date: 2001 / Mestrado
|
166 |
Estrategias para comercialização de recursos computacionais em desktop grids / Strategies for computational resources trading in desktop gridsGois, Lourival Aparecido de 14 August 2018 (has links)
Orientador: Walter da Cunha Borelli / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-14T06:39:19Z (GMT). No. of bitstreams: 1
Gois_LourivalAparecidode_D.pdf: 1692406 bytes, checksum: ee697c2c8ee85fea4e2c5f9448722ac5 (MD5)
Previous issue date: 2009 / Resumo: A associação de máquinas ociosas em arquiteturas denominadas desktop grids, representam um avanço significativo na solução de problemas complexos nas áreas de ciências, engenharia, comércio entre outras. A grande dificuldade na implementação e na continuidade destas arquiteturas está em manter os níveis de disponibilidades exigidos por seus usuários, já que em sua maioria, são constituídas por voluntários que compartilham seus recursos sem nenhum compromisso formalizado. Esta tese propõe estratégias destinadas à modelagem de um sistema de gerenciamento de recursos denominado DGridE - Desktop Grid Economy, fundamentado nos princípios microeconômicos que orientam os mercados tradicionais de bens e serviços. São apresentados os mecanismos que permitem aos fornecedores identificarem e informarem suas disponibilidades ao gerente da cooperativa a qual pertencem. Também são propostas estratégias que permitem ao DGridE a estruturação de um mercado de recursos computacionais, com a integração de seus componentes por meio de mecanismos de formação de preços, negociação intra e inter cooperativas e controle das transações comerciais decorrentes dos processos de compartilhamento. As contribuições individuais no mercado interno da cooperativa e as expectativas dos consumidores e fornecedores, foram inseridas no mecanismo de formação dos preços de compra e venda, buscando com isto, aumentar o nível de satisfação dos participantes do mercado. / Abstract: The association of idle machines in desktop grids architectures represents a significant progress in the solution of complex problems in areas as science, engineering, trade and others. The difficulty in the implementation and in the continuity of these architectures is to maintain the levels of availability demanded by their users. In its majority, the users are constituted by volunteers that share their resources without any formalized commitment. This thesis proposes strategies for the design of a resources administration system called DGridE - Desktop Grid Economy, based on the microeconomics principle of traditional markets of goods and services. This approach allowed the structuring of a computational resource market through the utilization of formation prices mechanisms, negotiation inside and outside of the administrative domain and control of commercial transactions of the sharing processes. The individual satisfactions reached based on the well succeed sharing were appraised in order to determine their influences in the continuity of the market. / Doutorado / Telecomunicações e Telemática / Doutor em Engenharia Elétrica
|
167 |
GPO : um middleware para orquestração de serviços em grades computacionais / A middleware for service orchestration in computacional gridsSenna, Carlos Roberto, 1956- 27 February 2007 (has links)
Orientador: Edmundo Roberto Mauro Madeira / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-09T11:43:09Z (GMT). No. of bitstreams: 1
Senna_CarlosRoberto_M.pdf: 1604896 bytes, checksum: 4d91ce46c46772043ce75490d16c3b98 (MD5)
Previous issue date: 2007 / Resumo: No ambiente colaborativo das grades computacionais são poucas as ferramentas para gerência de processos e serviços orientadas ao usuário. Esta dissertação apresenta o Grid Process Orchestration (GPO), uma infraestrutura que faz orquestração de serviços e processos em grades computacionais, permitindo ao usuário criar e gerenciar ?uxos complexos, com tarefas fortemente acopladas, sem suporte adicional. O GPO é baseado na OGSA (Open Grid Services Architecture) e descreve os ?uxos usando o conceito de orquestra¸ao de serviços Web aplicados aos serviços das Grades Computacionais. A dissertação descreve a arquitetura da infraestrutura proposta, detalha seus principais componentes, suas funcionalidades para gerência de ?uxos e alguns aspectos do protótipo implementado. Além disso, propõe uma linguagem compacta para descrever os work?ows. Uma aplicação exemplo é apresentada ilustrando as facilidades da infraestrutura proposta / Abstract: In the collaborative environment of the Computational Grids, there are few tools used for process management and user guide services. This work presents the Grid Process Orchestration (GPO), an infrastructure for service and process orchestration in computational grids, which allows to create and manage complex work?ows composed of strongcoupled jobs with no additional support. The GPO is based on the Open Grid Services Architecture (OGSA) and describes work?ows using Web Services orchestration concepts applied to computational grid services. This work describes the architecture of the proposed infrastructure, detailing its main components, functionalities for ?ow management, and shows an implemented prototype. In addition to the architecture, it proposes a compact language for describing work?ows. An application example is presented to illustrate the facilities of the proposed infrastructure / Mestrado / Redes de Computadores / Mestre em Ciência da Computação
|
168 |
DSI-RTree - Um Índice R-Tree Distribuído Escalável / DSI-RTree - A distributed Scalable R-Tree IndexOLIVEIRA, Thiago Borges de 15 December 2010 (has links)
Made available in DSpace on 2014-07-29T14:57:47Z (GMT). No. of bitstreams: 1
dissertacao thiago b de oliveira 2010.pdf: 575961 bytes, checksum: 7a5a7e195780fa853d33c7629520df2a (MD5)
Previous issue date: 2010-12-15 / The demand for spatial data processing systems that support the creation of massive applications has steadily grown in the increasingly ubiquitous computing world. These demands aims to explore the large amount of existing data to assist people s daily lives and provide new tools for business and government. Most of the current solutions to process spatial data do not meet the scalability needed, and thus new solutions that efficiently use distributed computing resources are needed. This work presents a distributed and scalable
system called DSI-RTree, which implements a distributed index to process spatial data in a cluster of computers. We also have done a review of details related to the construction
of the distributed spatial index, by addressing issues such as the size of data partitions, how that partitions are distributed and the impact of these definitions in the message flow
on the cluster. An equation to calculate the size of the partitions based on the size of data sets is proposed, to ensure efficiently query processing on the proposed architecture. We have done some experiments running window queries in spatial data sets of 33,000 and 158,000 polygons and the results showed a scalability greater than linear. / Em face de um mundo computacional ubíquo cada vez mais possível, tem crescido constantemente a necessidade de sistemas de processamento de dados espaciais que suportem
a criação de aplicações massivas para explorar a grande quantidade de dados existente, a fim de auxiliar a vida cotidiana das pessoas e prover novas ferramentas para empresas e governo. Soluções atuais de processamento, em sua maioria, não possuem a escalabilidade necessária para atender esta demanda e novas soluções distribuídas que usam eficientemente os recursos computacionais são necessárias. Este trabalho apresenta o DSIRTree, um sistema distribuído e escalável, que implementa a indexação e processamento
distribuído de dados espaciais em um cluster de computadores. Uma avaliação de parâmetros da construção do índice espacial distribuído é realizada, abordando aspectos como o tamanho das partições criadas, a forma de distribuição destas partições e o impacto destas definições na troca de mensagens entre as máquinas do cluster. Uma fórmula para cálculo do tamanho das partições conforme o tamanho dos datasets é proposta, a fim de garantir eficiência no processamento de consultas na arquitetura projetada. Testes práticos do sistema mostraram uma escalabilidade maior que linear no processamento de consultas de janela em datasets espaciais de 32 e 158 mil polígonos.
|
169 |
Uma estratégia para o desenvolvimento de habilidades de comunicação e colaboração para futuros engenheiros de softwareFortaleza, Luiz Leandro dos Reis 20 June 2013 (has links)
Made available in DSpace on 2015-04-11T14:03:01Z (GMT). No. of bitstreams: 1
Luiz Leandro dos Reis Fortaleza.pdf: 2077496 bytes, checksum: 9190072bf4351fdd7e773bc46292d03a (MD5)
Previous issue date: 2013-06-20 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The software industry needs professionals who, in addition to technical knowledge,
possess certain skills that positively affect the development process
software. In this dissertation initially held up a mapping
systematic about which skills are reported in the literature as being
more important for the software engineer. This mapping served to limit
the scope of this work to the skills of communication and collaboration.
The development of communication skills and collaboration, according to several
authors, occurs from practical activities. Therefore, try to enable the best
students, with regard to communication and collaboration, would integrate them into projects
with industry. However, it is not always possible to establish partnerships with industry
software. An alternative is to simulate the industrial scenario in the academic environment.
A practice that has grown in the industry is the geographical distribution of staff
development, known as Distributed Software Development (DSD).
Then, simulate a scenario DDS is a possible way to bring students from
reality of the software industry. This is the approach proposed in this dissertation.
Two experimental studies were conducted to obtain evidence about the effectiveness
the proposed pedagogical approach. Every experiment we sought to improve
way of collecting and analyzing data, and performed the triangulation of these data aimed
obtaining the most reliable conclusions. It was observed that the use
DDS is quite motivating for students, but there are other factors that
This affect motivation, such as the affinity between team members
co-allocated. Properly manage these factors in order to maintain participants
motivated, can be the difference between success and failure of the activity of teaching, one
Since skill development is influenced by motivation. / A indústria de software precisa de profissionais que, além do conhecimento técnico,
possuam determinadas habilidades que afetam positivamente o processo de desenvolvimento
de software. Nesta dissertação de mestrado realizou-se inicialmente um mapeamento
sistemático sobre quais habilidades são reportadas pela literatura como sendo
mais importantes para o engenheiro de software. Este mapeamento serviu para limitar
o escopo deste trabalho às habilidades de comunicação e colaboração.
O desenvolvimento de habilidades de comunicação e colaboração, segundo diversos
autores, ocorre a partir de atividades práticas. Portanto, tentar capacitar melhor os
alunos, no que diz respeito à comunicação e colaboração, seria integrá-los em projetos
com a indústria. Todavia, nem sempre é possível estabelecer parcerias com a indústria
de software. Uma alternativa é simular o cenário industrial em ambiente acadêmico.
Uma prática que tem crescido na indústria é a distribuição geográfica da equipe
de desenvolvimento, conhecida como Desenvolvimento Distribuído de Software (DDS).
Então, simular um cenário DDS é uma possível forma de aproximar os alunos da
realidade da indústria de software. Esta é a abordagem proposta nesta dissertação.
Foram realizados dois estudos experimentais visando obter indícios sobre a eficiência
da abordagem pedagógica proposta. A cada experimento buscou-se aprimorar a
forma de coleta e análise dos dados, e efetuou-se a triangulação destes dados visando
a obtenção de maior confiabilidade para as conclusões. Observou-se que a utilização
de DDS é bastante motivadora para os alunos, todavia existem outros fatores que
afetam esta motivação, como por exemplo a afinidade entre os membros das equipes
co-alocadas. Gerenciar adequadamente tais fatores, visando manter os participantes
motivados, pode ser o diferencial entre sucesso e fracasso da atividade de ensino, uma
vez que o desenvolvimento de habilidades é influenciado pela motivação.
|
170 |
Uma solução de alta disponibilidade para o sistema de arquivos distribuidos do Hadoop / A high availability solution for the Hadoop distributed file systemOriani, André, 1984- 22 August 2018 (has links)
Orientador: Islene Calciolari Garcia / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-22T22:11:10Z (GMT). No. of bitstreams: 1
Oriani_Andre_M.pdf: 3560692 bytes, checksum: 90ac96e4274dea19b7bcaec78aa959f8 (MD5)
Previous issue date: 2013 / Resumo: Projetistas de sistema geralmente optam por sistemas de arquivos baseados em cluster como solução de armazenamento para ambientes de computação de alto desempenho. A razão para isso é que eles provêm dados com confiabilidade, consistência e alta vazão. Porém a maioria desses sistemas de arquivos emprega uma arquitetura centralizada, o que compromete sua disponibilidade. Este trabalho foca especificamente em um exemplar de tais sistemas, o Hadoop Distributed File System (HDFS). O trabalho propõe um hot standby para o nó mestre do HDFS a fim de conferir-lhe alta disponibilidade. O hot standby é implementado por meio da (i) extensão da replicação de estado do mestre realizada por seu checkpoint helper, o Backup Node; e por meio da (ii) introdução de um mecanismo automático de failover. O passo (i) aproveitou-se da técnica de duplicação de mensagens desenvolvida por outra técnica de alta disponibilidade para o HDFS chamada Avatar Nodes. O passo (ii) empregou ZooKeeper, um serviço distribuído de coordenação. Essa estratégia resultou em mudanças de código pequenas, cerca de 0,18% do código original, o que faz a solução ser de fácil estudo e manutenção. Experimentos mostraram que o custo adicional imposto pela replicação não aumentou em mais de 11% o consumo médio de recursos pelos nós do sistema nem diminuiu a vazão de dados comparando-se com a versão original do HDFS. A transição completa para o hot standby pode tomar até 60 segundos quando sob cargas de trabalho dominadas por operações de E/S, mas menos de 0,4 segundos em cenários com predomínio de requisições de metadados. Estes resultados evidenciam que a solução desenvolvida nesse trabalho alcançou seus objetivos de produzir uma solução de alta disponibilidade para o HDFS com baixo custo e capaz de reagir a falhas em um breve espaço de tempo / Abstract: System designers generally adopt cluster-based file systems as the storage solution for high-performance computing environments. That happens because they provide data with reliability, consistency and high throughput. But most of those fie systems employ a centralized architecture which compromises their availability. This work focuses on a specimen of such systems, the Hadoop Distributed File System (HDFS). A hot standby for the master node of HDFS is proposed in order to bring high availability to the system. The hot standby was achieved by (i) extending the master's state replication performed by its checkpointer helper, the Backup Node; and by (ii) introducing an automatic failover mechanism. Step (i) took advantage of the message duplication technique developed by other high availability solution for HDFS named AvatarNodes. Step (ii) employed ZooKeeper, a distributed coordination service. That approach resulted on small code changes, around 0.18% of the original code, which makes the solution easy to understand and to maintain. Experiments showed that the overhead implied by replication did not increase the average resource consumption of system nodes by more than 11% nor did it diminish the data throughput compared to the original version of HDFS. The complete transition for the hot standby can take up to 60 seconds on workloads dominated by I/O operations, but less than 0.4 seconds when there is predominance of metadata requisitions. Those results show that the solution developed on this work achieved the goals of producing a high availability solution for the HDFS with low overhead and short reaction time to failures / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
Page generated in 0.0738 seconds