1 |
[en] FAULT TOLERANCE IN RIO ENVIRONMENT / [pt] TOLERÂNCIA A FALHAS NO AMBIENTE RIOOLDAIR FERREIRA GARCIA DE BRITO 31 July 2006 (has links)
[pt] A utilização de tolerância a falhas na construção de
aplicações em sistemas distribuídos é, em geral, uma
tarefa complexa. Para facilitar esta tarefa, pode-se
utilizar um ambiente de desenvolvimento que forneça
técnicas padronizadas e ferramentas para o suporte a
tolerância a falhas. Com esse objetivo, foi concebido um
suporte especializado para a tolerância a falhas. Parte
deste suporte foi implementado e adicionado ao ambiente
RIO (Reconfigurable interconnectable Objects) O RIO é
centrado no conceito de módulos configuráveis que se
comunicam por interfaces bem definidas. O suporte a
tolerância a falhas é obtido a partir de técnicas baseadas
em replicação de módulos de software. Como exemplo, são
apresentadas três técnicas de replicação, Replicação
Passiva Reserva Quente, Replicação Ativa Competitiva e
Replicação Ativa Cíclica, bem como o suporte concebido e
implementado para as mesmas. Os detalhes relevantes desta
implementação são discutidos e, finalmente, apresenta-se
conclusões e sugestões para trabalhos futuros. / [en] The use of fault tolerance in the construction of
distributed systems applications is usually a complex
task. To make this task easier, a development environment
may be used including standard techniques and tools for
the support of fault tolerance. With this purpose, a
specialized fault tolerance support was concepted. Part of
this support was implemented and added to the RIO
(Reconfigurable interconnectable Objects) environment. The
RIO is based on the concept of configurables modules. Well
defined interfaces are used to modules comunication. The
fault tolerance support is obtained by software
replication based techniques. Three replication techniques
examples are presented, Hot Standby Passive Replication,
Competitive Active Replication and Ciclic Active
Replication, as well as the designed support for them.
Important implementation details are discussed and,
finally, conclusions and sugestions for future work are
presented.
|
2 |
[en] A FAULT-TOLERANT MICROCOMPUTER FOR REAL-TIME CONTROL / [pt] UM MICROCOMPUTADOR TOLERANTE A FALHAS PARA CONTROLE EM TEMPO REALHELANO DE SOUSA CASTRO 16 April 2007 (has links)
[pt] Este trabalho descreve o projeto e a implementação de um
microcomputador tolerante a falhas para aplicação em tempo
real.
O sistema é baseado em uma estrutura duplex e utiliza o
conceito de dissimilaridade como forma de reduzir a
influência de falhas de modo comum. Vários mecanismos de
detecção de falhas foram incorporados de forma a melhorar
a cobertura do sistema. Com o objetivo de reduzir o
hardcore, o único elemento central existente é o seletor
de saída, sendo que os processadores sincronizam-se
através da troca de mensagens. / [en] This work describes the design and implementation of a
fault-tolerant microcomputer for real-time control
applications.
The system consists in a duplex structure and the
dissimilarity concept is used in order to minimize the
probability of common-mode faults. Several fault detection
mecanisms were incorporated to increase the coverage of
the system.
|
3 |
[en] INTERCONNECTION ELEMENT FOR A PARALLEL PROCESSING SYSTEM / [pt] ELEMENTO DE CHAVEAMENTO PARA REDES DE INTERCONEXÃO MULTI-ESTÁGIO DE MÁQUINAS MULTIMICROPROCESSADASRENATO JOSE GONCALVES DE NAZARETH 25 June 2007 (has links)
[pt] Este trabalho propõe uma nova estrutura de rede de
interconexão para o sistema de processamento paralelo
MULTIPLUS em desenvolvimento no NCE/UFRJ. A rede é
tolerante a falhas, e trabalha com chaves de 4 entradas e
4 saídas.
Inicialmente, discutem-se as formas de interconexão de
máquinas paralelas. Descrevem-se sucintamente algumas
arquiteturas de sistemas paralelos com ênfase no
MULTIPLUS. A seguir, comentam-se alguns conceitos básicos
a respeito de redes de interconexão. Apresenta-se a árvore
genealógica das redes de interconexão multiestágio,
acompanhada de um breve histórico do surgimento das
mesmas. Destacam-se algumas redes de percurso único
relacionadas com esta dissertação. Após uma introdução
aprofundada sobre tolerância a falhas, descrevem-se
algumas redes tolerantes a falhas. Uma análise bem
estruturada sobre tolerância a falhas lança as bases para
a proposta da rede de interconexão. Introduz-se o
subsistema de interconexão do MULTIPLUS, focalizando a
estrutura e os tipos de mensagens existentes. Discutem-se
vários aspectos relativos à rede proposta, tais como a
topologia, o algoritmo e tipo de roteamento e,
principalmente, o mecanismo de tolerância a falhas.
Descreve-se detalhadamente o projeto do elemento de
chaveamento 4x4, com destaque nas máquinas de estado
controladoras da chave, porém sem detrimento do circuito
de prioridade, do circuito de contagem de pacotes, do
circuito de comparação de tamanho da mensagem, do circuito
de chaveamento, e do circuito de realinhamento de
endereço. Inclui-se também uma descrição detalhada do
funcionamento do elemento de chaveamento. Por fim,
apresentam-se as expectativas de desempenho de uma rede
com 16 entradas e 16 saídas, onde calculam-se o atraso
para percorrer a rede de uma mensagem de leitura (12
pacotes), o atraso médio por pacote, o throughput médio
por porta, e o throughput médio total da rede. Compara-se
o desenho de três redes - uma de tamanho mínimo (4x4),
outra de tamanho máximo (256x256), e outra de tamanho
16x16 - implementadas com chaves 2x2 e 4x4. apresentam-se
os resultados do projeto, incluindo-se as EPLDs
selecionadas, o custo aproximado de uma rede de 256x256
implementada com as referidas EPLDs, e os tempos de
compilação dos blocos componentes da chave. Propõe-se a
implementação da chave em VLSI, bem como a inclusão da
capacidade de comunicação multicast, como futuros
desenvolvimentos. / [en] This work proposes a new structure of interconnection
network for the MULTIPLUS, a parallel processing system
under development at NCE/UFRJ. The network is fault
tolerant, and works with 4 inputs and 4 outputs switches.
Initially, some interconnection forms of parallel machines
are discussed. Some parallel systems architecture are
briefly described with emphasis on MULTIPLUS. Following,
some basic concepts of interconnection networks are
commented. A family tree of multistage interconnection
networks, and a short history of their appearance in the
literature, are presented. Some Single Path Networks, wich
are related with this dissertation, are briefly described.
After a deep introduction of fault tolerance, some fault-
tolerant interconnection network are described. A well-
structured analysis on fault tolerance gives the basis for
the interconnection network proposal. The MULTIPLUS
interconnection subsystem is introduced, focusing the
messages´ types and structure. Various aspects regarding
the proposed network - such as the topology, routing type
and algorithm and, mainly, the fault- tolerance mechanism -
are discussed. The design of the 4x4 switch is described
in details, with emphasis on switch controllers finite
state machines, but also including the priority circuit,
packet counting circuit, message size compariong circuit.
A detailed description of the seitch operation is given.
At last, the expectede performance of a 16 inputs and 16
outpus network, where a reading message (12 packets)
delay, the packet mean delay, port mean throughput, and
overall mean throughput are calculated. The performance of
3 networks - one with minimum size (4x4), other with
maximum size (256x256), and another with 16x16 size, each
of which implemented with 2x2 and 4x4 switches - are
compared. The design results are presented, including the
selected EPLDs, apprximated cost of a 256x256 network
implemented with the already mentioned EPLDs, and the
compiling times of the switch blocks. The switch
implementation in VLSI tecnology, as well the multicast
communication capability, are proposed as future
developments.
|
4 |
[en] TRANSIENT FAULT TOLERANCE BY DISTINCTNESS / [pt] TOLERANCIA A FALHAS TRANSIENTES POR DIVERSIFICAÇÃOALBERTO CLEMENTINO MESQUITA JUNIOR 05 November 2009 (has links)
[pt] Neste trabalho considera-se um sistema de computação geograficamente localizado, destinado ao controle de processos em tempo real. O trabalho tem como objetivo determinar uma política de tolerância a falhas transientes, bem como uma arquitetura de base para o sistema em questão, assim como dispendido para implementá-la.
Abordam-se os pontos chaves necessários a tolerância, os quais são a caracterização das falhas físicas e humanas, as funções de mascaramento, deteção e recuperação após falhas físicas.
O conceito de diversificação é considerado como uma alternativa à deteção e tolerância a falhas humanas (projeto), como também no que diz respeito a capacidade de fornecer uma deteção eficaz de falhas físicas em modo comum, pois proporciona uma independência entre os módulos redundantes quando uma mesma falha os atinge de forma idêntica.
São apresentados uma arquitetura de base e a forma selecionada de colocar em prática a diversificação: a emulação de um dos microprocessadores. / [en] This work consideres a geographically localized computerized control sustem. The aim is to determine a policy of tolerance to transient faults, a well as a basic architecture for the control system. A discussion of the allocated effort to implement it is included here.
They included the characterization of physical and human faults, masking, detection and recovery of physical faults.
The concept of distinctness is considered as an alternative to detection and toleranc3e to human faults and also with respect to the capability to provide an effective detection of physical faults of common mode. This approach provides an independing among redundant modules when the same fault affects them in an identical way.
This work presents a basic architecture which illustrates the use of the concept of distinctness, through the emulation of a microprocessor.
|
5 |
[en] A FAULT TOLERANT MECHANISM FOR WORKFLOW MANAGEMENT SYSTEMS / [pt] UM MECANISMO DE TOLERÂNCIA A FALHAS PARA SISTEMA DE GERENCIAMENTO DE WORKFLOWBERNARDO QUARESMA DIAS 01 February 2011 (has links)
[pt] Nesse trabalho propomos um mecanismo com detecção de falhas, replicação
e gerenciamento de grupos para instrumentação de sistemas de gerenciamento
de workflow com tolerância a falhas. Sistemas de gerenciamento de
workfow demandam alguns recursos específicos de replicação, pois realizam
operações não-determinísticas e não dependem de chamadas externas para
atualização do seu estado. Como estudo de caso, utilizamos um sistema
de automação de procedimentos industriais e analisamos as modificações
necessárias para utilização desse sistema com o mecanismo de tolerância a
falhas proposto. Também avaliamos o impacto no desempenho do sistema
decorrente do uso do mecanismo proposto. / [en] In this work we propose a mechanism for failure detection, group management
and service replication, providing fault tolerance for workflow management
systems. Workflow management systems require specific replication
features, since such systems deal with non-deterministic operations and update
their s internal state without any external calls. As a case study we
use an industrial automation system and analyze the needed modifications
to use the proposed mechanism and evaluate the impact of the mechanism
in the system s performance.
|
6 |
[en] A MULTI-AGENT SYSTEM FOR REAL TIME MONITORING AND DATA ACQUISITION / [pt] UM SISTEMA MULTI-AGENTES PARA MONITORAMENTO E AQUISIÇÃO EM TEMPO REALFREDERICO SILVA GUIMARAES 24 August 2006 (has links)
[pt] Sistemas supervisores envolvendo software embarcados são
encontrados com
freqüência e são responsáveis pela supervisão de
equipamentos que vão
desde máquinas industriais e eletrodomésticos, a
celulares
e PDAs. Muitos
possuem severos requisitos de confiabilidade e tolerância
a
falhas, bem como
características de sistemas de tempo real. Esta pesquisa
investiga o uso de
tecnologias de ponta como Design by Contract, Agentes de
Software, Mock
Objects e Componentes de Software no auxílio ao
desenvolvimento de sistemas
de monitoramento e aquisição em tempo real. Explora-se,
ainda, o conceito de
sistemas orientados à recuperação. Para realizar tal
análise é utilizado como
estudo de caso um sistema de inspeção de dutos, que foi
implementado utilizando
tais tecnologias. De maneira resumida, pode-se dizer que
neste estudo de
caso percebeu-se que o uso dessas tecnologias fez com que
o sistema fosse
desenvolvido em um curto espaço de tempo, sendo que
questões relevantes não
foram prejudicadas, como por exemplo o fato do sistema
ser
robusto e tolerante
a falhas. É importante ressaltar que o sistema
apresentado
se encontra em uso em
inspeções de dutos reais. / [en] Supervisory systems allied to embedded software, a common
subject in the
literature, are responsible by the supervision of
equipments like industrial
machines, household-electric devices, cellular phones and
PDAs. Many of
them have severe requisites of fault tolerance and
reliability as well as real
time systems features. This research investigates the use
of state-of-the-art
technologies such as Design By Contract, Mock Objects,
software agents and
components in the development of real-time monitoring and
data-acquisition
systems. Recovery oriented systems concepts are also
explored. The case study
carried out to the research is a pipeline inspection
software system, which uses
such technologies. In a nutshell, it can be said that this
case study showed strong
evidence that the use of these technologies allowed the
development in a very
short time, without any loss of robustness, fault
tolerance and reliability. The
developed system is currently being used in real pipeline
inspections.
|
7 |
[en] CONTEXT-SENSITIVE EXCEPTION HANDLING / [pt] TRATAMENTO DE EXCEÇÕES SENSÍVEL AO CONTEXTOKARLA NAZARE FERREIRA DAMASCENO 23 October 2006 (has links)
[pt] Tratamento de erros em aplicações móveis sensíveis ao
contexto não é uma
tarefa trivial devido às características peculiares destes
sistemas, como
mobilidade, comunicação assíncrona e aumento de
imprevisibilidade.
Mecanismos convencionais de tratamento de exceções não
podem ser utilizados
por vários motivos. Primeiro, a propagação de erros deve
considerar as mudanças
contextuais que ocorrem constantemente nestes sistemas.
Segundo, as atividades
de recuperação de erros e a estratégia de tratamento de
exceções também precisam
freqüentemente ser selecionadas de acordo com as
informações de contexto.
Terceiro, a própria caracterização de uma exceção pode
depender do contexto dos
dispositivos envolvidos. Embora vários middlewares
orientados a contexto
ofereçam suporte ao desenvolvimento de aplicações móveis,
estes sistemas
raramente fornecem suporte adequado ao tratamento de
exceções. Este trabalho
realiza uma análise das soluções existentes para
tratamento de exceções,
considerando os requisitos de sensibilidade ao contexto.
Além disso, são
propostos um modelo para tratamento de exceções sensível
ao contexto e um
mecanismo implementado a partir de MoCA (Mobile
Collaboration Architecture).
MoCA é um middleware publish-subscribe que oferece suporte
ao
desenvolvimento de aplicações móveis colaborativas através
da incorporação de
serviços de contexto. Finalmente, este trabalho avalia o
mecanismo de exceções
proposto através de sua utilização em alguns protótipos de
aplicações
colaborativas desenvolvidas a partir de MoCA. Através do
mecanismo, foram
implementadas diferentes estratégias de tratamento de
exceções que consideram
as informações de contexto das aplicações. / [en] Context-sensitive exception handling on mobile systems is
not a trivial task
due to their intrinsic characteristics: mobility,
asynchrony and increased
unpredictability. Conventional mechanisms of exception
handling can not be used
for many reasons. First, error propagation needs
considering the contextual
changes that often occur in these systems. Second, error
recovery and exception
handling strategies also frequently need to be selected
according to contextual
information. Third, the characterization of an exception
may depend on the
contextual situation of involved devices. Even though
there are now several
context-oriented middleware systems that provide support
for the development of
mobile applications, they rarely provide explicit and
adequate features for contextsensitive
exception handling. This work presents an analysis of
existing exception
handling mechanisms, which to some extent consider the
context-awareness
requirements. Besides, it proposes a general model for
context-sensitive exception
handling and a supporting mechanism implemented using the
MoCA (Mobile
Collaboration Architecture) infrastructure. MoCA is a
publish-subscribe
middleware supporting the development of collaborative
mobile applications by
incorporating explicit services to empower software agents
with contextsensitiveness.
Finally, this paper reports our experience in implementing
contextaware
exception handling strategies in some prototype
collaborative applications
built with the MoCA system.
|
8 |
[en] DEPENDABILITY OF OPEN MULTI-AGENT SYSTEMS BASED ON A LAW-GOVERNED APPROACH / [pt] FIDEDIGNIDADE DE SISTEMAS MULTIAGENTES ABERTOS GOVERNADOS POR LEISMAIRA ATHANAZIO CERQUEIRA GATTI 16 March 2007 (has links)
[pt] Com o aumento da complexidade dos SMA´s governados por
leis, tornouse
mais difícil projetar e implementar requisitos referentes
à tolerância a falhas,
principalmente por não existir nenhum ponto de controle
sobre tais sistemas. E,
apesar disto, não são conhecidas soluções que abordem tais
questões na
literatura de governança de SMA´s baseados em leis.
Contudo, existe uma
técnica de tolerância a falhas, chamada Replicação de
Agentes, que propõe
reutilizar os conceitos de recuperação em sistemas
distribuídos através da
tolerância a falhas para a recuperação de agentes baseando-
se em informações
que identifiquem suas criticalidades. Entretanto, apesar
de existirem algumas
estratégias de estimativa de criticalidade de agentes,
nenhuma apresenta o grau
de granularidade suficiente para o monitoramento de SMA´s
abertos
governados por leis. Desta forma, o trabalho aqui proposto
tem como objetivo
apresentar um mecanismo de configuração de variação de
criticalidade de
agentes que interagem em SMA´s abertos. Para isto é
proposta uma arquitetura
para desenvolvimento de SMA´s abertos governados por leis
tolerantes a falhas
e uma abordagem para projetar tais mecanismos com
simplicidade,
modularidade e reuso. Este trabalho apresenta três
contribuições principais: a
extensão no modelo conceitual da linguagem declarativa de
especificação de lei
XMLaw com elementos para monitoramento da criticalidade
dos agentes; a
integração dos frameworks de governança de SMA´s abertos
(M-Law) e de
adaptação dinâmica de replicação de agentes (DIMAX); e a
proposição de uma
forma de documentação e derivação das leis. Por fim são
apresentadas planilhas
de resultados da aplicação do mecanismo proposto em dois
estudos de caso. / [en] With law-governed multi-agent systems complexity growth,
it is harder to
design and implement requirements related to dependability
mainly because
there is no control point over such systems. Despite the
great importance of
those problems, there is no solution that fully addresses
those issues in the
context of law-governed multi-agent systems. However,
there is a fault tolerant
technique called Agent Replication that proposes the reuse
of some recovery
concepts of distributed systems through a fault tolerance
based approach on
some data that helps the identification of critical agent.
And, besides the
existents strategies of agents´ criticality estimation,
none of them presents the
granularity degree necessary for the monitoring of law-
governed open MAS´s.
Due to it, the goal of this work is to present a mechanism
of the configuration
variation of the agents´ criticality that interacts in
open MAS´s. To achieve this
goal, an architecture to support the development of fault
tolerant law-governed
open MAS and an approach to design such mechanisms with
simplicity,
modularity and reuse were proposed. This work has three
main contributions:
an extension on the conceptual model of the law-
specification declarative
language XMLaw within new elements to monitor the agents´
criticality; the
integration of two frameworks: one is for law-enforcement
(M-Law), and the
other one is for a dynamic and adaptative agents´
replication (DimaX); and a
proposal of a means to document and derive the laws.
Finally, we present some
sheets of the results of the proposed mechanism
application in two case studies.
|
Page generated in 0.0838 seconds