[en] A SYSTEMATIC FOR ERROR MONITORING IN DISTRIBUTED SYSTEMS / [pt] UMA SISTEMÁTICA DE MONITORAMENTO DE ERROS EM SISTEMAS DISTRIBUÍDOS

[pt] Sistemas formados por componentes distribuídos possibilitam a ocorrência
de falhas provenientes da interação entre componentes. A etapa de testes desta
classe de sistemas é árdua, já que prever todas as interações entre
componentes de um sistema é inviável. Portanto, ainda que um sistema de
componentes seja testado, a ocorrência de erros em tempo de execução
continua sendo possível e, evidentemente, esses erros devem ser observados
disparando alguma ação que impeça de causarem grandes danos. Este trabalho
apresenta um mecanismo de identificação de erros de inconsistência semântica
de tipos baseado em logs estruturados. Falhas de inconsistência semântica de
tipos são falhas decorrentes da interpretação errônea de valores que são
representados sintaticamente sob os mesmos tipos básicos. O mecanismo
proposto consiste na geração de logs estruturados conforme a definição de
interfaces de comunicação e a identificação de anomalias através de uma
técnica existente de verificação de contratos. Além disso, o mecanismo propõe
um modelo de gestão taxonômica de tipos semânticos utiliza a técnica de
Raciocínio Baseado em Casos (RBC). O mecanismo de identificação de falhas
foi implementado através de uma extensão do middleware Robot Operation
System (ROS). O mecanismo, além de observar erros, gera informação
complementar que visa auxiliar a diagnose da causa do erro observado.
Finalmente, uma prova de conceito aplicada a um sistema de controle de
locomoção de um robô híbrido, adaptado de um sistema real, foi desenvolvida
para a validação da identificação de falhas. / [en] Systems formed by distributed components enable the occurrence of faults
arising from the interaction between components. The stage of testing this class
of systems is difficult, since foresee all interactions between components of a
system is not feasible. Therefore, even if a component system is tested, the
occurrence of run-time errors is still possible and, of course, these errors should
be seen shooting some action that prevents them from causing major damage.
This paper presents an identification mechanism of errors given by semantic
inconsistency typed data, based on structured logs. Semantic inconsistency of
typed data could cause failures due to the misinterpretation of values that are
represented syntactically under the same basic types. The proposed mechanism
consists in generating structured logs according to the definition of
communication interfaces, and identifying anomalies by an existing contract
verification technique. In addition, the mechanism proposes a management
model of taxonomic semantic types using the Case-Based reasoning technique
(CBR). The fault identification mechanism was implemented through an
extension of the Robot Operation System middleware (ROS). The mechanism, in
addition to observing errors, generates additional information which aims to assist
the diagnosis of the cause of the observed error. Finally, a proof of concept
applied to a locomotion control system for a hybrid robot, adapted from a real
system, has been developed for fault identification validation.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:26525
Date02 June 2016
CreatorsCARLA GALDINO WANDERLEY
ContributorsARNDT VON STAA
PublisherMAXWELL
Source SetsPUC Rio
LanguagePortuguese
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.0056 seconds