[pt] Esta dissertação aborda o problema da recuperação de erros
em sistemas distribuídos. Inicialmente, é feita uma breve
análise sobre a origem deste problema e as soluções
encontradas. Alguns métodos de resolução são então
apresentados. Para a simulação do sistema distribuído foi
desenvolvido um núcleo multi-tarefa numa máquina
compatível com o PC-IBM-XT, utilizando o MS-DOS (versão
3.0 ou acima) como servidor. Finalmente, são apresentadas
duas propostas. A primeira visa fornecer a um processo
recursos que possibilitem a recuperação por retorno. A
segunda utiliza redundância em um conjunto de processos em
diferentes estações para garantir que o sistema como um
todo continue operativo, mesmo com uma estação de falha / [en] This dissertation deals with the problem of fault
tolerance in distributed systems. Initially, a brief
analysis on the origins of this problem and its solutions
is made. Some of the resolutions methods are then
presented. In order to simulate a distributed system, a
multi tasking operating system kernel was developed in an
IBM PC-XT compatible machine, making use of the MS-DOS
(version 3.0 or above) as a server. Finally, two proposals
are presented. The first, is intended to supply a process
with resources that allow recovery in case of algorithmic
faults, making use of the backward error recovery method.
The second, uses redundancy in a set of processes over
different stations in order to warrant that the system as
a whole keeps operative, even with a faulty s
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:9411 |
Date | 27 December 2006 |
Creators | ALEXANDRE DE REZENDE ABIBE |
Contributors | JULIUS CESAR BARRETO LEITE |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | Portuguese |
Detected Language | English |
Type | TEXTO |
Page generated in 0.0017 seconds