Made available in DSpace on 2014-06-12T17:35:12Z (GMT). No. of bitstreams: 2
arquivo5391_1.pdf: 5090704 bytes, checksum: 8579bb353f3397d7c9f8d6e90e505f32 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / O processo de digitalização de documentos de maneira automática geralmente
resulta em imagens com características indesejáveis como orientação errada, inclinação
incorreta das linhas do texto e até mesmo a presença de ruídos causados pelo estado de
conservação, integridade física e presença ou ausência de poeira no documento e partes do
scanner. O simples processamento de cada imagem é efetuado em poucos segundos, a sua
transcrição ou busca de palavras-chave para indexação necessita vários segundos de
processamento. O lote produzido por um único scanner de linha de produção pode levar
dias para ser filtrado, dependendo da capacidade de processamento do computador
utilizado. Faz-se necessário distribuir tal tarefa para que o processamento das imagens
acompanhe a taxa de digitalização. Esta tese analisa a viabilidade da computação paralela
em cluster e grades para o processamento de grandes quantidades de imagens de
documentos digitalizados. Diferentes cenários de configuração de computadores e de
distribuição de tarefas foram analisados, sob o ponto de vista do processamento das tarefas
e do tráfego de rede gerado durante o processamento
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/4963 |
Date | 31 January 2008 |
Creators | de Oliveira Mattos, Giorgia |
Contributors | Dueire Lins, Rafael |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0044 seconds