Made available in DSpace on 2014-06-12T17:39:40Z (GMT). No. of bitstreams: 2
arquivo6931_1.pdf: 2770678 bytes, checksum: 56abc1e9ebe7d0b4bfc3fa9b7bd71858 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2006 / Em projetos de digitalização de alto volume de documentos, a imagem dos
documentos digitalizados pode ser gerada com vários defeitos acarretando dificuldades
desde a sua leitura até sua transcrição automática. Além disso, o alto volume de
documentos a serem processados gera a necessidade de automatização do processo de
digitalização e à procura por melhores soluções para esses problemas.
Esta dissertação aborda os seguintes problemas encontrados nos documentos
digitalizados monocromáticos: detecção e remoção de borda preta e; detecção e correção da
orientação e enviesamento. Um novo filtro para remoção de borda preta foi desenvolvido,
testado em 21 mil documentos e comparado com várias ferramentas comerciais. Um novo
algoritmo de detecção de orientação e enviesamento com capacidade de estimar a rotação
em qualquer ângulo com uma precisão de 0,1º foi desenvolvido e comparado com outro
método da literatura. Um segundo algoritmo de detecção de enviesamento foi proposto com
o objetivo de aumentar o desempenho do processamento. Observaram-se três problemas na
correção de rotação do algoritmo clássico: pontos brancos, contorno acidentado e
desconexão de parte dos objetos. Um algoritmo de correção de rotação foi proposto com
capacidade de corrigir os três problemas. Um método quantitativo para medir a degradaçãodos algoritmos de correção de rotação foi introduzido e utilizado para comparar o novo
algoritmo com outros da literatura.
Além dos filtros, duas arquiteturas para processamento de documentos digitalizados
monocromáticos foram estudadas: seqüencial e cluster. Um ambiente visual, intitulado
BigBatch, foi construído com ambas as arquiteturas. A arquitetura em grid foi apenas
especulada
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/5453 |
Date | January 2006 |
Creators | Tenório Ávila, Bruno |
Contributors | Dueire Lins, Rafael |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.1098 seconds