Spelling suggestions: "subject:"remoção dde borde preto"" "subject:"remoção dee borde preto""
1 |
Algoritmos e arquiteturas para processamento de documentos digitalizados monocromáticosTenório Ávila, Bruno January 2006 (has links)
Made available in DSpace on 2014-06-12T17:39:40Z (GMT). No. of bitstreams: 2
arquivo6931_1.pdf: 2770678 bytes, checksum: 56abc1e9ebe7d0b4bfc3fa9b7bd71858 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2006 / Em projetos de digitalização de alto volume de documentos, a imagem dos
documentos digitalizados pode ser gerada com vários defeitos acarretando dificuldades
desde a sua leitura até sua transcrição automática. Além disso, o alto volume de
documentos a serem processados gera a necessidade de automatização do processo de
digitalização e à procura por melhores soluções para esses problemas.
Esta dissertação aborda os seguintes problemas encontrados nos documentos
digitalizados monocromáticos: detecção e remoção de borda preta e; detecção e correção da
orientação e enviesamento. Um novo filtro para remoção de borda preta foi desenvolvido,
testado em 21 mil documentos e comparado com várias ferramentas comerciais. Um novo
algoritmo de detecção de orientação e enviesamento com capacidade de estimar a rotação
em qualquer ângulo com uma precisão de 0,1º foi desenvolvido e comparado com outro
método da literatura. Um segundo algoritmo de detecção de enviesamento foi proposto com
o objetivo de aumentar o desempenho do processamento. Observaram-se três problemas na
correção de rotação do algoritmo clássico: pontos brancos, contorno acidentado e
desconexão de parte dos objetos. Um algoritmo de correção de rotação foi proposto com
capacidade de corrigir os três problemas. Um método quantitativo para medir a degradaçãodos algoritmos de correção de rotação foi introduzido e utilizado para comparar o novo
algoritmo com outros da literatura.
Além dos filtros, duas arquiteturas para processamento de documentos digitalizados
monocromáticos foram estudadas: seqüencial e cluster. Um ambiente visual, intitulado
BigBatch, foi construído com ambas as arquiteturas. A arquitetura em grid foi apenas
especulada
|
Page generated in 0.0814 seconds