Return to search

Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste

Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-04T18:27:08Z
No. of bitstreams: 2
DISSERTAÇÃO Alisson Werner Arruda.pdf: 4901864 bytes, checksum: ca497864a9da3134128e43273e9f28f3 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-04T18:27:08Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Alisson Werner Arruda.pdf: 4901864 bytes, checksum: ca497864a9da3134128e43273e9f28f3 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-02-27 / CAPES / Binarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/10481
Date27 February 2014
CreatorsARRUDA, Alisson Werner Arruda de
ContributorsMELLO, Carlos Alexandre Barros de
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguageBreton
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds