Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2015-10-21T17:41:28Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
ROBSON_MONTENEGRO.pdf: 58981994 bytes, checksum: e45d214c496ec66b4a7f5a16803daf59 (MD5) / Made available in DSpace on 2015-10-21T17:41:28Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
ROBSON_MONTENEGRO.pdf: 58981994 bytes, checksum: e45d214c496ec66b4a7f5a16803daf59 (MD5)
Previous issue date: 2015-06-12 / Diversas maneiras de armazenamento e transmissão de informação em meio digital estão
disponíveis devido ao contínuo crescimento tecnológico. Porém, grande parte das informações
relevantes permanece armazenada em meio físico, como: livros, certidões, contratos e documentos
pessoais. Existe um grande esforço para realizar a transposição dessas informações
para meios digitais de forma a facilitar o acesso e utilização de meios de comunicação mais
modernos. Os scanners fornecem a maneira mais popular de se obter esta transposição, porém,
estes dispositivos muitas vezes não oferecem portabilidade e custo adequados. A utilização de
dispositivos móveis, tais como celulares, para captura de imagens de documento tem se mostrado
uma alternativa viável aos tradicionais scanners de mesa. Isto se deve a sua facilidade de uso,
portabilidade e barateamento de seu hardware que facilitou sua popularização. Porém, por se
tratar de captura em um ambiente menos controlado, documentos digitalizados desta forma
apresentam distorções que comprometem a sua legibilidade tais como: perspectiva, embassamento,
baixa resolução, interação do conteúdo com o background e curvatura das linhas de
texto. Trabalhos recentes tratam este problema utilizando diferentes abordagens, muitos destes,
de maneira eficaz. Entretanto, estas técnicas são fortemente dependentes do conteúdo textual
presente nos documentos. Esta dissertação apresenta uma nova abordagem para realizar correção
de imagens capturadas por dispositivos móveis baseado-se apenas em características morfológicas
do documento. O método é dividido em três etapas. A primeira é o pré-processamento
responsável por ajustar o contraste da imagem. Depois, as bordas do documento são definidas
utilizando uma abordagem híbrida do descritor de Gradiente de Histogramas Orientados com
a Transformada de Hough. Por último, a superfície deformada do documento é mapeada para
uma superfície retangular corrigida. O algoritmo foi experimentado em diversas configurações
de seus parâmetros livres em uma base de documentos pessoais coletada para este trabalho. O
menor erro obtido foi de 4,08% e, além disto, as imagens corrigidas foram processadas por
sistemas de OCRs e os resultados quantitativos mostram que o algoritmo proposto melhorou
substancialmente a legibilidade das imagens. / Several ways of information storage and transmission in digital media emerged due to technological progress. However, much of the relevant information remains stored on physical media, such as books, certificates, contracts and personal documents. Much effort has been made to carry out the transposition of this information to digital media in order to facilitate access and use modern communication channels. The scanners provide the most popular way to obtain this transposition, however, these devices often do not offer adequate portability and are usually expensive. The use of mobile devices such as cell phones, for document imaging has proven to be a suitable alternative to traditional table scanners. This is due to its ease of use, portability and cheapness of their hardware which facilitated its popularization. However, documents acquired in a less controlled environment, have distortions that muddle its readability such as perspective, blur, low resolution, interaction of the content and the background and curled text lines. Recent works address this problems using different approaches, many of these, efficiently. However, these techniques are strongly dependent on the textual content in the document images. This dissertation presents a new algorithm to rectify images acquired by mobile devices based only on morphological features of the document image. The method is divided into three steps. First is the preprocessing when the image contrast is adjusted. Then, the document edges are determined using a hybrid approach of Hough Transform and Histogram of Oriented Gradients descriptor. Finally, the warped surface of the document is mapped to a rectangular surface. The algorithm has been tested in several configurations in a personal document image base collected for this work. The best error rate was 4.08 % and, moreover, the corrected images were processed by OCR systems and quantitative results shows that the proposed algorithm has significantly improved readability of the images.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/14230 |
Date | 12 June 2015 |
Creators | MONTENEGRO, Robson David |
Contributors | http://lattes.cnpq.br/2248591013863307, MELLO, Carlos Alexandre Barros de |
Publisher | Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds