Spelling suggestions: "subject:"documentos manuscrit"" "subject:"documentos manuscript""
1 |
Detecção de inclinação em imagens de documentosMASCARO, Angélica Alcoforado 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:56:01Z (GMT). No. of bitstreams: 2
arquivo2383_1.pdf: 8598930 bytes, checksum: cfcc980fd439436057917fc8beecb3f9 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A digitalizaçao de documentos contribui para a preservação da informação evitando a
sua perda devido à degradação física do papel. Atualmente, Sistemas de Reconhecimento
Automático de Documentos são empregados para converter automaticamente a
informação contida nas imagens em texto editável de forma rápida e sem a necessidade
da presença de um indivíduo, tornando essa informação pesquisável através, por exemplo,
de palavras-chave.
A inclinação em documentos é um problema frequente nesses sistemas e, em geral, é
imposta durante a digitalização, quando o papel é posicionado com um ângulo diferente
de 0 grau sobre o eixo do scanner. No caso de documentos manuscritos, a inclinação
pode surgir durante a escrita do próprio documento, principalmente quando o escritor
não tem uma linha de pauta como guia. A correção da inclinação é essencial para o bom
desempenho desses sistemas de reconhecimento automático.
Este trabalho aborda o problema da detecção de inclinação em documentos impressos
e manuscritos, trazendo uma revisão dos principais métodos para detecção de inclinação.
Dois novos algoritmos para detecção de inclinação que se baseiam na modelagem de um
documento como um conjunto de objetos retangulares são apresentados: um destinado
à detecção do ângulo de um documento com caracteres impressos e outro destinado à
detecção de múltipla inclinação em documentos manuscritos. O algoritmo para documentos
impressos apresentado visa superar problemas comuns nas técnicas já divulgadas
na literatura, como o alto custo computacional e a vulnerabilidade à presença de figuras,
tabelas e ruído no documento.
O desempenho dos algoritmos propostos é avaliado sobre várias bases de imagens
contendo diversos tipos de documentos. Resultados experimentais comparando a técnica
proposta para documentos impressos com outros métodos clássicos mostram o desempenho
superior em termos de taxa de acerto da detecção do ângulo de inclinação e em
termos de tempo computacional da técnica proposta. Experimentos com o algoritmo
destinado à detecção de múltipla inclinação em texto manuscrito mostram que este presentou resultados bastante satisfatórios na detecção do ângulo de documentos reais
escritos por vários indivíduos
|
2 |
Correspondência oficial para o Morgado de Mateus: transcrição semidiplomática do livro n° 170 do AESP (de 1767 a 1775) / Official correspondence to the Morgado de Mateus: semi-diplomatic transcription of the book n° 170 of AESP (from 1767 to 1775)Munhoz, Renata Ferreira 04 September 2009 (has links)
Este trabalho apresenta a edição semidiplomática de 68 documentos manuscritos da segunda metade do século XVIII, entre os anos de 1767 e 1775, referentes ao período de governo de Dom Luís Antonio de Sousa Botelho Mourão como Capitão General da Capitania de São Paulo. O conjunto desses documentos, originalmente avulsos, encontra-se reunido em um livro manuscrito de número 170 no Arquivo do Estado de São Paulo (AESP). A fim de melhor estudar tal livro manuscrito, esse trabalho compõe-se de um capítulo acerca da descrição codicológica e paleográfica, seguido da classificação das espécies documentais existentes no corpus transcrito. Além de um capítulo sobre o momento histórico em que foram executados os documentos. Após os capítulos de análise do corpus, há o núcleo do trabalho: a transcrição semidiplomática e justalinear face a face com a reprodução facsimilar de cada fólio dos documentos. No livro manuscrito há também páginas impressas, que foram anexadas após as transcrições, embora não façam parte do presente estudo. Uma vez que os documentos aqui publicados encontravam-se inéditos, a sua divulgação certamente contribuirá para os estudos filológicos, linguísticos e históricos da época. / This essay presents the facsimilar copies and the semi diplomatic editions of 68 manuscripts from the second half of the eighteenth century, between the years 1767 and 1775, during the government of the General Captain of the São Paulo Captaincy, Dom Luis Antonio de Sousa Botelho Mourão. This corpus was selected in the Arquivo do Estado de São Paulo (AESP) and all of the documents are covered in the manuscript book number 170, where they follow the same order as presented here. In order to study the manuscript book, this work is composed by a chapter about Codicology and Palaeography of the studied documents, followed by the classifications of the documental species of the corpus. Before the transcriptions, there is a chapter about the historical moment in which the documents were executed. The transcription of the handwriting part of the codex is semi diplomatic, line by line and face to face with the respective facsimilar reproduction of each manuscript. There are also printed documents in the manuscript book, which were attached to this work, though they are not the object of study. Since the documents are not yet published, their divulgation can certainly contribute to the philological, linguistic and historical studies.
|
3 |
Correspondência oficial para o Morgado de Mateus: transcrição semidiplomática do livro n° 170 do AESP (de 1767 a 1775) / Official correspondence to the Morgado de Mateus: semi-diplomatic transcription of the book n° 170 of AESP (from 1767 to 1775)Renata Ferreira Munhoz 04 September 2009 (has links)
Este trabalho apresenta a edição semidiplomática de 68 documentos manuscritos da segunda metade do século XVIII, entre os anos de 1767 e 1775, referentes ao período de governo de Dom Luís Antonio de Sousa Botelho Mourão como Capitão General da Capitania de São Paulo. O conjunto desses documentos, originalmente avulsos, encontra-se reunido em um livro manuscrito de número 170 no Arquivo do Estado de São Paulo (AESP). A fim de melhor estudar tal livro manuscrito, esse trabalho compõe-se de um capítulo acerca da descrição codicológica e paleográfica, seguido da classificação das espécies documentais existentes no corpus transcrito. Além de um capítulo sobre o momento histórico em que foram executados os documentos. Após os capítulos de análise do corpus, há o núcleo do trabalho: a transcrição semidiplomática e justalinear face a face com a reprodução facsimilar de cada fólio dos documentos. No livro manuscrito há também páginas impressas, que foram anexadas após as transcrições, embora não façam parte do presente estudo. Uma vez que os documentos aqui publicados encontravam-se inéditos, a sua divulgação certamente contribuirá para os estudos filológicos, linguísticos e históricos da época. / This essay presents the facsimilar copies and the semi diplomatic editions of 68 manuscripts from the second half of the eighteenth century, between the years 1767 and 1775, during the government of the General Captain of the São Paulo Captaincy, Dom Luis Antonio de Sousa Botelho Mourão. This corpus was selected in the Arquivo do Estado de São Paulo (AESP) and all of the documents are covered in the manuscript book number 170, where they follow the same order as presented here. In order to study the manuscript book, this work is composed by a chapter about Codicology and Palaeography of the studied documents, followed by the classifications of the documental species of the corpus. Before the transcriptions, there is a chapter about the historical moment in which the documents were executed. The transcription of the handwriting part of the codex is semi diplomatic, line by line and face to face with the respective facsimilar reproduction of each manuscript. There are also printed documents in the manuscript book, which were attached to this work, though they are not the object of study. Since the documents are not yet published, their divulgation can certainly contribute to the philological, linguistic and historical studies.
|
4 |
Sistema de reconhecimento de palavras manuscritas dependente do usuário. / User-defined handwriting recognition system.VELOSO, Luciana Ribeiro. 14 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-14T17:31:43Z
No. of bitstreams: 1
LUCIANA RIBEIRO VELOSO - TESE PPGEE 2009..pdf: 1635341 bytes, checksum: 2d73699d44711c0cc83e60f235f32c94 (MD5) / Made available in DSpace on 2018-08-14T17:31:43Z (GMT). No. of bitstreams: 1
LUCIANA RIBEIRO VELOSO - TESE PPGEE 2009..pdf: 1635341 bytes, checksum: 2d73699d44711c0cc83e60f235f32c94 (MD5)
Previous issue date: 2009-03 / Este trabalho apresenta um sistema de reconhecimento de palavras manuscritas
isoladas dependente do escritor. Este sistema caracteriza-se por utilizar uma etapa de
pré-processamento, que visa corrigir imperfeições e normalizar variações na imagem da
palavra manuscrita, uma etapa de segmentação explícita, que visa dividir a palavra em
caracteres ou segmentos de caracteres, uma etapa de extração de características, que
tem por finalidade representar a imagem por três vetores de características (perceptivas,
globais e direcionais) e um módulo de quantização vetorial, que tem o objetivo
de realizar o mapeamento de um vetor de características em um vetor de observação
(ou vetor de símbolos). Os símbolos correspondem aos índices (dos vetores-código)
gerados na representação (quantização vetorial) da sequência de características com o
uso dos dicionários. Finalizando, tem-se a etapa de classificação realizada por Modelos
Escondidos de Markov, na qual os caracteres são reconhecidos individualmente e combinados para formar a palavra. Testes experimentais foram realizados com uma base
de dados construída especificamente para este fim, contendo amostras de manuscritos
de4escritoresdistintos. Osistemadereconhecimentodepalavrasmanuscritasisoladas
dependente do escritor obteve taxas de reconhecimento que variaram entre 83,31% a
92,96% dependendo do escritor analisado. Os resultados apresentados mostram que
o sistema apresenta um ótimo desempenho quando utilizado para reconhecer palavras
através dos modelos de caracteres. / This work presents a writer-dependent system for isolated handwritten cursive word
recognition. This system is characterized by the utilization of a pre-processing state,
which corrects imperfections and normalizes variations in the word image, an explicit
segmentation stage, which splits the word into characters or character segments, a feature
extraction stage, which represents the image by three feature vectors (perceptive,
global and directional features), and a vector quantization module, which performs the
mapping of a feature vector into an observation vector (or symbols vector). The symbols
correspond to indices (the code vectors) generated by the representation (vector
quantization) of the feature sequences with the use of dictionaries. Finally, there is the
classification stage, performed by Hidden Markov Models, where characters are individually recognized and combined to form a valid word. Experimental tests were conducted with a database specifically built for this problem, containing samples of manuscripts from 4 different writers. The writer-dependent system for isolated handwritten cursive word recognition was recognition rate between 83.31% and 92.96% depending writer analyzed. The results show that the system offers optimum performance when used
word recognize by the characters models.
|
5 |
Simulação de forças físicas para segmentação e restauração de dígitos e sequências de dígitos em imagens de documentos manuscritosLOPES FILHO, Alberto Nicodemus Gomes 26 February 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-03-15T14:22:48Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Tese - Alberto Lopes_FINAL.pdf: 3638051 bytes, checksum: eaabca9285409b7fd175305c73677557 (MD5) / Made available in DSpace on 2016-03-15T14:22:48Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Tese - Alberto Lopes_FINAL.pdf: 3638051 bytes, checksum: eaabca9285409b7fd175305c73677557 (MD5)
Previous issue date: 2015-02-26 / Dentre os problemas e desafios que permeiam o processo de digitalização de documentos e todos os passos subsequentes até a transposição da informação para o meio digital, dois pontos específicos são focados: o texto partido ou degradado e texto escrito em tamanha proximidade que geram sobreposições dos traços. Assim, métodos para solucionar tais problemas, foram pesquisados e desenvolvidos. Baseamos nossa abordagem na emulação de forças físicas de inércia e centrípeta pois entendemos que estas podem ser bem utilizadas para o processamento de imagens de caracteres manuscritos.
Para o problema de dígitos partidos, foi desenvolvida uma solução para a restauração de dígitos isolados quebrados e de cadeias de dígitos quebrados através da emulação das forças centrípeta e de inércia. Esta solução tem como princípio gerar uma reconstrução da quebra de modo que se assemelhe à escrita do dígito em questão. Também é abordado a sobreposição de pares de dígitos, problema para o qual foi proposta uma solução de segmentação. Esta solução de segmentação se baseia no conceito de uma bola deformável que tem seus movimentos regidos pela emulação da força de inércia e pela deformação que lhe é permitida receber.
Ainda, para desenvolvimento e experimentação dos métodos, foram formadas bases de imagens pertinentes a cada aplicação. Os resultados obtidos mostram desempenhos promissores. Ao aplicar a reconstrução, obtivemos um ganho de aproximadamente seis pontos percentuais em taxa de reconhecimento em relação ao reconhecimento dos dígitos partidos. Já a segmentação provou que supera outros dois métodos de segmentação quando aplicamos o reconhecimento aos dígitos segmentados. Também deve-se ressaltar a questão do custo computacional, especificamente a solução voltada para a segmentação de dígitos sobrepostos, onde seu custo se apresenta mais baixo em relação aos métodos similares pesquisados e testados. Assim, mostramos que os métodos propostos atingem seus objetivos, aliando bons desempenhos com custos computacionais baixos. / Among the problems and challenges that surround the process of document digitization and all subsequent steps until the conversion of the information to a digital medium, two specific steps are focused: broken text and text written in such proximity that cause overlapping of strokes. Methods to solve these problems were researched and developed. We base our approach on the emulation of physical forces of inertia and centripetal force, since it is our understanding that the emulation of such forces can be used for the processing of images of handwritten characters and digits.
For the problem of broken digits, a solution for the restoration of isolated broken digits and chains of broken digits through the emulations of inertia and centripetal force was developed. This solution has as principle to generate a reconstruction of the break in such a way that it resembles closely the writing style of the digit in question. We also tackle overlapping pairs of digits, problem for which we propose a segmentation solution. This segmentation is based on the concept of a deformable ball that has its movements governed by the emulation of inertia and the degree of deformation the ball is allowed to have.
For development and experimentation of the created methods, image databases pertinent to each application were formed. The obtained results show promising performance. When applying the reconstruction, we obtained a gain of approximately six percentage points in recognition rates when compared to rates obtained for broken digits. In regards to segmentation, it proved to outperform two other methods when recognition is applied to the output segmented digits. The computational cost of the methods should also be pointed out, specifically regarding the solution created for the segmentation of overlapped digits, which is lower when compared to other similar methods that were researched and tested. Therefore, we show that the proposed methods reach their goals, coupling performance with low computational costs.
|
Page generated in 0.1393 seconds