Return to search

[en] HANDWRITTEN DIGITS RECOGNITION BY NEURAL NETWORKS / [pt] RECONHECIMENTO DE DÍGITOS MANUSCRITOS POR REDES NEURAIS

[pt] Esta dissertação investiga a utilização de Redes Neurais
Artificiais (RNAs) na área de reconhecimento de
caracteres, em particular de dígitos manuscritos. Nesta
investigação foram utilizadas amostras reais de dígitos
isolados e de códigos postais brasileiros relativos e
vários escritores. O trabalho consiste de quatro partes
principais: o estudo das metodologias de reconhecimento e
da semântica e estrutura de representação de caracteres; o
desenvolvimento das etapas de pré-processamento dos
dígitos; o desenvolvimento das RNAs para o reconhecimento
de dígitos manuscritos; e o estudo de casos.
No estudo sobre a metodologia de reconhecimento de
caracteres fez-se um levantamento preliminar das diversas
aplicaões de sistemas OCR (Optical Character Recognition).
Enfatizou-se a classificação dos diversos tipos de
semânticas existentes de acordo com a aplicação
específica, bem como a estrutura geral de um sistema OCR.
O estudo também consistiu da análise e apresentação de
modelos convencionais e de sistemas inteligentes na
implementação da etapa de classificação dos sistemas OCR.
O desenvolvimento do pré-processamento dos dígitos
envolveu um extenso estudo bibliográfico de diversas
metodologias para cada uma de suas etapas. Foram estudados
os algoritmos mais empregados nas etapas de pré-
processamento de um sistema. OCR: conversão de níveis de
cinza para representação binária ( thresholding),
filtragem, segmentação e normalização. A partir desse
estudo, foram selecionados e desenvolvidos determinados
tipos de algoritmos para o pré-processamento.
No desenvolvimento de RNAs para o reconhecimento de
dígitos manuscritos fez-se uma investigação de diversas
metodologias, incluindo as arquiteturas e os algoritmos de
aprendizado mais empregados. Neste estudo, constatou-se a
predominância do uso do algoritmo de retropropagação do
erro (BackPropagation) para o treinamento das redes nas
aplicações de reconhecimento de caracteres manuscritos. As
arquiteturas propostas neste trabalho foram escolhidas de
acordo com dois tipos de aplicados de reconhecimento:
reconhecimento de dígitos manuscritos isolados e
reconhecimento automático de código postal.
No estudo de casos, as RNAs foram modeladas para fazer o
reconhecimento automático de código postal. Este estudo
consistiu de um conjunto de implementações com o objetivo
de testar o desempenho de um sistema OCR baseado em redes
neurais. Foram feitos testes com dois tipos de sistemas
de reconhecimento por redes neurais: redes totalmente
conectadas e redes parcialmente. Para os dois casos foram
utilizados amostras reais colhidas de 73 escritores. Os
resultados obtidos com os dois tipos de redes foram
comparados e comprovaram a superioridade das RNAs com
arquitetura parcialmente conectada no reconhecimento de
dígitos altamente ruidosos. Comparações também foram
feitas com outras técnicas convencionais de
reconhecimento, obtendo-se resultados, em muitos casos,
superiores. / [en] This dissertation investigates the use of Artificial
Neural Networks (ANNs) for character recognition,
especially handwritten digits. Real samples of isolated
and postal code digits were used from different writers.
The dissertation covers four main part: the study of
methodologies, semantics and structure on character
recognition and its representation; the development of the
digits preprocessing phases; the design of ANNs to
handwritten digits recognition; and the case studies.
The first part of this dissertation studies methodologies,
semantics and structures used on character recognition.
The result of this study is an overview of the major
aplication in OCR (Optical Character Recognition).
Different kinds of semantics and their structures were
classified according to each specific application. Several
conventional models and intelligent systems, used in the
classification stage of OCR systems, had also been
discussed.
The development of the digits preprocessing involved the
investigation of different methodologies related to each
preprocessing phase. The most used algorithm for each
preprocessing phase were considered: thresholding,
smoothing, segmentation and normalization. According to
this study, specific algorithms were selected and
developed.
In the design of ANNs for handwritten digits recognition,
different methodologies had been investigated, including
the architetures and the learning algorithms most used.
This overview confirmed the predominance of
BackPropagation as the training algorithm for the Neural
Network in this application. The architetures proposed in
this work had been selected according to two types of
applications of character recognition: isolated
handwritten digits recognition and postal address code
recognition.
The case studies consisted of the designing of an ANN to
postal address code recognition. The case studies involved
testing the system performance for two kinds of ANNs:
fully connected networks and partially connected networks.
In both cases, samples of 73 writers were used. The
results were compared to each other, confirming the
superiority of partially connected ANN in handling noisy
digits. The ANN perfomance was also compared with the
perfomance of other conventional techniques, achieving
better results in many cases.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:9017
Date18 September 2006
CreatorsMARIA ANGELICA PEREIRA FREIXINHO
ContributorsMARLEY MARIA BERNARDES REBUZZI VELLASCO, MARCO AURÉLIO CAVALCANTI PACHECO
PublisherMAXWELL
Source SetsPUC Rio
LanguagePortuguese
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.0028 seconds