Global ETD Search

Return to search

Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos

Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:50:01Z
No. of bitstreams: 2
Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-11T17:34:31Z (GMT). No. of bitstreams: 2
Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013 / A presença de textos manuscritos e impressos em um mesmo documento representa
um grande desafio para os atuais mecanismos de Reconhecimento Óptico de
Caracteres. Uma vez que essas classes de texto possuem suas próprias rotinas de
reconhecimento, o uso de técnicas que permitam diferenciação entre elas tornou-se
indispensável e o bom funcionamento dessas técnicas depende da escolha de características
que melhor representem os elementos de texto sobre os quais os classificadores
devem atuar. Considerando que na literatura existe uma grande variedade
de características utilizadas para este fim, este trabalho objetiva o desenvolvimento
de um método que permita, através de um processo de otimização com Algoritmos
Genéticos e a partir de um conjunto inicial de 52 características, a seleção de
subconjuntos de melhores características que, além de menores que o conjunto original,
possibilitem melhoria dos resultados de classificação. Os experimentos foram
realizados com classificadores kNN e Redes Neurais MLP a partir de imagens de
palavras segmentadas. O método proposto foi avaliado fazendo uso de uma base
de dados pública para textos manuscritos e outra criada especificamente para este
trabalho para textos impressos. Os resultados dos experimentos mostram que os
objetivos propostos foram alcançados. Os Erros Médios de Classificação foram estatisticamente
equivalentes para os dois classificadores e uma melhor performance
foi obtida com o kNN. A influência dos diferentes tipos de fontes e estilos utilizados
nos textos impressos também foi analisada e mostrou que as fontes que imitam
textos manuscritos como a "Lucida Handwriting" e "Comic Sans MS" apresentam
maiores ocorrências de erros de classificação. Da mesma forma, a maioria dos erros
foi percebida nos textos impressos com estilo itálico.

Otimização

Redução de dimensionalidade

Seleção de características

Algoritmos genéticos

kNN

Redes Neurais MLP

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/11965
Date	31 January 2013
Creators	Coelho, Gleydson Vilanova Viana
Contributors	Cavalcanti, George Darmiton da Cunha
Publisher	Universidade Federal de Pernambuco
Source Sets	IBICT Brazilian ETDs
Language	Breton
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds

Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos

Description

Links & Downloads

Tags

Additional Fields