Global ETD Search

1	"Projeto multirresolução de operadores morfológicos a partir de exemplos" / "Multiresolution design of morphological operators from examples" Vaquero, Daniel André 19 April 2006 (has links) Resolver um problema de processamento de imagens pode ser uma tarefa bastante complexa. Em geral, isto depende de diversos fatores, como o conhecimento, experiência e intuição de um especialista, e o conhecimento do domínio da aplicação em questão. Motivados por tal complexidade, alguns grupos de pesquisa têm trabalhado na criação de técnicas para projetar operadores de imagens automaticamente, a partir de uma coleção de exemplos de entrada e saída do operador desejado. A abordagem multirresolução tem sido empregada com sucesso no projeto estatístico de W-operadores de janelas grandes. Esta metodologia usa uma estrutura piramidal de janelas para auxiliar na estimação das distribuições de probabilidade condicional para padrões não observados no conjunto de treinamento. No entanto, a qualidade do operador projetado depende diretamente da pirâmide escolhida. Tal escolha é feita pelo projetista a partir de sua intuição e de seu conhecimento prévio sobre o problema. Neste trabalho, investigamos o uso da entropia condicional como um critério para determinar automaticamente uma boa pirâmide a ser usada no projeto do W-operador. Para isto, desenvolvemos uma técnica que utiliza o arcabouço piramidal multirresolução como um modelo na estimação da distribuição conjunta de probabilidades. Experimentos com o problema de reconhecimento de dígitos manuscritos foram realizados para avaliar o desempenho do método. Utilizamos duas bases de dados diferentes, com bons resultados. Além disso, outra contribuição deste trabalho foi a experimentação com mapeamentos de resolução da teoria de pirâmides de imagens no contexto do projeto de W-operadores multirresolução. / The task of finding a good solution for an image processing problem is often very complex. It usually depends on the knowledge, experience and intuition of an image processing specialist. This complexity has served as a motivation for some research groups to create techniques for automatically designing image operators based on a collection of input and output examples of a desired operator. The multiresolution approach has been successfully used to statistically design W-operators for large windows. However, the success of this method directly depends on the adequate choice of a pyramidal window structure, which is used to aid in the estimation of the conditional probability distributions for patterns that do not appear in the training set. The choice is made by the designer, based on his intuition and previous knowledge of the problem domain. In this work, we investigate the use of the conditional entropy criterion for automatically determining a good pyramid. In order to compute the entropy, we have developed a technique that uses the multiresolution pyramidal framework as a model in the estimation of the joint probability distribution. The performance of the method is evaluated on the problem of handwritten digits recognition. Two different databases are used, with good practical results. Another important contribution of this work is the experimentation with resolution mappings from image pyramids theory in the context of multiresolution W-operator design. aprendizado computacional computational learning conditional entropy entropia condicional handwritten digits recognition image processing mathematical morphology morfologia matemática multiresolution multirresolução processamento de imagens reconhecimento de dígitos manuscritos W-operadores W-operators
2	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto Gil, Adriano Mendes 13 May 2014 (has links) Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-07-15T14:33:14Z No. of bitstreams: 1 Dissertação - Adriano Mendes Gil.pdf: 11255112 bytes, checksum: 36763272079e769a8fc63a58ab9d3461 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-07-20T13:59:00Z (GMT) No. of bitstreams: 1 Dissertação - Adriano Mendes Gil.pdf: 11255112 bytes, checksum: 36763272079e769a8fc63a58ab9d3461 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-07-20T14:04:10Z (GMT) No. of bitstreams: 1 Dissertação - Adriano Mendes Gil.pdf: 11255112 bytes, checksum: 36763272079e769a8fc63a58ab9d3461 (MD5) / Made available in DSpace on 2015-07-20T14:04:10Z (GMT). No. of bitstreams: 1 Dissertação - Adriano Mendes Gil.pdf: 11255112 bytes, checksum: 36763272079e769a8fc63a58ab9d3461 (MD5) Previous issue date: 2014-05-13 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Optical character recognition system, aka OCR, allows identifying and recognizing printed characters from pictures. A wide range of devices already has such functionality, e.g, scanners and mobile devices. The current everyday tasks has an increasing demand for handwritten character recognition, for example, recognize specified amount on bank checks, identify postal address to automate some aspects of letter delivery. Handwritten digit recognition faces the difficulty of great intraclass variability, due to different writing stiles and different character slant degrees. This work presents three strategies to address handwritten digit recognition by means of three pattern recognition methods and two feature extraction algorithms. The first strategy makes use of Fourier Descriptor and Boundary Transition Technique to extract representative values from digits contours in order to recognize digits is used a neural network Multilayer Perceptron and a set of Support Vector Machines classifiers to validate neural network output. The second strategy represents this work's baseline using the classic convolutional neural networks algorithm from literature, LeNet5. Such algorithm received as input the raw digit images without preprocessing. The third strategy used a unbalanced decision tree in which support vector machines actuated as decision points and as representative feature received the raw digit images. Late experiments showed that first strategy was not effective enough to recognize digits; only about 80% of characters were successfully recognized. By means of Convolutional Neural Network was possible to achieve 0.9% of error rate, not so impressive if compared to literature best results. The third strategy was capable to recognize 100% of test samples from handwritten digits dataset of MNist. Each support vector machine classifier achieved 0% of error rate, due to an enormous amount of support vectors. / Sistemas de reconhecimento ótico de caracteres, também conhecidos como OCR, permitem identificar e reconhecer caracteres impressos por meio de imagens, uma funcionalidade já bem difundida em scanners, dispositivos móveis, entre outros. Existe uma crescente necessidade de reconhecimento de caracteres manuscritos para uso em várias situações, tais como reconhecimento de valores nominais em cheques de bancos, reconhecimento dos dígitos manuscritos de endereço postal para redirecionamento automatizado de cartas nos correios. Reconhecimento de dígitos manuscritos esbarra na dificuldade de lidar com uma grande variação intraclasse, devido a diferentes estilos de escrita, diferentes graus de inclinação dos caracteres. Este trabalho apresenta três estratégias utilizando três diferentes métodos de reconhecimento de padrões e dois métodos de extração de características. A primeira estratégia utilizou Descritores de Fourier e a técnica de transição de borda para extrair valores representativos do contorno dos caracteres e como camada de classificação utilizou uma rede neural MLP em associação com um conjunto de classificadores SVM para validar e corrigir eventuais erros da rede MLP. A segunda estratégia figurou como base comparativa para as demais estratégias por utilizar um algoritmo clássico de redes neurais convolutivas, LeNet5, e como características utilizou as próprias imagens dos dígitos. A terceira estratégia fez uso de um conjunto de classificadores SVM em uma árvore de decisão desbalanceada para a classificação dos dígitos a partir unicamente de suas imagens. Como resultados dos experimentos, a primeira estratégia provou não ser totalmente efetiva por obter resultados em torno de 80% de taxa de acerto. A segunda estratégia obteve 0,9% de taxa de erro que apesar de ter sido alta, ainda é muito menor se comparada com os melhores resultados obtidos na literatura. A terceira estratégia por sua vez logrou sucesso em reconhecer 100% das amostras de teste da base MNist de dígitos manuscritos, devido ao sucesso do treinamento de cada um dos classificadores SVM, que apesar de utilizarem uma enorme quantidade de vetores de suporte, atingiram individualmente 0% de taxa de erro. Redes neurais Reconhecimento de padrões Dígitos manuscritos Máquina de vetores de suporte Neural network Pattern recognition Handwritten digits Support vector machines ENGENHARIAS: ENGENHARIA ELÉTRICA
3	"Projeto multirresolução de operadores morfológicos a partir de exemplos" / "Multiresolution design of morphological operators from examples" Daniel André Vaquero 19 April 2006 (has links) Resolver um problema de processamento de imagens pode ser uma tarefa bastante complexa. Em geral, isto depende de diversos fatores, como o conhecimento, experiência e intuição de um especialista, e o conhecimento do domínio da aplicação em questão. Motivados por tal complexidade, alguns grupos de pesquisa têm trabalhado na criação de técnicas para projetar operadores de imagens automaticamente, a partir de uma coleção de exemplos de entrada e saída do operador desejado. A abordagem multirresolução tem sido empregada com sucesso no projeto estatístico de W-operadores de janelas grandes. Esta metodologia usa uma estrutura piramidal de janelas para auxiliar na estimação das distribuições de probabilidade condicional para padrões não observados no conjunto de treinamento. No entanto, a qualidade do operador projetado depende diretamente da pirâmide escolhida. Tal escolha é feita pelo projetista a partir de sua intuição e de seu conhecimento prévio sobre o problema. Neste trabalho, investigamos o uso da entropia condicional como um critério para determinar automaticamente uma boa pirâmide a ser usada no projeto do W-operador. Para isto, desenvolvemos uma técnica que utiliza o arcabouço piramidal multirresolução como um modelo na estimação da distribuição conjunta de probabilidades. Experimentos com o problema de reconhecimento de dígitos manuscritos foram realizados para avaliar o desempenho do método. Utilizamos duas bases de dados diferentes, com bons resultados. Além disso, outra contribuição deste trabalho foi a experimentação com mapeamentos de resolução da teoria de pirâmides de imagens no contexto do projeto de W-operadores multirresolução. / The task of finding a good solution for an image processing problem is often very complex. It usually depends on the knowledge, experience and intuition of an image processing specialist. This complexity has served as a motivation for some research groups to create techniques for automatically designing image operators based on a collection of input and output examples of a desired operator. The multiresolution approach has been successfully used to statistically design W-operators for large windows. However, the success of this method directly depends on the adequate choice of a pyramidal window structure, which is used to aid in the estimation of the conditional probability distributions for patterns that do not appear in the training set. The choice is made by the designer, based on his intuition and previous knowledge of the problem domain. In this work, we investigate the use of the conditional entropy criterion for automatically determining a good pyramid. In order to compute the entropy, we have developed a technique that uses the multiresolution pyramidal framework as a model in the estimation of the joint probability distribution. The performance of the method is evaluated on the problem of handwritten digits recognition. Two different databases are used, with good practical results. Another important contribution of this work is the experimentation with resolution mappings from image pyramids theory in the context of multiresolution W-operator design. aprendizado computacional entropia condicional morfologia matemática multirresolução processamento de imagens reconhecimento de dígitos manuscritos W-operadores computational learning conditional entropy handwritten digits recognition image processing mathematical morphology multiresolution W-operators

1

Page generated in 0.073 seconds