Resolver um problema de processamento de imagens pode ser uma tarefa bastante complexa. Em geral, isto depende de diversos fatores, como o conhecimento, experiência e intuição de um especialista, e o conhecimento do domínio da aplicação em questão. Motivados por tal complexidade, alguns grupos de pesquisa têm trabalhado na criação de técnicas para projetar operadores de imagens automaticamente, a partir de uma coleção de exemplos de entrada e saída do operador desejado. A abordagem multirresolução tem sido empregada com sucesso no projeto estatístico de W-operadores de janelas grandes. Esta metodologia usa uma estrutura piramidal de janelas para auxiliar na estimação das distribuições de probabilidade condicional para padrões não observados no conjunto de treinamento. No entanto, a qualidade do operador projetado depende diretamente da pirâmide escolhida. Tal escolha é feita pelo projetista a partir de sua intuição e de seu conhecimento prévio sobre o problema. Neste trabalho, investigamos o uso da entropia condicional como um critério para determinar automaticamente uma boa pirâmide a ser usada no projeto do W-operador. Para isto, desenvolvemos uma técnica que utiliza o arcabouço piramidal multirresolução como um modelo na estimação da distribuição conjunta de probabilidades. Experimentos com o problema de reconhecimento de dígitos manuscritos foram realizados para avaliar o desempenho do método. Utilizamos duas bases de dados diferentes, com bons resultados. Além disso, outra contribuição deste trabalho foi a experimentação com mapeamentos de resolução da teoria de pirâmides de imagens no contexto do projeto de W-operadores multirresolução. / The task of finding a good solution for an image processing problem is often very complex. It usually depends on the knowledge, experience and intuition of an image processing specialist. This complexity has served as a motivation for some research groups to create techniques for automatically designing image operators based on a collection of input and output examples of a desired operator. The multiresolution approach has been successfully used to statistically design W-operators for large windows. However, the success of this method directly depends on the adequate choice of a pyramidal window structure, which is used to aid in the estimation of the conditional probability distributions for patterns that do not appear in the training set. The choice is made by the designer, based on his intuition and previous knowledge of the problem domain. In this work, we investigate the use of the conditional entropy criterion for automatically determining a good pyramid. In order to compute the entropy, we have developed a technique that uses the multiresolution pyramidal framework as a model in the estimation of the joint probability distribution. The performance of the method is evaluated on the problem of handwritten digits recognition. Two different databases are used, with good practical results. Another important contribution of this work is the experimentation with resolution mappings from image pyramids theory in the context of multiresolution W-operator design.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-06072006-220651 |
Date | 19 April 2006 |
Creators | Vaquero, Daniel André |
Contributors | Barrera, Junior |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0025 seconds