A área de reconhecimento de objetos tem assistido a um impressionante progresso na última década. O estudo de descritores, aliado à estratégias de amostragem usando quantizações espaciais e a combinação de classificadores têm permeado o estado da arte nos últimos anos. Neste trabalho é proposta uma nova quantização espacial com número arbitrário de níveis e subdivisões arbitrárias de regiões. Regiões adjacentes possuem sobreposição gerando redundância na representação destas regiões de fronteiras e, assim, evitando as quebras que acontecem nas pirâmides espaciais tradicionais que prejudicam a interpretação das formas. Apesar de melhorar o desempenho da abordagem do saco de palavras, as pirâmides espaciais não são robustas a variações na orientação dos objetos na imagem. Foi também proposto neste trabalho, uma divisão espacial utilizando regiões circulares concêntricas que aumentam a robustez a rotação dos objetos na imagem em aproximadamente 80% quando comparada às pirâmides espaciais. Além das novas divisões espaciais, é proposto neste trabalho um novo descritor baseado na aplicação de granulometria morfológica no mapa de bordas da imagem original. Este descritor foi utilizado na criação de modelos de classes em aplicações de categorização de objetos utilizando uma base de dados pública com resultados superiores aos do melhor descritor baseado em bordas reportado pela literatura. Todas estas novas técnicas propostas foram utilizadas em um problema desafiador de categorização de objetos de classes muito parecidas. Foi utilizado um subconjunto da base de pássaros Caltech-UCSD Birds-200 2011 com resultados comparáveis aos melhores resultados reportados pela literatura. A abordagem proposta cria uma classificação de dois níveis e utiliza modelos específicos por classe o que é intuitivo, pois cada espécie de pássaro possui características muito sutis que as diferenciam das demais espécies testadas. Vários descritores são utilizados na criação dos modelos de classes e uma combinação de classificadores gera a rotulação final para a amostra. O descritor proposto neste trabalho esteve presente no melhor modelo de 11 das 13 classes testadas e o resultado final obtido pela técnica de categorização proposta é o melhor resultado utilizando a abordagem do saco de palavras. / The object recognition area has experienced an impressive progress in the last decade. The study of descriptors, together with a sampling strategy using spatial quantization and the combination of classifiers have been presented in the state of art in recent years. This work proposes a new spatial quantizations with an arbitrary number of levels and divisions in each level. Adjacent regions have overlapping areas that generate redundant representation and avoid breakages in the structures that are in their border regions as it happens in the traditional spatial pyramids and impairs the correct interpretation of these structures. Despite spatial pyramids to improve the performance of the bag-of-words approach in object recognition, they are not robust to changes in object orientation in the image. It was also proposed, in this work, a spatial division using concentric circular regions that is almost 80% more robust to rotation of objects when compared to the spatial pyramids using rectangular divisions. In addition to the new spatial division of the image, it is proposed a new granulometric-based descriptor that it is applied to the map of edges of the original image. This descriptor was used in the building of categorys models for object categorization in a public database and showed a better performance than the most used edge-based descriptor reported in literature. All these new proposed techniques were used in a challenge problem of object categorization of very similar classes. It was used a subset of the public database Caltech-UCSD Birds-200 2011 and the method obtained results compared to the best results reported in the literature. The proposed approach uses a 2-level classification and builds class-specific models that are an intuitive way to model the species of birds as very subtle characteristics differ in each tested class of birds. Many descriptors are used in the building of models of species and a combination of classifiers generates the final label for a tested sample. The descriptor proposed here were presented in 11 of 13 best models of birds classes. The final result obtained by the proposed object categorization method is the best one using the bag-of-words approach.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-29042013-111855 |
Date | 01 March 2013 |
Creators | Arnaldo Câmara Lara |
Contributors | Roberto Hirata Junior, Ronaldo Fumio Hashimoto, Hae Yong Kim, Carlos Hitoshi Morimoto, Eduardo Alves do Valle Junior |
Publisher | Universidade de São Paulo, Ciência da Computação, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds