Spelling suggestions: "subject:"são computacional"" "subject:"visão computacional""
141 |
Identificação e estimativa da altura de árvores em imagens de satélite e do Google Street View / Tree image identification and estimation in satellite images and Google Street ViewLima, Heuber Gustavo Frazao de 20 December 2016 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2017-01-18T17:05:17Z
No. of bitstreams: 3
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 01.pdf: 19496894 bytes, checksum: 2ff8c665e276bf1cffde555152883c4f (MD5)
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 02.pdf: 12962376 bytes, checksum: 081b03c3a1a66f341203ed645575dc13 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-01-19T10:33:34Z (GMT) No. of bitstreams: 3
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 01.pdf: 19496894 bytes, checksum: 2ff8c665e276bf1cffde555152883c4f (MD5)
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 02.pdf: 12962376 bytes, checksum: 081b03c3a1a66f341203ed645575dc13 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-01-19T10:33:34Z (GMT). No. of bitstreams: 3
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 01.pdf: 19496894 bytes, checksum: 2ff8c665e276bf1cffde555152883c4f (MD5)
Dissertação - Heuber Gustavo Frazao de Lima - 2016 - parte 02.pdf: 12962376 bytes, checksum: 081b03c3a1a66f341203ed645575dc13 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016-12-20 / Fundação de Amparo à Pesquisa do Estado de Goiás - FAPEG / The electrical distribution is a critical activity since many people depend of this service.
Faults in the distribution system occur from several factors that can damage the system and
therefore interrupt the supply of energy. Among the various factors that may cause problems this
work proposes a automatic detection of trees near or even in the distribution network. In order to
avoid that the trees to force or even rupture of the distribution cables, are made the pruning of the
trees that have some kind of risk to the network. However, this activity is usually manual and
teams must sift through all the network for problems. The main objective of this work is to propose
a process, based on computer vision, which allows the automated identification of nearby trees or
under the power distribution network from aerial images provided by Google Earth and even
estimate the height of the same from 2D Google Street View images. / A distribuição de energia elétrica é uma atividade fundamental, já que muitas pessoas dependem
deste serviço. Falhas no sistema de distribuição ocorrem a partir de vários fatores que podem
danificar o sistema e, portanto, interromper o fornecimento de energia elétrica. Dentre os vários
fatores que podem causar problemas este trabalho propõe a detecção automática de árvores perto
ou mesmo sob na rede de distribuição. A fim de evitar que as árvores possam forçar ou mesmo
causar a ruptura dos cabos de distribuição, são feitas as podas das árvores que apresentam algum
tipo de risco para a rede. No entanto, essa atividade é geralmente o manual fazendo com que as
equipes necessitem vasculhar toda a rede para identificar os problemas. O principal objetivo deste
trabalho é propor um processo, baseado em visão computacional, que permite a identificação
automática de árvores próximas ou sob a rede de distribuição de energia a partir de imagens aéreas
fornecidas pelo Google Earth, Google Maps e ainda estimar a altura das mesmas a partir de
imagens 2D do Google Street View.
|
142 |
Classificação de litofácies através da análise automática de perfis elétricos de poços de petróleo da AmazôniaOliveira Júnior, Joacir Marques de 14 February 2014 (has links)
Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-18T15:17:30Z
No. of bitstreams: 1
Dissertação - Joacir Marques de Oliveira Júnior.pdf: 5665291 bytes, checksum: 5db2b29d425ab1c0844713edba8edb09 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-19T20:58:41Z (GMT) No. of bitstreams: 1
Dissertação - Joacir Marques de Oliveira Júnior.pdf: 5665291 bytes, checksum: 5db2b29d425ab1c0844713edba8edb09 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-19T20:59:49Z (GMT) No. of bitstreams: 1
Dissertação - Joacir Marques de Oliveira Júnior.pdf: 5665291 bytes, checksum: 5db2b29d425ab1c0844713edba8edb09 (MD5) / Made available in DSpace on 2015-06-19T20:59:49Z (GMT). No. of bitstreams: 1
Dissertação - Joacir Marques de Oliveira Júnior.pdf: 5665291 bytes, checksum: 5db2b29d425ab1c0844713edba8edb09 (MD5)
Previous issue date: 2014-02-14 / Among several steps which are necessary for the commercialization of oil, the analysis of
well logs plays an important role to estimate the capacity of a well. Traditionally, this analysis is conducted in a semi-automated process which generates graphs of curves used by human experts to analyze and make the reservoir characterization. One goal of this analysis is to classify lithofacies. Lithofacies are lithological units(rocks) that characterize the environment and compositional aspects of the rocks. In order to characterize an oil reservoir, a set of classes of sedimentary rocks occur. This is which is the major reason for the classification of lithofacies. This master thesis investigates the use of automatic classification techniques applied to the problem of classification of lithofacies. The following five classification methods are investigated: Support Vector Machines, k-Nearest Neighbor, Multilayer Perceptron and Logistic Regression. The database investigated consists of samples from three oil wells of the same reservoir in the Amazon State. In addition, the performance of individual classifiers are compared to the combination of the same five classifiers through majority voting. Finally, we will verify whether or not individual classifiers, or ensemble of classifiers, may train using data obtained from one well and accurately classify data from other wells. In order to get these answers, we have run two series of experiments. First, we trained classifiers and test classifiers individually and combined within the same oil well. The obtained results show that Support Vector Machines achieved the best results in two of the three wells, while
Multilayer Perceptron ouperformed the other methods in the third well. In the second series of experiments, we trained classifiers with data from a well and them with data from another
well, simulating a situation closer to a real application, since we may use a manually classified database to train a classifier, or ensemble of classifiers, in orde to learn the pattern of the reservoir. Then, data from other wells of the same reservoir may be automatically classified. In this test, the ensemble of classifiers outperformed individual classifiers in 4 of the 6 possible combinations. In the two other combinations, the combination by majority vote was the second best. It is also worth saying that in average, ensemble of classifiers was the best option to classify lithofacies. Our results indicate that combining classifiers in a system of majority voting, shows a better performance and better stability of the results. / Dentro das várias etapas que são necessárias até o petróleo ser comercializado, a análise de perfis elétricos representa papel de grande importância para se estimar a capacidade produtiva de um poço. A análise hoje é semi-automatizada e ocorre da seguinte forma: geólogos especialistas analisam gráficos de curvas gerados por um sistema, para então, realizar a caracterização do reservatório com base nas análises. Um dos objetivos dessa análise é a classificação de litofácies. Litofácies são unidades litológicas (rochas) que caracterizam o ambiente de formação e aspectos composicionais das rochas. Para que se forme um reservatório de petróleo, um conjunto de tipos de rochas precisa estar presente, sendo este um
dos principais motivos para a classificação de litofácies. Esta dissertação de mestrado investiga o uso de técnicas de classificação automática aplicadas ao problema de classificação de litofácies. Serão investigados os seguintes cinco métodos de classificação: Support Vector Machines, k Vizinhos Mais Próximos, Multilayer Perceptron e Regressão Logistica. A base de dados investigada é composta por amostras de perfis de três poços de uma reserva da Amazônia. Será ainda comparado o desempenho de classificadores individuais frente à combinação do mesmos através do voto majoritário. Por fim, iremos verificar se o treinamento de um poço pode ser aproveitado para outro por meio de classificadores individuais e combinados por voto majoritário. Para obter essas respostas, fizemos dois tipos de testes. No
primeiro, treinamos e testamos os classificadores individualmente e combinados dentro do mesmo poço. Os resultados apresentados mostraram que Support Vector Machines foi superior em dois dos três poços, enquanto Multilayer Perceptron, superou os demais métodos no terceiro poço. No segundo tipo de testes, treinamos com dados de um poço e testamos com dados de outro poço, simulando uma situação mais próxima do problema real que seria de calibrar os classificadores de uma reserva com um poço pioneiro e a partir daí replicar nos poços vizinhos. Nestes testes, a combinação de classificadores se mostrou a melhor solução em 4 das 6 combinações possíveis. Nas duas demais combinações, a combinação por voto
majoritário alcançou o segundo melhor resultado. Vale dizer ainda que na média simples o sistema de votação majoritário, foi a melhor opção para classificar as litofácies. Nossos resultados indicam que combinar classificadores em um sistema de votação majoritário apresenta desempenho superior ao uso de classificadores individuais, além de apresentar maior estabilidade.
|
143 |
Técnicas de seleção de características com aplicações em reconhecimento de faces. / Feature selection techniques with applications to face recognition.Teófilo Emídio de Campos 25 May 2001 (has links)
O reconhecimento de faces é uma área de pesquisa desafiadora que abre portas para a implementação de aplicações muito promissoras. Embora muitos algoritmos eficientes e robustos já tenham sido propostos, ainda restam vários desafios. Dentre os principais obstáculos a serem uperados, está a obtenção de uma representação robusta e compacta de faces que possibilite distinguir os indivíduos rapidamente. Visando abordar esse problema, foi realizado um estudo de técnicas de reconhecimento estatístico de padrões, principalmente na área de redução de dimensionalidade dos dados, além de uma revisão de métodos de reconhecimento de faces. Foi proposto (em colaboração com a pesquisadora Isabelle Bloch) um método de seleção de características que une um algoritmo de busca eficiente (métodos de busca seqüencial flutuante) com uma medida de distância entre conjuntos nebulosos (distância nebulosa baseada em tolerância). Essa medida de distância possui diversas vantagens, sendo possível considerar as diferentes tipicalidades de cada padrão dos conjuntos de modo a permitir a obtenção de bons resultados mesmo com conjuntos com sobreposição. Os resultados preliminares com dados sintéticos mostraram o caráter promissor dessa abordagem. Com o objetivo de verificar a eficiência de tal técnica com dados reais, foram efetuados testes com reconhecimento de pessoas usando imagens da região dos olhos. Nesse caso, em se tratando de um problema com mais de duas classes, nós propusemos uma nova função critério inspirada na distância supracitada. Além disso foi proposto (juntamente com o estudante de mestrado Rogério S. Feris) um esquema de reconhecimento a partir de seqüências de vídeo. Esse esquema inclui a utilização de um método eficiente de rastreamento de características faciais (Gabor Wavelet Networks) e o método proposto anteriormente para seleção de características. Dentro desse contexto, o trabalho desenvolvido nesta dissertação implementa uma parte dos módulos desse esquema. / Face recognition is an instigating research field that may lead to the development of many promising applications. Although many efficient and robust algorithms have been developed in this area, there are still many challenges to be overcome. In particular, a robust and compact face representation is still to be found, which would allow for quick classification of different individuals. In order to address this problem, we first studied pattern recognition techniques, especially regarding dimensionality reduction, followed by the main face recognition methods. We introduced a new feature selection approach in collaboration with the researcher Isabelle Bloch (TSI-ENST-Paris), that associates an efficient searching algorithm (sequential floating search methods), with a tolerance-based fuzzy distance. This distance measure presents some nice features for dealing with the tipicalities of each pattern in the sets, so that good results can be attained even when the sets are overlapping. Preliminary results with synthetic data have demonstrated that this method is quite promising. In order to verify the efficiency of this technique with real data, we applied it for improving the performance of a person recognition system based on eye images. Since this problem involves more than two classes, we also developed a new criterion function based on the above-mentioned distance. Moreover, we proposed (together with Rogério S. Feris) a system for person recognition based on video sequences. This mechanism includes the development of an efficient method for facial features tracking, in addition to our method for feature selection. In this context, the work presented here constitutes part of the proposed system.
|
144 |
Uma abordagem livre de modelo para rastreamento de objetos em seqüências de imagens. / A model-free approach for object tracking in sequences of images.Rodrigo Andrade de Bem 30 March 2007 (has links)
Este trabalho propõe uma abordagem para o rastreamento de objetos observados em seqüências de imagens. O objetivo principal é o desenvolvimento de uma metodologia eficiente, capaz de realizar o rastreamento de um ou mais alvos heterogêneos, usando pouca informação a priori sobre os mesmos. Para alcançar este objetivo é proposta a descrição dos alvos livre de um modelo explícito de forma, através de uma representação baseada em contornos, a qual é interessante pois tem a capacidade de adaptar-se dinamicamente a alvos com formas heterogêneas de modo eficaz. Além disso, é usado um modelo de movimento único e simples, considerando somente translação e mudança de escala quadro a quadro. Este modelo possibilita o tratamento de movimentos suaves e previamente desconhecidos dos alvos. O rastreamento de cada alvo é executado com a combinação de dois Filtros de Kalman: um para estimação do movimento e outro para estimação do contorno. O modelo de observação é baseado em linhas de medida 1D fixadas ao longo do contorno estimado e tem baixo custo computacional. Experimentos foram conduzidos para avaliar a eficácia e eficiência da proposta, utilizando seqüências de imagens controladas e reais. Os resultados mostram que a abordagem proposta é capaz de rastrear alvos distintos (figuras geométricas, pessoas e robôs móveis), executando diferentes movimentos considerando a posição de observação da câmera. Embora haja uma relação crítica entre a variação quadro a quadro do movimento e da forma dos alvos, e o nível de ruído nas imagens, a abordagem é adequada nos casos em que informações detalhadas a respeito do movimento e da forma dos alvos não são disponíveis. / This work proposes an approach to track objects observed in sequences of images. The main objective is the development of an efficient methodology, capable of performing the tracking of one or more heterogeneous targets by using a small amount of a priori information about them. To accomplish this objective we propose a description of the targets free of an explicit shape model. This description is a contour-based representation, which is interesting because it is capable of adapting dynamically to targets that have heterogeneous shapes in an effective way. Besides this, a unique and simple movement model is used, considering only translation and scaling frame by frame. This model allows treating smooth and previously unknown targets movements. The tracking of each target is executed by the combination of two Kalman Filters: one used to estimate movement and another one to estimate contour. The observation model is based on 1D measurement lines fixed along the estimated contour and requires low computational power. Experiments were performed to evaluate the efficacy and the efficiency of the proposal, using controlled and real image sequences. Results show that the proposed approach is capable of tracking distinct targets (geometric figures, human bodies and mobile robots), which execute different movements regarding the observation position of the camera. Despite the critical tradeoff between the frame by frame variation of the targets movements and shapes and the level of noise in the images, the approach showed to be adequate for those cases of application where detailed information about target movement and shape are not available.
|
145 |
Modelo abrangente e reconhecimento de gestos com as mãos livres para ambientes 3D. / Comprehensive model and gesture recognition with free hands for 3d environments.João Luiz Bernardes Júnior 18 November 2010 (has links)
O principal objetivo deste trabalho é possibilitar o reconhecimento de gestos com as mãos livres, para uso em interação em ambientes 3D, permitindo que gestos sejam selecionados, para cada contexto de interação, dentre um grande conjunto de gestos possíveis. Esse grande conjunto deve aumentar a probabilidade de que se possa selecionar gestos já existentes no domínio de cada aplicação ou com associações lógicas claras com as ações que comandam e, assim, facilitar o aprendizado, memorização e uso dos gestos. Estes são requisitos importantes para aplicações em entretenimento e educação, que são os principais alvos deste trabalho. Propõe-se um modelo de gestos que, baseado em uma abordagem linguística, os divide em três componentes: postura e movimento da mão e local onde se inicia. Combinando números pequenos de cada um destes componentes, este modelo permite a definição de dezenas de milhares de gestos, de diferentes tipos. O reconhecimento de gestos assim modelados é implementado por uma máquina de estados finitos com regras explícitas que combina o reconhecimento de cada um de seus componentes. Essa máquina só utiliza a hipótese que os gestos são segmentados no tempo por posturas conhecidas e nenhuma outra relacionada à forma como cada componente é reconhecido, permitindo seu uso com diferentes algoritmos e em diferentes contextos. Enquanto este modelo e esta máquina de estados são as principais contribuições do trabalho, ele inclui também o desenvolvimento de algoritmos simples mas inéditos para reconhecimento de doze movimentos básicos e de uma grande variedade de posturas usando equipamento bastante acessível e pouca preparação. Inclui ainda um framework modular para reconhecimento de gestos manuais em geral, que também pode ser aplicado a outros domínios e com outros algoritmos. Além disso, testes realizados com usuários levantam diversas questões relativas a essa forma de interação. Mostram também que o sistema satisfaz os requisitos estabelecidos. / This work\'s main goal is to make possible the recognition of free hand gestures, for use in interaction in 3D environments, allowing the gestures to be selected, for each interaction context, from a large set of possible gestures. This large set must increase the probability of selecting a gesture which already exists in the application\'s domain or with clear logic association with the actions they command and, thus, to facilitate the learning, memorization and use of these gestures. These requirements are important to entertainment and education applications, this work\'s main targets. A gesture model is proposed that, based on a linguistic approach, divides them in three components: hand posture and movement and the location where it starts. Combining small numbers for each of these components, this model allows the definition of tens of thousands of gestures, of different types. The recognition of gestures so modeled is implemented by a finite state machine with explicit rules which combines the recognition of each of its components. This machine only uses the hypothesis that gestures are segmented in time by known posture, and no other related to the way in which each component is recognized, allowing its use with different algorithms and in different contexts. While this model and this finite state machine are this work\'s main contributions, it also includes the development of simple but novel algorithms for the recognition of twelve basic movements and a large variety of postures requiring highly accessible equipment and little setup. It likewise includes the development of a modular framework for the recognition of hand gestures in general, that may also be applied to other domains and algorithms. Beyond that, tests with users raise several questions about this form of interaction. They also show that the system satisfies the requirements set for it.
|
146 |
Local pose estimation of feature points for object based augmented reality. / Detecção de poses locais de pontos de interesse para realidade aumentada baseadas em objetos.Daniel Makoto Tokunaga 27 June 2016 (has links)
Usage of real objects as links between real and virtual information is one key aspect in augmented reality. A central issue to achieve this link is the estimation of the visuospatial information of the observed object, or in other words, estimating the object pose. Different objects can have different behaviors when used for interaction. This not only encompasses changes in position, but also folding or deformations. Traditional researches in the area solve those pose estimation problems using different approaches, depending on the type of the object. Additionally, some researches are based only on positional information of observed feature points, simplifying the object information. In this work, we explore the pose estimation of different objects by gathering more information from the observed feature points, and obtaining the local poses of such points, which are not explored in other researches. We apply this local pose estimation idea in two different capturing scenarios, reaching two novel approaches of pose estimation: one based on RGB-D cameras, and another based on RGB and machine learning methods. In the RGB-D based approach, we use the feature point orientation and near surface to obtain its normal; then, find the local 6 degrees-of-freedom (DoF) pose. This approach gives us not only the rigid object pose, but also the approximated pose of deformed objects. On the other hand, our RGB based approach explores machine learning with local appearance changes. Unlike other RGB based works, we replace the complex non-linear systems solvers with a fast and robust method, reaching local rotation of the observed feature points, as well as, full 6 DoF rigid object pose with dramatically lower real-time calculation demands. Both approaches show us that gathering local poses can bring information for the pose estimation of different types of objects. / O uso de objetos reais como meio de conexão entre informações reais e virtuais é um aspecto chave dentro da realidade aumentada. Uma questão central para tal conexão é a estimativa de informações visuo-espaciais do objeto, ou em outras palavras, a detecção da pose do objeto. Diferentes objetos podem ter diferentes comportamentos quando utilizados em interações. Não somente incluindo a mudança de posição, mas também sendo dobradas ou deformadas. Pesquisas tradicionais solucionam tais problemas de detecção usando diferentes abordagens, dependendo do tipo de objeto. Adicionalmente, algumas pesquisas se baseiam somente na informação posicional dos pontos de interesse, simplificando a informação do objeto. Neste trabalho, a detecção de pose de diferente objetos é explorada coletando-se mais informações dos pontos de interesse observados e, por sua vez, obtendo as poses locais de tais pontos, poses que não são exploradas em outras pesquisas. Este conceito da detecção de pose locais é aplicada em dois ambientes de capturas, estendendo-se em duas abordagens inovadoras: uma baseada em câmeras RGB-D, e outra baseada em câmeras RGB e métodos de aprendizado de maquinas. Na abordagem baseada em RGB-D, a orientação e superfície ao redor do ponto de interesse são utilizadas para obter a normal do ponto. Através de tais informações a pose local é obtida. Esta abordagem não só permite a obtenção de poses de objetos rígidos, mas também a pose aproximada de objetos deformáveis. Por outro lado, a abordagem baseada em RGB explora o aprendizado de máquina aplicado em alterações das aparências locais. Diferentemente de outros trabalhos baseados em câmeras RGB, esta abordagem substitui solucionadores não lineares complexos com um método rápido e robusto, permitindo a obtenção de rotações locais dos pontos de interesse, assim como, a pose completa (com 6 graus-de-liberdade) de objetos rígidos, com uma demanda computacional muito menor para cálculos em tempo-real. Ambas as abordagens mostram que a coleta de poses locais podem gerar informações para a detecção de poses de diferentes tipos de objetos.
|
147 |
Montagem assistida por realidade aumentada (A3R). / Assembly assisted by augmented reality (A3R).Anderson Nishihara 20 July 2016 (has links)
Processos de montagem em geral necessitam de instruções para serem executados, desde a montagem de simples brinquedos até máquinas complexas. Tradicionalmente, essas instruções vem na forma de manuais em papel ou meio digital. Seja qual for o modo, os manuais de instruções utilizam desenhos, diagramas ou fotos, além de instruções textuais para indicar a sequência de montagem do início até o estado final. Procurando mudar esse paradigma, esse trabalho propõe um sistema para auxílio à montagem que utiliza realidade aumentada para guiar o usuário no processo. Através de processamento de imagens capturadas por uma câmera o sistema reconhece cada peça e por meio de sinais gráficos é indicado ao usuário qual a peça a ser manipulada e onde deve ser posicionada. Em seguida é feito a verificação do posicionamento das peças e o usuário é alertado quando a tarefa de montagem atinge o estado final. Muitos trabalhos na área utilizam algum tipo de dispositivo customizado como \"head mounted display\" (HMD) e marcadores para auxiliar o rastreamento da câmera e identificação das peças, limitando a popularização dessa tecnologia. Tendo esse último ponto em vista, propõe-se um sistema que não utiliza qualquer dispositivo customizado ou marcadores para rastreamento. Além disso, todos os processos do sistema são executados em software embarcado, não necessitando de comunicação com outros computadores para o processamento de imagens. Como o sistema não faz uso de marcadores para a identificação das peças, inicialmente é proposto a implementação do sistema para guiar o usuário na resolução de um quebra-cabeças plano. O sistema proposto é denominado como MARA (Montagem Assistida por Realidade Aumentada). / Assembly processes for simple toys or complex machines usually requires instructions to be executed. Traditionally, these instructions are written in the form of paper or digital manuals. These manuals contains descriptive text, photos or diagrams to guide the assembly sequence from the beginning to the final state. To change this paradigm, it is proposed in this work an augmented reality system to guide assembly tasks. The system recognizes each assembly piece through image processing techniques and guides the piece placement with graphic signals. Later, the system checks if the pieces are properly assembled and warns the user when the assembly have been finished. In the field of assembly assisted by augmented reality systems, many works use some kind of customized device, like head mounted displays (HMD). Furthermore, markers have been used to track camera position and identify assembly parts. These two features restrict the spread of the technology, thus in the proposed work customized devices and markers to track and identify parts shall not be used. Besides, all the processing are executed on embedded software without the need of communication with other computers to help image processing. The first implementation of the proposed system assists the user on the assembly of a planar puzzle, as the proposed system do not use markers to recognize assembly pieces. This system is being called A3R (Assembly Assisted by Augmented Reality).
|
148 |
Casamento de padrões em imagens digitais livre de segmentação e invariante sob transformações de similaridade. / Segmentation-free template matching in digital images invariant to similarity transformations.Sidnei Alves de Araújo 21 October 2009 (has links)
Reconhecimento de padrões em imagens é um problema clássico da área de visão computacional e consiste em detectar um padrão ou objeto de referência (template) em uma imagem digital. A maioria dos métodos para esta finalidade propostos na literatura simplifica as imagens por meio de operações como binarização, segmentação e detecção de bordas ou pontos de contorno, para em seguida extrair um conjunto de atributos descritores. O problema é que esta simplificação pode descartar informações importantes para descrição dos padrões, fazendo diminuir a robustez do processo de detecção. Um método eficiente deve ter a habilidade de identificar um padrão sujeito a algumas transformações geométricas como rotação, escalonamento, translação, cisalhamento e, no caso de métodos para imagens coloridas, deve ainda tratar do problema da constância da cor. Além disso, o conjunto de atributos que descrevem um padrão deve ser pequeno o suficiente para viabilizar o desenvolvimento de aplicações práticas como um sistema de visão robótica ou um sistema de vigilância. Estes são alguns dos motivos que justificam os esforços empreendidos nos inúmeros trabalhos desta natureza encontrados na literatura. Neste trabalho é proposto um método de casamento de padrões em imagens digitais, denominado Ciratefi (Circular, Radial and Template-Matching Filter), livre de segmentação e invariante sob transformações de similaridade, brilho e contraste. O Ciratefi consiste de três etapas de filtragem que sucessivamente descartam pontos na imagem analisada que não correspondem ao padrão procurado. Também foram propostas duas extensões do Ciratefi, uma que utiliza operadores morfológicos na extração dos atributos descritores, denominada Ciratefi Morfológico e outra para imagens coloridas chamada de color Ciratefi. Foram realizados vários experimentos com o intuito de comparar o desempenho do método proposto com dois dos principais métodos encontrados na literatura. Os resultados experimentais mostram que o desempenho do Ciratefi é superior ao desempenho dos métodos empregados na análise comparativa. / Pattern recognition in images is a classical problem in computer vision. It consists in detecting some reference pattern or template in a digital image. Most of the existing pattern recognition techniques usually apply simplifications like binarization, segmentation, interest points or edges detection before extracting features from images. Unfortunately, these simplification operations can discard rich grayscale information used to describe the patterns, decreasing the robustness of the detection process. An efficient method should be able to identify a pattern subject to some geometric transformations such as translation, scale, rotation, shearing and, in the case of color images, should deal with the color constancy problem. In addition, the set of features that describe a pattern should be sufficiently small to make feasible practical applications such as robot vision or surveillance system. These are some of the reasons that justify the effort for development of many works of this nature found in the literature. In this work we propose a segmentation-free template matching method named Ciratefi (Circular, Radial and Template-Matching Filter) that is invariant to rotation, scale, translation, brightness and contrast. Ciratefi consists of three cascaded filters that successively exclude pixels that have no chance of matching the template from further processing. Also we propose two extensions of Ciratefi, one using the mathematical morphology approach to extract the descriptors named Morphological Ciratefi and another to deal with color images named Color Ciratefi. We conducted various experiments aiming to compare the performance of the proposed method with two other methods found in the literature. The experimental results show that Ciratefi outperforms the methods used in the comparison analysis.
|
149 |
Reconhecimento facial em ambientes não controlados por meio do High-boost Weber Descriptor na região periocular / Face recognition under uncontrolled scenarios using the new High-Boost Weber Descriptor in the periocular regionAlex Antonio Affonso 27 April 2018 (has links)
O reconhecimento facial automático é uma tarefa muito importante para a sociedade moderna, pois possibilita o desenvolvimento de diversas aplicações, tais como o controle de imigração em aeroportos, a autenticação de documentos, etc. Muitas destas aplicações ocorrem em ambientes não controlados, onde as fotos são obtidas com grandes variações de poses e expressões faciais, de iluminação, no uso de maquiagem e acessórios, etc. A tarefa de reconhecimento facial automático em ambientes não controlados é ainda muito desafiadora e tem sido alvo de muitas pesquisas no mundo todo nos últimos anos. Dentro deste contexto, esta tese propõe e implementa um conjunto de novos métodos que visam contribuir para o avanço do estado da arte relacionado a este tema de pesquisa. Inicialmente foi proposto o HBWLF, um filtro para enfatizar as componentes de alta frequência da imagem, sem eliminar as de baixa, realçando assim os diversos detalhes das imagens faciais. Em seguida foi proposta uma versão mais geral deste filtro, o MHBWLF, que considera uma vizinhança circular, ao invés de uma grade regular de 3x3 pixels. O MHBWLF foi aplicado em conjunto com um filtro MOSSE no desenvolvimento de um método para a localização precisa dos centros dos olhos. Aproveitando as características do MHBWLF e inspirado em outros descritores foi proposto um novo descritor, o HBWD. Por fim, foi introduzido um novo método de reconhecimento facial, baseado no HBWD. O método proposto emprega o HBWD para descrever densamente a região periocular e, a fim de reduzir a dimensão dos dados, foi proposto um algoritmo de mapeamento baseado no método de agrupamento k-Means++. Os métodos propostos foram todos avaliados utilizando-se imagens das bases LFW, FGLFW e BioID e os resultados experimentais obtidos mostram que os métodos propostos tem desempenho superior a vários outros métodos estado da arte. / The task of automatic face recognition is very important for modern society and very useful for many kind of applications, such as automatic recognition of credit card users, document authentication, security in big events and others. Further, this is a challenging task when performed in uncontrolled scenarios, which involve great variations in imaging conditions such as illumination, poses and facial expressions, partial occlusion due to hair or glasses, makeup, etc. This thesis first introduces the new High-Boost Weber Local Filter (HBWLF) that emphasizes high-frequency components, without eliminating the low-frequency ones, and thus enhances the details of a face. It is also introduced the new MHBWLF (Multiscale High-Boost Weber Local Filter), which is a multiscale version of HBWLF. A new method for precise eye localization is presented, where a MOSSE filter is used for learning the features enhanced by MHBWLF. This thesis also introduces a new local descriptor called HBWD (High-Boost Weber Descriptor) which combines some features of MHBWLF, SIFT and CS-LMP. Finally, a new method of face recognition is presented. The proposed method basically detects the faces, localizes their eyes and performs a face alignment. After that the region of interest (ROI) is more accurately cropped and described using the new HBWD in a dense sampling scheme (sampling each pixel). A new algorithm, based on the known clustering method k-Means++, reduces the dimensionality of the HBWD descriptors densely applied on each ROI, and produces a signature for the image pair being compared. Finally, a SVM is used to classify the images as a matched or mismatched pair. The proposed methods were evaluated using images from the well-known LFW, FGLFW and BioID databases and the experimental results show that the proposed methods outperform other state-of-the-art approaches.
|
150 |
Sistema de identificação de superfícies navegáveis baseado em visão computacional e redes neurais artificiais / Navigable surfaces identification system based on computer vision and artificial neural networksShinzato, Patrick Yuri 22 November 2010 (has links)
A navegação autônoma é um dos problemas fundamentais da robótica móvel. Para um robô executar esta tarefa, é necessário determinar a região segura para a navegação. Este trabalho propõe um sistema de identificação de superfícies navegáveis baseado em visão computacional utilizando redes neurais artificiais. Mais especificamente, é realizado um estudo sobre a utilização de diferentes atributos de imagem, como descritores estatísticos e elementos de espaços de cores, para serem utilizados como entrada das redes neurais artificiais que tem como tarefa a identificação de superfícies navegáveis. O sistema desenvolvido utiliza resultados de classificação de múltiplas configurações de redes neurais artificiais, onde a principal diferença entre elas é o conjunto de atributos de imagem utilizados como entrada. Essa combinação de diversas classificações foi realizada visando maior robustez e melhor desempenho na identificação de vias em diferentes cenários / Autonomous navigation is a fundamental problem in mobile robotics. In order to perform this task, a robot must identify the areas where it can navigate safely. This dissertation proposes a navigable terrain identification system based on computer vision and neural networks. More specifically, it is presented a study of image attributes, such as statistical decriptors and elements of different color spaces, that are used as neural neworks inputs for the navigable surfaces identification. The system developed combines the classification results of multiple neural networks topologies with different image attributes. This combination of classification results allows for improved efficient and robustenes in different scenarios
|
Page generated in 0.0989 seconds