Spelling suggestions: "subject:"visão por computador."" "subject:"cisão por computador.""
31 |
Cloud Partitioning Iterative Closest Point (CP-ICP): um estudo comparativo para registro de nuvens de pontos 3DPereira, Nícolas Silva 15 July 2016 (has links)
PEREIRA, Nicolas Silva. Cloud Partitioning Iterative Closest Point (CP-ICP): um estudo comparativo para registro de nuvens de pontos 3D. 2016. 69 f. Dissertação (Mestrado em Engenharia de Teleinformática)–Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2016. / Submitted by Hohana Sanders (hohanasanders@hotmail.com) on 2017-01-06T18:04:28Z
No. of bitstreams: 1
2016_dis_nspereira.pdf: 7889549 bytes, checksum: d5299d9df9b32e2b1189eba97b03f9e1 (MD5) / Approved for entry into archive by Marlene Sousa (mmarlene@ufc.br) on 2017-06-01T18:21:16Z (GMT) No. of bitstreams: 1
2016_dis_nspereira.pdf: 7889549 bytes, checksum: d5299d9df9b32e2b1189eba97b03f9e1 (MD5) / Made available in DSpace on 2017-06-01T18:21:16Z (GMT). No. of bitstreams: 1
2016_dis_nspereira.pdf: 7889549 bytes, checksum: d5299d9df9b32e2b1189eba97b03f9e1 (MD5)
Previous issue date: 2016-07-15 / In relation to the scientific and technologic evolution of equipment such as cameras and image sensors, the computer vision presents itself more and more as a consolidated engineering solution to issues in diverse fields. Together with it, due to the 3D image sensors dissemination, the improvement and optimization of techniques that deals with 3D point clouds registration, such as the classic algorithm Iterative Closest Point (ICP), appear as fundamental on solving problems such as collision avoidance and occlusion treatment. In this context, this work proposes a sampling technique to be used prior to the ICP algorithm. The proposed method is compared to other five variations of sampling techniques based on three criteria: RMSE (root mean squared error), based also on an Euler angles analysis and an autoral criterion based on structural similarity index (SSIM). The experiments were developed on four distincts 3D models from two databases, and shows that the proposed technique achieves a more accurate point cloud registration in a smaller time than the other techniques. / Com a evolução científica e tecnológica de equipamentos como câmeras e sensores de imagens, a visão computacional se mostra cada vez mais consolidada como solução de engenharia para problemas das mais diversas áreas. Associando isto com a disseminação dos sensores de imagens 3D, o aperfeiçoamento e a otimização de técnicas que lidam com o registro de nuvens de pontos 3D, como o algoritmo clássico Iterative Closest Point (ICP), se mostram fundamentais na resolução de problemas como desvio de colisão e tratamento de oclusão. Nesse contexto, este trabalho propõe um técnica de amostragem a ser utilizada previamente ao algoritmo ICP. O método proposto é comparado com outras cinco varições de amostragem a partir de três critérios: RMSE (root mean squared error ), a partir de uma análise de ângulos de Euler e uma métrica autoral baseada no índice de structural similarity (SSIM). Os experimentos foram desenvolvidos em quatro modelos 3D distintos vindos de dois diferentes databases, e revelaram que a abordagem apresentada alcançou um registro de nuvens mais acuraz num tempo menor que as outras técnicas.
|
32 |
Sistema de localização, mapeamento e registro 3D para robótica móvel baseado em técnicas de visão computacionalBarbosa, Flávio Gabriel Oliveira January 2017 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2017. / Made available in DSpace on 2017-06-27T04:19:23Z (GMT). No. of bitstreams: 1
346667.pdf: 9358541 bytes, checksum: 033a82eaa1a2438bea3ff3c054363e4a (MD5)
Previous issue date: 2017 / A introdução de sistemas de visão computacional em robôs móveis se traduz em um significativo aumento de suas habilidades sensoriais, o que implica em uma maior versatilidade e segurança nas operações do robô. Armazenar e manipular todas as imagens percebidas por um robô durante sua tarefa de localização e mapeamento visual é tipicamente intratável para cenários reais. A alternativa adotada por este trabalho é representar o ambiente de forma topológica, onde alguns quadros são selecionados, chamados keyframes, e representam locais visualmente distintos do ambiente. Assim, cada nó do mapa proposto corresponde a um quadro-chave, descrito por um conjuntos de características locais obtidas pelos descritores SIFT, SURF, ORB, BRIEF e BRISK. A seleção destes descritores baseou-se nas avaliações anteriores encontradas na literatura e em uma série de testes que verificaram habilidades importantes no contexto proposto. Ao navegar em determinado ambiente, adquirir modelos 3D, que proporcionam uma compreensão muito mais abrangente do que mapas 2D, são de particular interesse para usuários remotos interessados no interior do ambiente que o robô percorre. O sistema proposto é baseado em registro de nuvens de pontos. Um Kinect acoplado ao robô captura imagens RGB e de profundidade, usadas para gerar nuvens de pontos que posteriormente são alinhadas na forma de registro, utilizando o alinhamento inicial SAC-IA com os descritores PFH e FPFH, e alinhadas através do algoritmo ICP. As métricas de avaliação demonstraram que os sistemas propostos são capazes de localizar o robô com precisão, encontrando a localização global ao longo de toda a trajetória, sendo capaz de resolver os problemas do robô sequestrado e do robô despertado. O algoritmo de alinhamento mostrou bons resultados quanto a capacidade de criar modelos compreensíveis, porém demanda um alto custo computacional. Desta forma, o presente trabalho propõe uma solução para que um robô acoplado com um Kinect percorra sua trajetória de forma autônoma, localizando-se e coletando nuvens de pontos que são usadas para criar um modelo 3D de seu ambiente de trabalho.<br> / Abstract : The introduction of computer vision systems in mobile robots translates into a significant increase in their sensory habilities, which implies greater versatility and security in robot operations. Storing and manipulating all the images perceived by a robot during its visual localization and mapping task is typically intractable for real scenarios. The alternative adopted by this work is to represent the environment in a topological form, where some frames are selected, called keyframes, and represent visually distinct locations from the environment. Thus, each proposed map node corresponds to a keyframe, described by a set of local characteristics obtained by SIFT, SURF, ORB, BRIEF and BRISK descriptors. The selection of these descriptors was based on previous evaluations found in the literature and on a series of tests that verified important skills in the proposed context. When navigating through a particular environment, acquiring 3D models, which provide a much more comprehensive understanding than 2D maps, are of particular interest to remote users interested in the interior of the environment that the robot traverses. The proposed system is based on 3D point cloud registration. A Kinect is coupled to the robot and captures RGB and depth images, which are used to generate point clouds, aligned in the registration form, using the SAC-IA initial alignment with the descriptors PFH and FPFH, and fully aligned through the ICP algorithm. The evaluation metrics demonstrated that the proposed systems are able to locate the robot with precision, being able to cope with the global localization problem throughout the whole trajectory, including the classic kidnapped robot and wake-up problems. The alignment algorithm showed good results in respect of creating comprehensive models, although it demands a high computational cost. Therefore, the present work proposes a solution for a robot coupled with a Kinect to traverse its path autonomously, locating itself and collecting point clouds that are used to create a 3D model of its work environment.
|
33 |
Uma Técnica de Segmentação de Fundo em Vídeo de MonitoramentoSAMATELO, J. L. A. 14 December 2012 (has links)
Made available in DSpace on 2016-08-29T15:32:44Z (GMT). No. of bitstreams: 1
tese_2777_JORGE LEONID ACHING SAMATELO.pdf: 9044673 bytes, checksum: 9ba040e9bd500571854a1c6ede8b0c90 (MD5)
Previous issue date: 2012-12-14 / Aplicações de vigilância baseadas em vídeo, tais como monitoramento de atividades, rastreamento
e identificação de objetos, requerem como etapa inicial a detecção dos objetos em
movimento existentes numa sequência de vídeo. A detecção é um problema complexo, devido
às diferentes variáveis a considerar, tais como a natureza da captura dos vídeos, podendo
ser imagens capturadas ao ar livre ou em interiores, variações na iluminação e ruído, entre
outros. As abordagens que permitem detectar os objetos em movimento a partir de uma
cena estacionária são denominadas técnicas de subtração de fundo, e sua implementação requer
a elaboração de um conjunto de etapas, denominadas pré-processamento, modelamento
do fundo, detecção de variações e pós-processamento. Neste trabalho é implementada uma
técnica de subtração de fundo envolvendo a elaboração de cada uma das etapas indicadas.
Consequentemente: (a) diversas técnicas são realizadas para a etapa de modelamento do
fundo, permitindo explorar as diferentes perspectivas de solução e como elas lidam com os
desafios da área; (b) duas técnicas são propostas para a etapa de detecção de variações,
que operam no nível de cores e estão baseadas na distância Euclidiana calculada entre cada
quadro do vídeo e o modelo do fundo, e numa operação de limiarização, tal que o limiar é
definido em relação a um nível de significância estatístico; (c) um procedimento de avaliação
que permite determinar o desempenho de uma técnica com estas características é proposto,
baseado no cálculo de uma métrica de desempenho, que representa quão exata é uma técnica
de subtração de fundo em encontrar os objetos em movimento ao longo dos quadros
numa sequência de vídeo, podendo ser determinada para cada vídeo ou para todo o banco
de dados. Finalmente, para testes são utilizados dois bancos de dados: o primeiro próprio
para o desenvolvimento e teste de um sistema de vigilância em espaço público, e o segundo
especializado em analisar individualmente alguns dos desafios de que deve tratar uma técnica
de subtração de fundo. Ao final desta tese são apresentados os resultados obtidos e são
feitas as considerações finais.
|
34 |
Identificação de sementes utilizando visão computacionalBordignon, Luiz Alberto January 2015 (has links)
Orientador : Lucas Ferrari de Oliveira / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Engenharia Elétrica. Defesa: Curitiba, 31/08/2015 / Inclui referências : f. 72-75 / Área de concentração: Sistemas eletrônicos / Resumo: Existem muitos sistemas computacionais aplicados a área do agronegócio, que visam melhorar a produtividade, qualidade dos produtos, reduzir desperdícios e auxiliar na tomada de decisões. Da mesma forma medidores de umidade vem se tornando cada vez mais tecnológicos com o passar do tempo e, neste caso, tornar o processo mais automático auxilia na redução de erros e aumenta a produtividade. Em relação aos avanços tecnológicos uma das áreas que vem se destacando no setor é a de visão computacional, que ao longo do tempo tem se tornando mais acessível como tecnologia. Visão computacional é um conjunto de métodos e técnicas utilizadas para interpretar imagens, auxiliando na tomada de decisões, a partir de reconhecimento de padrões. Visando contribuir com esse cenário de desenvolvimento tecnológico no setor do agronegócio, o presente trabalho apresenta um método automático de classificação de sementes utilizando visão computacional. Um conjunto de dados foi criado para o treinamento e testes do método proposto, utilizando 13 diferentes tipos de sementes. A metodologia testada utilizou 6 técnicas de descritores de características (LPQ, LBP, LCP, CLBP, Haralick e Histograma) que foram arranjadas em um vetor de treinamento e de testes do classificador. A avaliação individual e combinações dos descritores também foram alvo de estudo neste trabalho. Também foram testados 2 tipos de classificadores, SVM e RNA. Os resultados obtidos com o método mostraram-se promissores, em 12 dos 13 tipos de sementes testadas a taxa de acerto foi igual ou maior que 85%, ficando abaixo desta marca apenas a classe de Soja. Palavras-chave: Identificação automática, Visão computacional, Identificação de sementes. 11 / Abstract: Many are the computer systems applied to agribusiness area, aimed at improving productivity, products quality, reduce waste and assist in making decisions. Following this trend of technological advances, a prominent area for the sector is the computer vision, which over time has become more accessible as technology. Computer vision is a set of methods and techniques used to interpret images, assisting in decision-making, of pattern recognition. Likewise, moisture measurers have become increasingly technological over time, which make the automatic process reduce errors and increases productivity. An important part of this moisture reading process is to select the type of seed that will be sampled. To contribute to this scenario of technological development, this current work presents an automatic classification method using computer vision. A dataset was created for training and testing of the method proposed here, using 13 different types of seeds. The method used six features descriptors techniques to compose the training and tests vector (LPQ, LBP, LCP, CLBP, Haralick, Histogram and Gabor). Individual assessment and descriptors combinations were also the subject of study in this work. We also tested two types of classifiers, SVM and RNA. The results obtained with the method shown promise in 12 of the 13 kinds of seeds tested, hit rate was equal to or greater than 85%, below this mark of the soy class. Keywords: Automatic classification, Computer vision, Classification of seeds.
|
35 |
Localização de objetos utilizando leitura de intensidade de sinal wireless e enxame de robôsRocha, Elaine Alves da January 2015 (has links)
Orientador : Prof. Dr. Luiz Carlos Pessoa Albini / Coorientador : Prof. Dr. Eduardo Todt / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 14/08/2015 / Inclui referências : f. 66-72 / Resumo: A aplicação do enxame robótico aliada à comunicação de redes sem fio formam uma excelente ferramenta para possíveis soluções de problemas diversos, tal como identificação e busca de pessoas perdidas equipadas com aparelhos que possuam emissores de sinais. Este trabalho propõe a busca e localização de objetos utilizando sensoriamento de intensidade de sinais e um enxame robótico. São utilizados três métodos de busca: por tentativa e erro, busca sem comunicação e com comunicação. No primeiro método os robôs saem em busca do sinal do objeto perdido por meio de tentativas aleatórias; no segundo método é considerado um dispositivo que obtém a posição do objeto quando detectado; e o último método também obtém a posição do objeto quando detectado e utiliza a comunicação entre os robôs do enxame para a cooperação. Além disso, são considerados ambientes com diferentes áreas bem como diferentes números de robôs que compõem o enxame. São apresentados vários testes para os três métodos e várias combinações de tamanho de áreas por quantidade de robôs. Com os resultados pode-se perceber que em ambientes acima de 500 metros quadrados, independente da quantidade de robôs, utilizar a comunicação entre os robôs do enxame robótico é mais eficiente do que os outros métodos de busca, e essa eficiência pode ser vital no cenário de busca e salvamento de pessoas. / Abstract: The application of robotic swarm combined with wireless communication networks form an excellent tool for possible solutions to various problems, such as identification and search for lost people equipped with devices that have signal transmitter. In this way, this paper proposes the search and location of objects using RSSI and a robotic swarm. Three search methods are used: by trial and error, search without communication and with communication. In the first method the robots come out in search of the lost object signal through random tries; the second method uses a device to obtain the position of the object when detected; and the latter method also gets the position of the object when detected and uses the communication between the robots of the swarm, for cooperation. Beyond that, are considered environments with different areas and different numbers of robots that compose the swarm. Several tests were performed for the three methods and combinations of various areas in relation of the number of robots. The results show that in environments with over 500 square meters, regardless of the number of robots, the search with communication between the robots is more efficient than other methods, and this efficiency can be vital in search and rescue scenario.
|
36 |
Geração automática de Trimap para Matting Digital de Imagens e VídeoBlaia Junior, Antonio Carlos Teixeira [UNESP] 04 February 2013 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:01Z (GMT). No. of bitstreams: 0
Previous issue date: 2013-02-04Bitstream added on 2014-06-13T19:51:05Z : No. of bitstreams: 1
blaiajunior_act_me_sjrp.pdf: 2879763 bytes, checksum: eed492b07eec826c96bf8194c8560a7c (MD5) / Técnicas de composição de imagens, com extração de objetos em primeiro plano para serem combinados com um novo plano de fundo, são muito utilizadas em aplicações que vão desde simples montagens em fotos até produções cinematográficas. Estas técnicas são chamadas demattingdigital. Com elas é possível minimizar custos das produções, uma vez que o ator não precisa estar realmente no local onde a cena irá acontecer. Esta característica também viabiliza sua utilização em programas realizados para a televisão digital, que demandam uma alta qualidade da imagem. Diversas abordagens demattingdigital utilizam marcações feitas nas imagens (como informações extras), para determinar o que é o primeiro plano, o plano de fundo e as áreas de incerteza. O conjunto destas informações extras é chamado detrimap, definida por um mapa triplo representando a segmentação da imagem de entrada. Otrimap é feito, geralmente, a partir de marcações manuais realizadas pelo usuário. Levando em consideração este contexto, o presente trabalho objetivou o desenvolvimento de dois métodos para a geração detrimaps de maneira automática (sem interação do usuário), baseando-se, para isto, em informações de profundidade e/ou cores dospixels das imagens de entrada. Os métodos desenvolvidos foram implementados e comparados com suas versões manuais, tendo apresentado resultados quantitativamente semelhantes, para imagens. Os métodos revelaram, também, potencial para serem aplicados em vídeos / Techniques of composing images with extracting objects in the foreground to be combined with a new background, are widely used in applications ranging from simple assemblies on photos to filmmaking. these techniques are called digital matting. With them you can minimize costs of production, since the actor does not need to be really where the scene will happen. this feature also enables its use in programs made for television digital, which demand a high quality image. Several approaches utilize digital matting marks made on images (such as extra informa-tion), to determine what is the foreground, the background and areas of uncertainty. All these extra information is called a trimap, defined for a triple map representing the seg-mentation of the input image. The trimap is made, generally, from markings made by the user manuals. Considering this context, this study aimed to develop Two methods for generating trimaps either automatically (without interaction user), relying, for this, in depth information and / or colors of the pixels the input images. The developed methods were implemented and compared with their manual versions and tested quantitatively similar for images. The methods also revealed the potential to be applied in videos
|
37 |
Segmentaçao de imagens de profundidade utilizando curvaturas de superfícies e um método de estimativa robustoGotardo, Paulo Fabiano Urnau 31 March 2011 (has links)
Neste trabalho são apresentadas contribuições para o aperfeiçoamento da segmentação de imagens de profundidade, um processo de fundamental importância a sistemas de visão computacional e ainda um dos maiores desafios nesta área de pesquisa. O principal objetivo é desenvolver técnicas de segmentação que preservem melhor a topologia dos objetos em cena, de modo a auxiliar processos posteriores de representação, modelagem, reconhecimento e reconstrução de objetos, ajudando a diminuir algumas limitações na utilização de sistemas de visão computacional. O problema da segmentação de imagens de profundidade foi abordado em duas formas diferentes e as principais contribuições apresentadas são: (1) dois métodos de deteção de bordas inéditos baseados em valores das curvaturas de superfície H e K e integrando dados de profundidade e de intensidade luminosa correspondentes à mesma cena: e (2) um novo método de segmentação de imagens de profundidade utilizando um algoritmo genético e um método de estimativa robusto, aperfeiçoados, para a extração de superfícies planas das imagens. Através da utilização de uma mesma base de imagens, os resultados experimentais foram comparados positivamente aos resultados obtidos por outros quatro métodos de segmentação de imagens de profundidade, considerados a principal referência no assunto de acordo com a literatura. Os métodos de deteção de bordas integrando dados de intensidade luminosa preservam melhor as formas e localizações de bordas dos objetos em cena e podem ser utilizados para melhorar os resultados obtidos por outros métodos de segmentação. O método de segmentação por extração de superfícies planas foi avaliado quantitativamente, utilizando um conjunto de métricas relacionadas a segmentações manualmente geradas, e apresentou um melhor desempenho na preservação da topologia dos objetos, principalmente, pelo fato de melhor segmentar regiões pequenas das imagens. As contribuições apresentadas constituem avanços relevantes para o aperfeiçoamento da segmentação de imagens de profundidade e estão sendo utilizadas como suporte a um projeto mais amplo, o SRIC3D, em desenvolvimento pelo grupo de pesquisa IMAGO.
|
38 |
Avaliaçao de critérios para aproximaçao de superfícies em imagens digitais utilizando malhas triangularesSilvestre, Alessandro Rogério Bérgamo 12 March 2012 (has links)
O desenvolvimento de métodos eficientes para manipular grandes volumes de dados é uma atividade fundamental em modelagem de superfícies. Este trabalho tem como objetivo apresentar e avaliar uma metodologia para representação de superfícies em imagens digitais baseada em malhas irregulares triangulares, simplificando as tarefas de armazenamento, processamento e visualização das superfícies dos objetos presentes na imagem. Ao contrário dos modelos tradicionais utilizando malhas regulares, o método proposto constrói um conjunto contínuo de triângulos disjuntos que adaptativamente aproximam a superfície dos objetos, preservando suas características mais representativas. Novos critérios são propostos para a inserção de pontos durante o processo de refinamento das malhas triangulares, os quais levam em consideração a variabilidade da superfície. Esses critérios são capazes de produzir malhas com menor número de pontos com relação às métricas comumente utilizadas na maioria dos métodos de triangulação encontrados na literatura. Um conjunto de medidas para avaliar a qualidade das aproximações resultantes é apresentado, considerando-se os diferentes critérios de construção das malhas. Diversas amostras de dados são utilizadas para demonstrar o desempenho do método proposto.
|
39 |
Geração automática de Trimap para Matting Digital de Imagens e Vídeo /Blaia Junior, Antonio Carlos Teixeira. January 2013 (has links)
Orientador: Antonio Carlos Sementille / Banca: João Fernando Marar / Banca: Ildeberto Aparecido Rodello / Resumo: Técnicas de composição de imagens, com extração de objetos em primeiro plano para serem combinados com um novo plano de fundo, são muito utilizadas em aplicações que vão desde simples montagens em fotos até produções cinematográficas. Estas técnicas são chamadas demattingdigital. Com elas é possível minimizar custos das produções, uma vez que o ator não precisa estar realmente no local onde a cena irá acontecer. Esta característica também viabiliza sua utilização em programas realizados para a televisão digital, que demandam uma alta qualidade da imagem. Diversas abordagens demattingdigital utilizam marcações feitas nas imagens (como informações extras), para determinar o que é o primeiro plano, o plano de fundo e as áreas de incerteza. O conjunto destas informações extras é chamado detrimap, definida por um mapa triplo representando a segmentação da imagem de entrada. Otrimap é feito, geralmente, a partir de marcações manuais realizadas pelo usuário. Levando em consideração este contexto, o presente trabalho objetivou o desenvolvimento de dois métodos para a geração detrimaps de maneira automática (sem interação do usuário), baseando-se, para isto, em informações de profundidade e/ou cores dospixels das imagens de entrada. Os métodos desenvolvidos foram implementados e comparados com suas versões manuais, tendo apresentado resultados quantitativamente semelhantes, para imagens. Os métodos revelaram, também, potencial para serem aplicados em vídeos / Abstract: Techniques of composing images with extracting objects in the foreground to be combined with a new background, are widely used in applications ranging from simple assemblies on photos to filmmaking. these techniques are called digital matting. With them you can minimize costs of production, since the actor does not need to be really where the scene will happen. this feature also enables its use in programs made for television digital, which demand a high quality image. Several approaches utilize digital matting marks made on images (such as extra informa-tion), to determine what is the foreground, the background and areas of uncertainty. All these extra information is called a trimap, defined for a triple map representing the seg-mentation of the input image. The trimap is made, generally, from markings made by the user manuals. Considering this context, this study aimed to develop Two methods for generating trimaps either automatically (without interaction user), relying, for this, in depth information and / or colors of the pixels the input images. The developed methods were implemented and compared with their manual versions and tested quantitatively similar for images. The methods also revealed the potential to be applied in videos / Mestre
|
40 |
Rastreamento visual de objetos utilizando métodos de similaridade de regiões e filtagem estocásticaVidal, Flávio de Barros January 2009 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2009. / Submitted by Allan Wanick Motta (allan_wanick@hotmail.com) on 2010-03-31T13:15:44Z
No. of bitstreams: 1
2009_FlaviodeBarrosVidal.pdf: 11231197 bytes, checksum: e749c7f67f2e024096b2fd0b97917afc (MD5) / Approved for entry into archive by Lucila Saraiva(lucilasaraiva1@gmail.com) on 2010-04-15T00:37:24Z (GMT) No. of bitstreams: 1
2009_FlaviodeBarrosVidal.pdf: 11231197 bytes, checksum: e749c7f67f2e024096b2fd0b97917afc (MD5) / Made available in DSpace on 2010-04-15T00:37:24Z (GMT). No. of bitstreams: 1
2009_FlaviodeBarrosVidal.pdf: 11231197 bytes, checksum: e749c7f67f2e024096b2fd0b97917afc (MD5)
Previous issue date: 2009 / Inicialmente são apresentadas a importância e as aplicações que envolvem o processo de rastreamento visual de objetos. O problema de rastreamento visual pode ser definido como um processo de estimação em conjunto com técnicas de processamento de imagens. Os principais métodos que realizam rastreamento visual encontrados na literatura são discutidos. O problema tratado aqui consiste em rastreamento automático de um dado objeto que aparece em uma sequência de imagens obtida por um sistema de visão computacional. Neste trabalho propõem-se métodos para a realização desta tarefa baseados na similaridade de regiões, o window-matching (WM) method. Este método baseia-se na obtenção de regiões de similaridade em função do padrão da cor cinza de uma janela em torno de um ponto de interesse. Discutem-se também as principais formas de medição da similaridade e a escolha pela função soma do quadrado das diferenças (SSD) é também justificada. Em adição, discutem-se os fatores e parâmetros que afetam o bom desempenho do método tais como: tipo de movimento realizado, oclusões, variação do tamanho da janela, mudanças de iluminação, etc. Desenvolveu-se e implementou-se então um algoritmo de rastreamento (WM) baseado na similaridade de regiões que utiliza a função SSD. O algoritmo foi então aplicado a diversas situações de rastreamento. Observou-se que, para certas aplicações, o algoritmo WM não acompanhava o objeto rastreado. Então, como o rastreamento pode ser tratado como sendo um problema de estimação, introduziu-se um procedimento recursivo para estimação ótima a partir das medidas produzidas pelo algoritmo WM. No processo dinâmico de rastreamento, o vetor de estado a ser estimado consiste dos vetores de posição e velocidade 2D do ponto de interesse, sendo o vetor de medição dado pelos vetores correspondentes fornecidos pelo algoritmoWM. O método leva agora em consideração as características estocásticas do processo de rastreamento (ruídos intrínseco e de medida) e a estimação ótima é realizada pelo filtro de Kalman, que estimará posição e velocidade e as incertezas correspondentes. Um novo algoritmo integrando esta filtragem estocástica (WM+K) foi desenvolvido e implementado. Observou-se que a filtragem estocástica realmente melhora o desempenho do rastreamento. Na procura por aumentar mais ainda a robustez do algoritmo e a sua convergência adicionou-se uma busca heurística nas soluções baseada na otimização seguindo o agrupamento de partículas. Desenvolveu-se assim o algoritmo WM+K+PSO que além de maior robustez produziu trajetórias de rastreamento mais suaves.
__________________________________________________________________________________ ABSTRACT / Initially the importance and applications on which object visual tracking is involved are presented. Visual tracking problem can be stated as an estimation process acting together with digital image processing techniques. The different methods found in the literature for solving this tracking problem are discussed. The problem being dealt here consists of automatic tracking of a given object appearing in a sequence of images captured by a computer vision system. This work proposes methods to perform this task that are based on the windowmatching (WM) techniques. These techniques are based on obtaining similar regions in terms of the gray level pattern of a window around a point of interest. The option for these techniques are justified and the main hypotheses are discussed. The different ways of measuring similarity are also discussed and the choice of the sum of square differences (SSD) as a similarity cost function is also justified. A discussion follows of situations that affect the tracking results, as type of motion, occlusions, window size variations, illumination changes, etc. An object tracking algorithm (WM) based on regions of similarity as measured by the SSD cost function is developed and implemented. The algorithm is then applied for tracking objects in different situations. It was observed, for certain applications, that the WM algorithm failed to track the object. Then, as tracking can be considered an estimation problem, a recursive procedure for optimal estimation from measurements generated by the WM algorithm. In the tracking dynamical process the state vector consist of the 2D position and velocity coordinates of the point of interest, being the measurement vector the corresponding output from the WM algorithm. The new method now takes into account the stochastic properties of the tracking process (intrinsic and measurement noise) and the optimal estimation is performed by the Kalman filter, being the output estimates of the position and velocity and the corresponding uncertainties. A new algorithm integrating this stochastic filtering (WM+K) is developed and implemented. Indeed the stochastic filtering improves the tracking performance and succeeds where the WM fails. Further procedures to increase the robustness and convergence of the tracking algorithm were pursued. Introducing a heuristic search based on Particle Swarm Optimization allowed to obtain smooth tracking trajectories.
|
Page generated in 0.0715 seconds