Return to search

Estratégia de atenção para rastreamento visual de múltiplos alvos por sistema de visão binocular.

Este trabalho apresenta a concepção, desenvolvimento e integração de um sistema de integração binocular para rastreamento binocular auxiliado por uma estratégia de atenção que permite selecionar regiões específicas da imagem para rastreamento. Múltiplas regiões são segmentadas sem o conhecimento do conteúdo da cena mediante detecção monocular de movimento no plano de imagem. Pontos detectados são agrupados em alvos cujo interesse para fins de rastreamento é avaliado por função de atenção. Observou-se que o emprego de imagens foveadas reduz consideravelmente a carga computacional requerida pelo processo de segmentação. Atributos de cada alvo são extraídos para emprego na função de atenção, que determina o valor de interesse dos alvos. A função de atenção proposta é a base da estratégia de atenção e resulta na seleção do alvo com maior valor de interesse. Os atributos empregados são a disparidade binocular, o número de pixels do alvo, sua densidade e velocidade no plano de imagem e a duração de sua ocorrência ao longo das imagens. Incertezas nos atributos são desconsideradas pela função de atenção. Os movimentos da cabeça de visão onde o sistema foi implementado consistem em movimentos balísticos, sacádicos e de perseguição suave nos eixos de elevação, e vergências assimétricas. A ativação destes movimentos é definida levando-se em conta características de desempenho do aparato visual antropomórfico. Avaliou-se o desempenho do sistema tanto no rastreamento de diversos alvos rígidos movendo-se em translação de forma controlada contra um fundo estático de textura não homogênea quanto no de uma pessoa deslocand-se e originando múltiplos alvos não rígidos que violam a restrição de translação pura. Os resultados para o primeiro caso demonstraram a manutenção dos alvos rígidos dentro do campo visual de ambas as câmeras. Já os resultados para o segundo caso demonstraram menor robustez a distorções nos padrões de cinza causadas pelo movimento de rotação e de mudança de escala, o que provoca chaveamento excessivo da atenção do sistema. Isto reflete as limitações do poder computacional empregado, uma vez que há grande dificuldade em limitar o movimento entre quadros da pessoa sendo rastreada.

Identiferoai:union.ndltd.org:IBICT/oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2660
Date00 December 1999
CreatorsFábio de Freitas Caetano
ContributorsJacques Waldmann
PublisherInstituto Tecnológico de Aeronáutica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do ITA, instname:Instituto Tecnológico de Aeronáutica, instacron:ITA
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds