Return to search

Dynamic-object-aware simultaneous localization and mapping for augmented reality applications

Submitted by Renata Lopes (renatasil82@gmail.com) on 2018-11-23T09:57:40Z
No. of bitstreams: 1
douglascoelhobragadeoliveira.pdf: 19144398 bytes, checksum: 652398b01779c3899281a6ba454c143a (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-11-23T12:48:28Z (GMT) No. of bitstreams: 1
douglascoelhobragadeoliveira.pdf: 19144398 bytes, checksum: 652398b01779c3899281a6ba454c143a (MD5) / Made available in DSpace on 2018-11-23T12:48:28Z (GMT). No. of bitstreams: 1
douglascoelhobragadeoliveira.pdf: 19144398 bytes, checksum: 652398b01779c3899281a6ba454c143a (MD5)
Previous issue date: 2018-09-19 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Realidade Aumentada (RA) é uma tecnologia que permite combinar objetos virtuais tridimensionais com um ambiente predominantemente real, de forma a construir um novo ambiente onde os objetos reais e virtuais podem interagir uns com os outros em tempo real. Para fazer isso, é necessário encontrar a pose do observador (câmera, HMD, óculos inteligentes, etc.) em relação a um sistema de coordenadas global. Geralmente, algum objeto físico conhecido é usado para marcar o referencial para as projeções e para a posição do observador. O problema de Localização e Mapeamento Simultâneo (SLAM) se origina da comunidade de robótica como uma condição necessária para se construir robôs verdadeiramente autônomos, capazes de se auto localizarem em um ambiente desconhecido ao mesmo tempo que constroem um mapa da cena observada a partir de informações capturadas por um conjunto de sensores. A principal contribuição do SLAM para a RA é permitir aplicações em ambientes despreparados, ou seja, sem marcadores. No entanto, ao eliminar o marcador, perdemos o referencial para a projeção dos objetos virtuais e a principal fonte de interação entre os elementos reais e virtuais. Embora o mapa gerado possa ser processado a fim de encontrar uma estrutura conhecida, como um plano predominante, para usá-la como referencial, isso ainda não resolve a questão das interações. Na literatura recente, encontramos trabalhos que integram um sistema de reconhecimento de objetos ao SLAM e incorporam tais objetos ao mapa. Frequentemente, assume-se um mapa estático, devido às limitações das técnicas envolvidas, de modo que o objeto é usado apenas para fornecer informações semânticas sobre a cena. Neste trabalho, propomos um novo framework que permite estimar simultaneamente a posição da câmera e de objetos para cada quadro de vídeo em tempo real. Dessa forma, cada objeto é independente e pode se mover pelo mapa livremente, assim como nos métodos baseados em marcadores, mas mantendo as vantagens que o SLAM fornece. Implementamos a estrutura proposta sobre um sistema SLAM de última geração a fim de validar nossa proposta e demonstrar a potencial aplicação em Realidade Aumentada. / Augmented Reality (AR) is a technology that allows combining three-dimensional virtual
objects with an environment predominantly real in a way to build a new environment
where both real and virtual objects can interact with each other in real-time. To do this,
it is required to nd the pose of the observer (camera, HMD, smart glasses etc) in relation
to a global coordinate system. Commonly, some well known physical object, called
marker, is used to de ne the referential for both virtual objects and the observer's position.
The Simultaneous Localization and Mapping (SLAM) problem borns from robotics
community as a way to build truly autonomous robots by allowing they to localize themselves
while they build a map of the observed scene from the input data of their coupled
sensors. SLAM-based Augmented Reality is an active and evolving research line. The
main contribution of the SLAM to the AR is to allow applications on unprepared environments,
i.e., without markers. However, by eliminating the marker object, we lose the
referential for virtual object projection and the main source of interaction between real
and virtual elements. Although the generated map can be processed in order to nd a
known structure, e.g. a predominant plane, to use it as the referential system, this still
not solve for interactions. In the recent literature, we can found works that integrate an
object recognition system to the SLAM in a way the objects are incorporated into the
map. The SLAM map is frequently assumed to be static, due to limitations on techniques
involved, so that on these works the object is just used to provide semantic information
about the scene.
In this work, we propose a new framework that allows estimating simultaneously the
camera and object positioning for each camera image in real time. In this way, each object
is independent and can move through the map as well as in the marker-based methods
but with the SLAM advantages kept. We develop our proposed framework over a stateof-
the-art SLAM system in order to evaluate our proposal and demonstrate potentials
application in Augmented Reality.

Identiferoai:union.ndltd.org:IBICT/oai:hermes.cpd.ufjf.br:ufjf/8059
Date19 September 2018
CreatorsOliveira, Douglas Coelho Braga de
ContributorsSilva, Rodrigo Luis de Souza da, Giraldi, Gilson Antonio, Vieira, Marcelo Bernardes
PublisherUniversidade Federal de Juiz de Fora (UFJF), Programa de Pós-graduação em Ciência da Computação, UFJF, Brasil, ICE – Instituto de Ciências Exatas
Source SetsIBICT Brazilian ETDs
LanguageEnglish
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFJF, instname:Universidade Federal de Juiz de Fora, instacron:UFJF
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0014 seconds