1 |
[pt] SLAM VISUAL EM AMBIENTES DINÂMICOS UTILIZANDO SEGMENTAÇÃO PANÓPTICA / [en] VISUAL SLAM IN DYNAMIC ENVIRONMENTS USING PANOPTIC SEGMENTATIONGABRIEL FISCHER ABATI 10 August 2023 (has links)
[pt] Robôs moveis se tornaram populares nos últimos anos devido a sua
capacidade de operar de forma autônoma e performar tarefas que são perigosas,
repetitivas ou tediosas para seres humanos. O robô necessita ter um mapa
de seus arredores e uma estimativa de sua localização dentro desse mapa
para alcançar navegação autônoma. O problema de Localização e Mapeamento
Simultâneos (SLAM) está relacionado com a determinação simultânea do mapa
e da localização usando medidas de sensores. SLAM visual diz respeito a
estimar a localização e o mapa de um robô móvel usando apenas informações
visuais capturadas por câmeras. O uso de câmeras para o sensoriamento
proporciona uma vantagem significativa, pois permite resolver tarefas de
visão computacional que fornecem informações de alto nível sobre a cena,
incluindo detecção, segmentação e reconhecimento de objetos. A maioria dos
sistemas de SLAM visuais não são robustos a ambientes dinâmicos. Os sistemas
que lidam com conteúdo dinâmico normalmente contem com métodos de
aprendizado profundo para detectar e filtrar objetos dinâmicos. Existem vários
sistemas de SLAM visual na literatura com alta acurácia e desempenho,
porem a maioria desses métodos não englobam objetos desconhecidos. Este
trabalho apresenta um novo sistema de SLAM visual robusto a ambientes
dinâmicos, mesmo na presença de objetos desconhecidos. Este método utiliza
segmentação panóptica para filtrar objetos dinâmicos de uma cena durante
o processo de estimação de estado. A metodologia proposta é baseada em
ORB-SLAM3, um sistema de SLAM estado-da-arte em ambientes estáticos.
A implementação foi testada usando dados reais e comparado com diversos
sistemas da literatura, incluindo DynaSLAM, DS-SLAM e SaD-SLAM. Além
disso, o sistema proposto supera os resultados do ORB-SLAM3 em um
conjunto de dados personalizado composto por ambientes dinâmicos e objetos
desconhecidos em movimento. / [en] Mobile robots have become popular in recent years due to their ability
to operate autonomously and accomplish tasks that would otherwise be too
dangerous, repetitive, or tedious for humans. The robot must have a map of
its surroundings and an estimate of its location within this map to achieve
full autonomy in navigation. The Simultaneous Localization and Mapping
(SLAM) problem is concerned with determining both the map and localization
concurrently using sensor measurements. Visual SLAM involves estimating the
location and map of a mobile robot using only visual information captured by
cameras. Utilizing cameras for sensing provides a significant advantage, as they
enable solving computer vision tasks that offer high-level information about
the scene, including object detection, segmentation, and recognition. There
are several visual SLAM systems in the literature with high accuracy and
performance, but the majority of them are not robust in dynamic scenarios.
The ones that deal with dynamic content in the scenes usually rely on
deep learning-based methods to detect and filter dynamic objects. However,
these methods cannot deal with unknown objects. This work presents a new
visual SLAM system robust to dynamic environments, even in the presence
of unknown moving objects. It uses Panoptic Segmentation to filter dynamic
objects from the scene during the state estimation process. The proposed
methodology is based on ORB-SLAM3, a state-of-the-art SLAM system for
static environments. The implementation was tested using real-world datasets
and compared with several systems from the literature, including DynaSLAM,
DS-SLAM and SaD-SLAM. Also, the proposed system surpasses ORB-SLAM3
results in a custom dataset composed of dynamic environments with unknown
moving objects.
|
2 |
[en] REAL-TIME METRIC-SEMANTIC VISUAL SLAM FOR DYNAMIC AND CHANGING ENVIRONMENTS / [pt] SLAM VISUAL MÉTRICO-SEMÂNTICO EM TEMPO REAL PARA AMBIENTES EM MUDANÇA E DINÂMICOSJOAO CARLOS VIRGOLINO SOARES 05 July 2022 (has links)
[pt] Robôs móveis são cada dia mais importantes na sociedade moderna,
realizando tarefas consideradas tediosas ou muito repetitivas para humanos,
como limpeza ou patrulhamento. A maioria dessas tarefas requer um certo
nível de autonomia do robô. Para que o robô seja considerado autônomo,
ele precisa de um mapa do ambiente, e de sua posição e orientação nesse
mapa. O problema de localização e mapeamento simultâneos (SLAM) é a
tarefa de estimar tanto o mapa quanto a posição e orientação simultaneamente,
usando somente informações dos sensores, sem ajuda externa. O problema de
SLAM visual consiste na tarefa de realizar SLAM usando somente câmeras
para o sensoriamento. A maior vantagem de usar câmeras é a possibilidade
de resolver problemas de visão computacional que provêm informações de
alto nível sobre a cena, como detecção de objetos. Porém a maioria dos
sistemas de SLAM visual assume um ambiente estático, o que impõe limitações
para a sua aplicabilidade em cenários reais. Esta tese apresenta soluções
para o problema de SLAM visual em ambientes dinâmicos e em mudança.
Especificamente, a tese propõe um método para ambientes com multidões,
junto com um detector de pessoas customizado baseado em aprendizado
profundo. Além disso, também é proposto um método de SLAM visual para
ambientes altamente dinâmicos contendo objetos em movimento, combinando
um rastreador de objetos robusto com um algoritmo de filtragem de pontos.
Além disso, esta tese propõe um método de SLAM visual para ambientes em
mudança, isto é, em cenas onde os objetos podem mudar de lugar após o robô já
os ter mapeado. Todos os métodos propostos são testados com dados públicos
e experimentos, e comparados com diversos métodos da literatura, alcançando
um bom desempenho em tempo real. / [en] Mobile robots have become increasingly important in modern society,
as they can perform tasks that are tedious or too repetitive for humans,
such as cleaning and patrolling. Most of these tasks require a certain level
of autonomy of the robot. To be fully autonomous and perform navigation,
the robot needs a map of the environment and its pose within this map.
The Simultaneous Localization and Mapping (SLAM) problem is the task
of estimating both map and localization, simultaneously, only using sensor
measurements. The visual SLAM problem is the task of performing SLAM
only using cameras for sensing. The main advantage of using cameras is
the possibility of solving computer vision problems that provide high-level
information about the scene, such as object detection. However, most visual
SLAM systems assume a static environment, which imposes a limitation on
their applicability in real-world scenarios. This thesis presents solutions to
the visual SLAM problem in dynamic and changing environments. A custom
deep learning-based people detector allows our solution to deal with crowded
environments. Also, a combination of a robust object tracker and a filtering
algorithm enables our visual SLAM system to perform well in highly dynamic
environments containing moving objects. Furthermore, this thesis proposes
a visual SLAM method for changing environments, i.e., in scenes where the
objects are moved after the robot has already mapped them. All proposed
methods are tested in datasets and experiments and compared with several
state-of-the-art methods, achieving high accuracy in real time.
|
Page generated in 0.037 seconds