Return to search

Inferencia de intención de cruce de peatones utilizando la dinámica del cuerpo

Se define la intención como la voluntad de una persona a realizar una acción,
previo a desarrollarla, y denotada por su movimiento y actitud. En un escenario
realista, el peatón podría tomar decisiones de riesgo para cruzar o no frente a
un vehículo. La detección de caminar en la vereda y detenerse o caminar cerca
de la calle no es suficiente para reconocer que el peatón pasará por delante del
vehículo. La presente tesis aborda esta problemática para poder brindar a los
vehículos que interactúan con peatones, información fundamental para mejorar
los sistemas de seguridad en la búsqueda de la prevención de accidentes.
El principal desafío es determinar el tipo de información obtenida de los peatones,
que debe ser medida y comunicada para que, a partir de la implementación
de estrategias de aprendizaje automático, esta intención pueda ser determinada.
En esta tesis se evalúa en primer lugar el desempeño del uso de información
egocéntrica, con datos provistos y generados por el propio peatón. Las aceleraciones
y velocidades de las extremidades del cuerpo se obtienen con sensores
montados en diferentes partes del cuerpo. Estos datos dan indicios del tipo de
actividad que realizará un peatón al cruzar o no frente a un vehículo. Sin embargo,
esta aproximación tiene algunas desventajas, especialmente porque todos los
peatones que se acercan al vehículo deben estar instrumentados. Aunque hoy es
posible depender de teléfonos o pulseras inteligentes, estos dispositivos no siempre
tienen la capacidad de comunicarse efectivamente con un vehículo.
Las cámaras, sensores que todos los vehículos inteligentes ya poseen, permiten
reemplazar la información provista por los sensores montados en los peatones,
extrayendo información dinámica por medio del procesamiento de imágenes. Para
esto se extrae un esqueleto virtual del cuerpo de la persona en línea de vista del
vehículo y se procesan varios cuadros consecutivos del video. De este modo se
demuestra que la calidad de la información dinámica extraída por este medio es
comparable con la provista por los sensores montados en las personas.
Con esta información se presenta un análisis del desempeño de algoritmos de
estimación de la intención basados en redes neuronales. Los resultados demuestran
que el objetivo de determinar la intención de que una persona cruce frente a
un vehículo es posible de lograr y de hacerlo en forma confiable ante situaciones
de tránsito diversas y reales. / The intention is defined as the will of a person to perform an action, prior
to developing it, and denoted by its movement and attitude. In a realistic scenario,
the pedestrian can take risky decisions to cross or not in front of a vehicle.
The detection of walking in the sidewalk and stopping or walking near the street
is not enough to recognize that the pedestrian will cross in front of the vehicle.
This thesis addresses this problem in order to provide vehicles that interact
with pedestrians fundamental information to improve safety systems in search of
accident prevention.
The main challenge is to determine the kind of information obtained from
pedestrians, which must be measured and communicated so that, based on the
implementation of automatic learning strategies, the intention can be determined.
In this thesis, the performance of the use of egocentric information is evaluated
with data provided and generated by the pedestrian himself. Accelerations and
velocities of the limbs are obtained with sensors mounted on different parts of the
body. These data gives indications of the kind of activity that a pedestrian will
perform when crossing or not in front of a vehicle. However, this approach has
some disadvantages, especially because all pedestrians approaching the vehicle
must be instrumented. Although today it is possible to rely on smartphones or
wristbands, these devices do not always have the ability to communicate effectively
with a vehicle.
The cameras and sensors that all intelligent vehicles already have, allow to
replace the information provided by the sensors mounted on pedestrians, extracting
dynamic information through the processing of images. For this, a virtual
skeleton of the body of the person in the line of sight of the vehicle is extracted
and several consecutive pictures of the video are processed. In this way, it is demonstrated
that the quality of the dynamic information extracted by this means
is comparable with the information provided by the sensors mounted on people.
With this information, an analysis of the performance of intention estimation
algorithms based on neural networks is presented. The results demonstrate that
the objective of determining the intention of a person crossing in front of a vehicle
is possible to achieve and to do it in a reliable way before diverse and real trafic
situations.

Identiferoai:union.ndltd.org:uns.edu.ar/oai:repositorio.bc.uns.edu.ar:123456789/4582
Date18 March 2019
CreatorsGerling Konrad, Santiago
ContributorsMasson, Favio Román, Nebot, Eduardo
PublisherUniversidad Nacional del Sur
Source SetsUniversidad Nacional del Sur
LanguageSpanish
Detected LanguageEnglish
TypeElectronic Thesis or Dissertation, Text
Rights2

Page generated in 0.0024 seconds