Spelling suggestions: "subject:"reconocimiento visual dde modelos"" "subject:"reconocimiento visual dee modelos""
1 |
Reconocimiento rápido de objetos usando objects proposals y deep learningSoto Barra, Claudia Naiomi January 2017 (has links)
Ingeniera Civil Eléctrica / El reconocimiento (o detección) de objetos es un área activa y en continua mejora de la
visión computacional. Recientemente se han introducido distintas estrategias para mejorar
el desempeño y disminuir los costos y el tiempo de detección. Entre estas, se encuentran
la generación de Object Proposals (regiones en la imágen donde hay alta probabilidad de
encontrar un objeto) para acelerar la etapa de localización, como respuesta al paradigma de
ventana deslizante; el cada vez más popular uso de redes Deep Learning y, en particular, para
la clasi cación y detección de imágenes, las redes convolucionales (CNN).
Si bien existen diversos trabajos que utilizan ambas técnicas, todos ellos se centran en tener
una buena performance en conocidas bases de datos y competencias en lugar de estudiar su
comportamiento en problemas reales y el efecto que tiene la modi cación de arquitecturas
de redes convencionales y la elección adecuada de un sistema de generación de proposals.
En este trabajo de título, entonces, se tiene como objetivo principal el caracterizar métodos
de generación de proposals para su uso en el reconocimiento de objetos con redes CNN,
comparando el desempeño tanto de los proposals generados como del sistema completo en
bases de datos fabricadas manualmente. Para estudiar el sistema completo, se comparan dos
estructuras conocidas, llamadas R-CNN y Fast R-CNN, que utilizan de distintas formas ambas
técnicas (generación de proposals y detección) y donde se considera en el estado del arte
mejor Fast R-CNN. Se propone en este trabajo que esta hipótesis no es del todo cierta en
el caso de que se trabaje con un número su cientemente bajo de proposals (donde las bases
de datos acá construidas se enfocan en precisamente asegurar una cantidad baja de objetos
de tamaños similares presentes en cada una: objetos sobre super cies y objetos de una sala
de estar) y se acelere el proceso de clasi cación alterando el tamaño de entrada de la red
convolucional utilizada.
Se eligieron tres métodos de generación de Proposals de la literatura a partir de su desempe
ño reportado, y fueron comparados en distintos escenarios sus tiempos de procesamiento,
calidad de proposals generados (mediante análisis visual y numérico) en función del número
generados de estos. El método llamado BING presenta una ventaja sustancial en términos del
tiempo de procesamiento y tiene un desempeño competitivo medido con el recall (fracción de
los objetos del ground truth correctamente detectados) para las aplicaciones escogidas. Para
implementar R-CNN se entrenan dos redes del tipo SqueezeNet pero con entradas reducidas
y seleccionando los 50 mejores proposals generados por BING se encuentra que para una red
de entrada 64x64 se alcanza casi el mismo recall (~ 40%) que se obtiene con el Fast R-CNN
original y con una mejor precisión, aunque es 5 veces más lento (0.75s versus 0.14s).
El sistema R-CNN implementado en este trabajo, entonces, no sólo acelera entre 10 y 20
veces la etapa de generación de proposals en comparación a su implementación original, si no
que el efecto de reducir la entrada de la red utilizada logra disminuir el tiempo de detección
a uno que es sólo 5 veces más lento que Fast R-CNN cuando antes era hasta 100 veces más
lento y con un desempeño equivalente.
|
2 |
Optimización de proceso de detección de partículas a partir de imágenes de video mediante paralelizaciónSilva Leal, Juan Sebastián January 2012 (has links)
Ingeniero Civil en Computación / La detección de objetos a partir de imágenes se ha convertido en una herramienta muy poderosa para diferentes disciplinas. El Laboratorio de Materia Fuera del Equilibrio del Departamento de Física de la Facultad cuenta con una implementación en C del Método χ^2 usando bibliotecas ad-hoc compatibles con Mac OSX para detectar partículas en sistemas granulares cuasi-bidimensionales compuestos por miles de partículas de acero de 1 mm de diámetro, pudiendo detectar partículas en una imagen de 1 MegaPixel en alrededor de 10 segundos. Sin embargo, estas imágenes provienen de videos que se desean analizar y en una sesión de trabajo se puede requerir analizar alrededor de unas 100.000 imágenes en total, por lo cual el procesamiento y posterior análisis de estas imágenes de video tiene una duración de varios días. Es por esto que fue necesario agilizar de alguna manera este procesamiento de imágenes y generar una solución robusta.
El objetivo principal de la memoria consistió en reducir los tiempos de detección de partículas generando un nuevo software basado en el anterior, facilitando extensiones futuras, y utilizando el máximo poder de cómputo disponible en el laboratorio.
El alumno ideó como solución un sistema distribuido haciendo uso de todos los computadores disponibles para el procesamiento de imágenes, reimplementando el código del software, en ese entonces utilizado, de C a C++ utilizando patrones de diseño para facilitar futuras extensiones del software y threads con el fin de aumentar el rendimiento de este. También se agregó tecnología CUDA para el procesamiento de datos reduciendo de forma considerable los tiempos de ejecución.
Como resultado final de la memoria, se logró obtener un speedup de alrededor de 5x haciendo uso de distribución de carga computacional, uso de procesos en paralelo, hilos de ejecución y tecnología CUDA, además se logró una solución más robusta y extensible para futuros cambios o generación de nuevos algoritmos de procesamiento.
Todo el proceso de investigación, desde la obtención de datos hasta la validación de la hipótesis, lleva mucho tiempo, en donde la detección de partículas es solo una parte de todo el calculo computacional que se debe realizar, por lo que se aconseja implementar en lenguajes no interpretados y más rápidos, como por ejemplo C++, otras etapas de cálculo de datos y además, en lo posible, distribuir el computo y usar CUDA.
|
Page generated in 0.1174 seconds