La identificación de acciones en secuencias de video es un tema de especial interés
para aplicaciones como detección de peleas, identificación de vandalismo, detección
de asaltos a transeúntes, detección de contenido no apto para menores, etc. Este
interés se encuentra asociado al incremento de cámaras de videovigilancia alrededor
del mundo y a la masiva producción de videos en línea cargados a las diferentes
plataformas sociales de almacenamiento y distribución de contenido bajo demanda.
Debido a ello, se decide utilizar un modelo de detección de acciones humanas y
aplicarlo en secuencias de videovigilancia. Dicho modelo utiliza redes neuronales
profundas, con la finalidad de poder realizar la tarea de clasificación. El modelo
aplicado se basa en el extracción de características convolucionales y temporales
utilizando una parte de la red Inception V3 para lo primero y una red LSTM para lo
segundo. Finalmente, se aplica el modelo en el dataset UCF101 el cual contiene
acciones humanas diversas y luego sobre el dataset VIRAT 2.0 Ground, el cual
contiene secuencias de videovigilancia. / Tesis
Identifer | oai:union.ndltd.org:PUCP/oai:tesis.pucp.edu.pe:20.500.12404/13049 |
Date | 28 November 2018 |
Creators | Fernández Martínez, Luis Christian |
Contributors | Beltrán Castañón, César Armando |
Publisher | Pontificia Universidad Católica del Perú, PE |
Source Sets | Pontificia Universidad Católica del Perú |
Language | Spanish |
Detected Language | Spanish |
Type | info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess, http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
Page generated in 0.0021 seconds