Return to search

Real-time automated annotation of surveillance scenes

Video surveillance has become of a major research topic recently due to the increasing number of potential applications in public spaces. In particular, there is a demand for automated surveillance applications that detect different types of activities related to public safety, such as in metro stations. Automated video surveillance is intended to be used as an aid to human operators by bringing to their attention certain designated events of interest.This thesis presents a real-time video surveillance system that detects a range of activities in a scene viewed by a single color-video camera. Our contribution in this work is mainly exploiting the properties of the CIELab color space to improve the performance at the low level processing, proposing a multi-level blob matching algorithm to solve the object tracking problem, and using a hierarchy of semantics for detecting events that are of interest to public spaces surveillance.A complete framework of a surveillance system is presented. Objects in an observed scene are modeled by blobs that are detected by means of the adaptive background modeling codebook implementation based on the work of Kim et al. [2]. The implementation uses a dynamically updated codebook in which blobs in the video are characterized in color space, while also dealing with shadows. Collections of blobs, which represent potential objects of interest, are tracked and classified in real-time. For tracking, we employ a simple correlation process based on an elaborate blob matching algorithm. The essence of this algorithm is to find the best blob collection based on matching all potential color histograms from previous frames to those obtained in the current frame. Rules are used to resolve complex cases such as ghosts, occlusion, and lost tracks. Objects are then classified as either being animate persons or inanimate objects. This is essential for providing an accurate description of the scene and drawing the correct inferences about object interaction and events. Given this description of the video, a hierarchical semantic approach is used for event detection. The proposed framework investigates a generalized approach to detecting a spectrum of behaviours based on object interactions and trajectories. These behaviours range from simple single agent events such as loitering, to more complex interactive ones, such as people walking together. Experimental results are presented for standard available videos in order to verify the performance of the system and are compared to existing results in the literature. These results show a significant improvement both in terms of quality and speed, making a step towards a more reliable fully automated surveillance system. / La surveillance vidéo est devenue un sujet de recherche majeur récemment en raison du nombre croissant d'usages potentiels dans les espaces publics. En particulier, il y a une demande pour des applications de surveillance automatisées qui détectent différents types d'activités liées à la sécurité publique, comme dans les stations de métro. La surveillance vidéo automatisée est destinée à être utilisé comme une aide aux opérateurs humains en attirant leur attention à certains événements désignés d'intérêt. Cette thèse présente un système de surveillance vidéo en temps réel qui détecte une gamme d'activités dans une scène captée par une caméra vidéo couleur. Nos contributions sont principalement l'exploitation des propriétés de l'espace couleur CIELab pour améliorer la performance du traitement de bas niveau, la proposition d'un algorithme multi-niveau recherchant les équivalences de 'blob' pour résoudre le problème de suivi d'objets, et l'utilisation d'une hiérarchie de sémantique pour détecter les événements d'intérêt dans la surveillance des espaces publics. Un cadre complet d'un système de surveillance est présenté. Les objets dans une scène observée sont modélisés par des 'blob's qui sont détectés par la mise en œuvre du dictionnaire de modélisation d'arrière-plan adaptative basée sur les travaux de Kim et al. [1]. La mise en œuvre utilise un dictionnaire mis à jour dynamiquement dans lequel les blobs dans la vidéo sont caractérisées dans l'espace couleur, tout en traitant avec les ombres. Les collections de blobs, qui représentent des objets d'intérêt potentiel, sont suivies et classées en temps réel. Pour le suivi, nous employons un processus de corrélation simple basé sur un algorithme complexe de recherche d'équivalences de blob. L'essence de cet algorithme est de trouver la meilleure collection de blob basée sur la correspondance des tous les histogrammes potentiels de couleurs des cadres précédents à ceux obtenus dans le cadre actuel. Des lois sont utilisées pour résoudre les cas complexes comme les 'fantômes', l'occlusion, et les pistes perdues. Les objets sont alors classés comme étant des personnes animées ou des objets inanimés. Cela est essentiel pour fournir une description précise de la scène et pour faire les bonnes déductions par rapport aux événements et aux interactions d'objets. Une approche sémantique hiérarchique est utilisée pour la détection des événements, en partant de cette description. Le cadre proposé étudie une approche généralisée pour détecter une gamme de comportements fondés sur les interactions et les trajectoires d'objets. Ces comportements varient d'événements simples avec un seul agent, comme le flânage, aux événements plus complexes et interactifs, par exemple des personnes qui marchent ensemble. Les résultats expérimentaux sont présentés pour des vidéos standards et disponibles, puis sont comparés aux résultats existants dans la littérature afin de vérifier les performances du système. Ces résultats montrent une amélioration importante en termes de qualité et de vitesse, un pas vers un système plus fiable de surveillance entièrement automatisé.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.107826
Date January 2012
CreatorsElhamod, Mohannad
ContributorsMartin D Levine (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Engineering (Department of Electrical and Computer Engineering)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0025 seconds