Spelling suggestions: "subject:"video surveillance."" "subject:"ideo surveillance.""
81 |
Öffentliche Videoüberwachung in den USA, Großbritannien und Deutschland / Ein Drei-Länder-Vergleich / Public Camera Surveillance in USA, Great Britain and Germany / A Three-Nation ComparisonLin, Chen-Yu 19 July 2006 (has links)
No description available.
|
82 |
Postures et mutations du plan-séquence fixe, du cinéma des premiers temps à YouTubeSéguin-Tétreault, Mathieu 06 1900 (has links)
Privilégiant une approche généalogique et intertextuelle, cette étude interroge le dispositif du plan-séquence fixe à travers ses moments phares dans l’histoire du cinéma et démontre que son usage vise autant à renouer avec le cinéma des premiers temps qu’à poursuivre les préoccupations des cinéastes expérimentaux. Chez Andy Warhol, le plan-séquence fixe s’inscrit dans un rapport de redécouverte et d’enchantement du cinéma des premiers temps. Avec Jeanne Dielman, Chantal Akerman prolonge les traits du modernisme bazinien et de l’avant-garde new-yorkaise. Avec l’avènement de la vidéosurveillance, il se transforme en une esthétique carcérale qui pose dès lors des problèmes éthiques et esthétiques (voyeurisme, degré zéro de la mise en scène, etc.), questionnés dans les documentaires News from Home et Délits flagrants. Forme commune et majeure dans le cinéma d’auteur contemporain de même que dans la culture populaire et amateur (web film, série télé, etc.), le plan-séquence fixe permet d’analyser un ensemble de pratiques et de réalités du cinéma, de l’usine Lumière à YouTube. / Favouring an approach at once genealogical and intertextual, this study explores the practice of the "static sequence shot" (plan-séquence caméra fixe) in cinema. It offers an overview of its significant moments in film history. It tries to show how its use since the 70's can be seen as a reappraisal of early cinema technique, and can also find strong echos in the works of experimental filmmakers, in particular structural filmmaking. For Andy Warhol, the static sequence shot was both a rediscovery and an enchantment of early cinema. In Jeanne Dielman Chantal Akerman's static shots extended Bazinian Modernism into the New York Avant-garde. Since the 80's, with the advent of video surveillance, the static sequence shot becomes associated with a carceral apparatus, posing ethical and aesthetic issues (voyeurism, degree zero mechanisms, etc.). These issues are at the core of the documentary films News from Home and Délits flagrants. Today, we can witness that the static sequence shot has become increasingly important and almost dominant in certain branches of auteur cinema as well as in contemporary popular media culture (web films, T.V. series, etc.) This master's thesis thus claims it allows us to analyse current as well as early practices of cinema, from the Lumière' s factory to YouTube. / Pour respecter les droits d'auteur, la version électronique de ce mémoire a été dépouillée de ses documents visuels. La version intégrale du mémoire a été déposée au Service de la gestion des documents et des archives de l'Université de Montréal.
|
83 |
Electronic workplace surveillance and employee privacy : a comparative analysis of privacy protection in Australia and the United StatesWatt, James Robert January 2009 (has links)
More than a century ago in their definitive work “The Right to Privacy” Samuel D. Warren and Louis D. Brandeis highlighted the challenges posed to individual privacy by advancing technology. Today’s workplace is characterised by its reliance on computer technology, particularly the use of email and the Internet to perform critical business functions. Increasingly these and other workplace activities are the focus of monitoring by employers.
There is little formal regulation of electronic monitoring in Australian or United States workplaces. Without reasonable limits or controls, this has the potential to adversely affect employees’ privacy rights.
Australia has a history of legislating to protect privacy rights, whereas the United States has relied on a combination of constitutional guarantees, federal and state statutes, and the common law. This thesis examines a number of existing and proposed statutory and other workplace privacy laws in Australia and the United States.
The analysis demonstrates that existing measures fail to adequately regulate monitoring or provide employees with suitable remedies where unjustifiable intrusions occur. The thesis ultimately supports the view that enacting uniform legislation at the national level provides a more effective and comprehensive solution for both employers and employees.
Chapter One provides a general introduction and briefly discusses issues relevant to electronic monitoring in the workplace. Chapter Two contains an overview of privacy law as it relates to electronic monitoring in Australian and United States workplaces. In Chapter Three there is an examination of the complaint process and remedies available to a hypothetical employee (Mary) who is concerned about protecting her privacy rights at work. Chapter Four provides an analysis of the major themes emerging from the research, and also discusses the draft national uniform legislation. Chapter Five details the proposed legislation in the form of the Workplace Surveillance and Monitoring Act, and Chapter Six contains the conclusion.
|
84 |
Apprentissage semi-supervisé pour la détection multi-objets dans des séquences vidéos : Application à l'analyse de flux urbains / Semi-supervised learning for multi-object detection in video sequences : Application to the analysis of urban flowMaâmatou, Houda 05 April 2017 (has links)
Depuis les années 2000, un progrès significatif est enregistré dans les travaux de recherche qui proposent l’apprentissage de détecteurs d’objets sur des grandes bases de données étiquetées manuellement et disponibles publiquement. Cependant, lorsqu’un détecteur générique d’objets est appliqué sur des images issues d’une scène spécifique les performances de détection diminuent considérablement. Cette diminution peut être expliquée par les différences entre les échantillons de test et ceux d’apprentissage au niveau des points de vues prises par la(les) caméra(s), de la résolution, de l’éclairage et du fond des images. De plus, l’évolution de la capacité de stockage des systèmes informatiques, la démocratisation de la "vidéo-surveillance" et le développement d’outils d’analyse automatique des données vidéos encouragent la recherche dans le domaine du trafic routier. Les buts ultimes sont l’évaluation des demandes de gestion du trafic actuelles et futures, le développement des infrastructures routières en se basant sur les besoins réels, l’intervention pour une maintenance à temps et la surveillance des routes en continu. Par ailleurs, l’analyse de trafic est une problématique dans laquelle plusieurs verrous scientifiques restent à lever. Ces derniers sont dus à une grande variété dans la fluidité de trafic, aux différents types d’usagers, ainsi qu’aux multiples conditions météorologiques et lumineuses. Ainsi le développement d’outils automatiques et temps réel pour l’analyse vidéo de trafic routier est devenu indispensable. Ces outils doivent permettre la récupération d’informations riches sur le trafic à partir de la séquence vidéo et doivent être précis et faciles à utiliser. C’est dans ce contexte que s’insèrent nos travaux de thèse qui proposent d’utiliser les connaissances antérieurement acquises et de les combiner avec des informations provenant de la nouvelle scène pour spécialiser un détecteur d’objet aux nouvelles situations de la scène cible. Dans cette thèse, nous proposons de spécialiser automatiquement un classifieur/détecteur générique d’objets à une scène de trafic routier surveillée par une caméra fixe. Nous présentons principalement deux contributions. La première est une formalisation originale de transfert d’apprentissage transductif à base d’un filtre séquentiel de type Monte Carlo pour la spécialisation automatique d’un classifieur. Cette formalisation approxime itérativement la distribution cible inconnue au départ, comme étant un ensemble d’échantillons de la base spécialisée à la scène cible. Les échantillons de cette dernière sont sélectionnés à la fois à partir de la base source et de la scène cible moyennant une pondération qui utilise certaines informations a priori sur la scène. La base spécialisée obtenue permet d’entraîner un classifieur spécialisé à la scène cible sans intervention humaine. La deuxième contribution consiste à proposer deux stratégies d’observation pour l’étape mise à jour du filtre SMC. Ces stratégies sont à la base d’un ensemble d’indices spatio-temporels spécifiques à la scène de vidéo-surveillance. Elles sont utilisées pour la pondération des échantillons cibles. Les différentes expérimentations réalisées ont montré que l’approche de spécialisation proposée est performante et générique. Nous avons pu y intégrer de multiples stratégies d’observation. Elle peut être aussi appliquée à tout type de classifieur. De plus, nous avons implémenté dans le logiciel OD SOFT de Logiroad les possibilités de chargement et d’utilisation d’un détecteur fourni par notre approche. Nous avons montré également les avantages des détecteurs spécialisés en comparant leurs résultats avec celui de la méthode Vu-mètre de Logiroad. / Since 2000, a significant progress has been recorded in research work which has proposed to learn object detectors using large manually labeled and publicly available databases. However, when a generic object detector is applied on images of a specific scene, the detection performances will decrease considerably. This decrease may be explained by the differences between the test samples and the learning ones at viewpoints taken by camera(s), resolution, illumination and background images. In addition, the storage capacity evolution of computer systems, the "video surveillance" democratization and the development of automatic video-data analysis tools have encouraged research into the road-traffic domain. The ultimate aims are the management evaluation of current and future trafic requests, the road infrastructures development based on real necessities, the intervention of maintenance task in time and the continuous road surveillance. Moreover, traffic analysis is a problematicness where several scientific locks should be lifted. These latter are due to a great variety of traffic fluidity, various types of users, as well multiple weather and lighting conditions. Thus, developing automatic and real-time tools to analyse road-traffic videos has become an indispensable task. These tools should allow retrieving rich data concerning the traffic from the video sequence and they must be precise and easy to use. This is the context of our thesis work which proposes to use previous knowledges and to combine it with information extracted from the new scene to specialize an object detector to the new situations of the target scene. In this thesis, we propose to automatically specialize a generic object classifier/detector to a road traffic scene surveilled by a fixed camera. We mainly present two contributions. The first one is an original formalization of Transductive Transfer Learning based on a sequential Monte Carlo filter for automatic classifier specialization. This formalization approximates iteratively the previously unknown target distribution as a set of samples composing the specialized dataset of the target scene. The samples of this dataset are selected from both source dataset and target scene further to a weighting step using some prior information on the scene. The obtained specialized dataset allows training a specialized classifier to the target scene without human intervention. The second contribution consists in proposing two observation strategies to be used in the SMC filter’s update step. These strategies are based on a set of specific spatio-temporal cues of the video surveillance scene. They are used to weight the target samples. The different experiments carried out have shown that the proposed specialization approach is efficient and generic. We have been able to integrate multiple observation strategies. It can also be applied to any classifier / detector. In addition, we have implemented into the Logiroad OD SOFT software the loading and utilizing possibilities of a detector provided by our approach. We have also shown the advantages of the specialized detectors by comparing their results to the result of Logiroad’s Vu-meter method.
|
85 |
Traffic analysis of low and ultra-low frame-rate videos / Analyse de trafic routier à partir de vidéos à faible débitLuo, Zhiming January 2017 (has links)
Abstract: Nowadays, traffic analysis are relying on data collected from various traffic sensors. Among the various traffic surveillance techniques, video surveillance systems are often used for monitoring and characterizing traffic load. In this thesis, we focused on two aspects of traffic analysis without using motion features in low frame-rate videos: Traffic density flow analysis and Vehicle detection and classification. Traffic density flow analysis}: Knowing in real time when the traffic is fluid or when it jams is a key information to help authorities re-route vehicles and reduce congestion. Accurate and timely traffic flow information is strongly needed by individual travelers, the business sectors and government agencies. In this part, we investigated the possibility of monitoring highway traffic based on videos whose frame rate is too low to accurately estimate motion features. As we are focusing on analyzing traffic images and low frame-rate videos, traffic density is defined as the percentage of road being occupied by vehicles. In our previous work, we validated that traffic status is highly correlated to its texture features and that Convolutional Neural Networks (CNN) has the superiority of extracting discriminative texture features. We proposed several CNN models to segment traffic images into three different classes (road, car and background), classify traffic images into different categories (empty, fluid, heavy, jam) and predict traffic density without using any motion features. In order to generalize the model trained on a specific dataset to analyze new traffic scenes, we also proposed a novel transfer learning framework to do model adaptation. Vehicle detection and classification: The detection of vehicles pictured by traffic cameras is often the very first step of video surveillance systems, such as vehicle counting, tracking and retrieval. In this part, we explore different deep learning methods applied to vehicle detection and classification. Firstly, realizing the importance of large dataset for traffic analysis, we built and released the largest traffic dataset (MIO-TCD) in the world for vehicle localization and classification in collaboration with colleagues from Miovision inc. (Waterloo, On). With this dataset, we organized the Traffic Surveillance Workshop and Challenge in conjunction with CVPR 2017. Secondly, we evaluated several state-of-the-art deep learning methods for the classification and localization task on the MIO-TCD dataset. In light of the results, we may conclude that state-of-the-art deep learning methods exhibit a capacity to localize and recognize vehicle from a single video frame. While with a deep analysis of the results, we also identify scenarios for which state-of-the-art methods are still failing and propose concrete ideas for future work. Lastly, as saliency detection aims to highlight the most relevant objects in an image (e.g. vehicles in traffic scenes), we proposed a multi-resolution 4*5 grid CNN model for the salient object detection. The model enables near real-time high performance saliency detection. We also extend this model to do traffic analysis, experiment results show that our model can precisely segment foreground vehicles in traffic scenes. / De nos jours, l’analyse de trafic routier est de plus en plus automatisée et s’appuie sur des données issues de senseurs en tout genre. Parmi les approches d’analyse de trafic routier figurent les méthodes à base de vidéo. Les méthodes à base de vidéo ont pour but d’identifier et de reconnaître les objets en mouvement (généralement des voitures et des piétons) et de comprendre leur dynamique. Un des défis parmi les plus difficile à résoudre est d’analyser des séquences vidéo dont le nombre d’images par seconde est très faible. Ce type de situation est pourtant fréquent considérant qu’il est très difficile (voir impossible) de transmettre et de stocker sur un serveur un très grand nombre d’images issues de plusieurs caméras. Dans ce cas, les méthodes issues de l’état de l’art échouent car un faible nombre d’images par seconde ne permet pas d’extraire les caractéristiques vidéos utilisées par ces méthodes tels le flux optique, la détection de mouvement et le suivi de véhicules. Au cours de cette thèse, nous nous sommes concentré sur l’analyse de trafic routier à partir de séquences vidéo contenant un très faible nombre d’images par seconde. Plus particulièrement, nous nous sommes concentrés sur les problème d’estimation de la densité du trafic routier et de la classification de véhicules. Pour ce faire, nous avons proposé différents modèles à base de réseaux de neurones profonds (plus particulièrement des réseaux à convolution) ainsi que de nouvelles bases de données permettant d’entraîner les dits modèles. Parmi ces bases de données figure « MIO-TCD », la plus grosse base de données annotées au monde faite pour l’analyse de trafic routier.
|
86 |
Bitrate Reduction Techniques for Low-Complexity Surveillance Video CodingGorur, Pushkar January 2016 (has links) (PDF)
High resolution surveillance video cameras are invaluable resources for effective crime prevention and forensic investigations. However, increasing communication bandwidth requirements of high definition surveillance videos are severely limiting the number of cameras that can be deployed. Higher bitrate also increases operating expenses due to higher data communication and storage costs. Hence, it is essential to develop low complexity algorithms which reduce data rate of the compressed video stream without affecting the image fidelity. In this thesis, a computer vision aided H.264 surveillance video encoder and four associated algorithms are proposed to reduce the bitrate. The proposed techniques are (I) Speeded up foreground segmentation, (II) Skip decision, (III) Reference frame selection and (IV) Face Region-of-Interest (ROI) coding.
In the first part of the thesis, a modification to the adaptive Gaussian Mixture Model (GMM) based foreground segmentation algorithm is proposed to reduce computational complexity. This is achieved by replacing expensive floating point computations with low cost integer operations. To maintain accuracy, we compute periodic floating point updates for the GMM weight parameter using the value of an integer counter. Experiments show speedups in the range of 1.33 - 1.44 on standard video datasets where a large fraction of pixels are multimodal.
In the second part, we propose a skip decision technique that uses a spatial sampler to sample pixels. The sampled pixels are segmented using the speeded up GMM algorithm. The storage pattern of the GMM parameters in memory is also modified to improve cache performance. Skip selection is performed using the segmentation results of the sampled pixels. In the third part, a reference frame selection algorithm is proposed to maximize the number of background Macroblocks (MB’s) (i.e. MB’s that contain background image content) in the Decoded Picture Buffer. This reduces the cost of coding uncovered background regions. Distortion over foreground pixels is measured to quantify the performance of skip decision and reference frame selection techniques. Experimental results show bit rate savings of up to 94.5% over methods proposed in literature on video surveillance data sets. The proposed techniques also provide up to 74.5% reduction in compression complexity without increasing the distortion over the foreground regions in the video sequence.
In the final part of the thesis, face and shadow region detection is combined with the skip decision algorithm to perform ROI coding for pedestrian surveillance videos. Since person identification requires high quality face images, MB’s containing face image content are encoded with a low Quantization Parameter setting (i.e. high quality). Other regions of the body in the image are considered as RORI (Regions of reduced interest) and are encoded at low quality. The shadow regions are marked as Skip. Techniques that use only facial features to detect faces (e.g. Viola Jones face detector) are not robust in real world scenarios. Hence, we propose to initially detect pedestrians using deformable part models. The face region is determined using the deformed part locations. Detected pedestrians are tracked using an optical flow based tracker combined with a Kalman filter. The tracker improves the accuracy and also avoids the need to run the object detector on already detected pedestrians. Shadow and skin detector scores are computed over super pixels. Bilattice based logic inference is used to combine multiple likelihood scores and classify the super pixels as ROI, RORI or RONI. The coding mode and QP values of the MB’s are determined using the super pixel labels. The proposed techniques provide a further reduction in bitrate of up to 50.2%.
|
87 |
Návrh elektronického zabezpečovacího systému jako část fyzického zabezpečení energetických objektů kritické infrastruktury / Proposal of an electronic security system as part of the physical securing of critical infrastructure energetic objectsMihálik, Andrej January 2018 (has links)
This master's thesis deals with the design of an electronic security system as part of the physical security for the energy company in the Czech Republic. The electronic security system is designed to meet all legal requirements, internal directives and has also passed ISO 27001 certification. The Implementation of the security system is demonstrated on the selected object of the company that belongs to the elements of the critical infrastructure.
|
88 |
Data Reduction based energy-efficient approaches for secure priority-based managed wireless video sensor networks / Approches écoénergétiques basées sur la réduction des données pour les réseaux de capteurs vidéo sans filSalim, Christian 03 December 2018 (has links)
L'énorme quantité de données dans les réseaux de capteurs vidéo sans fil (WVSN) pour les nœuds de capteurs de ressources limitées augmente les défis liés à la consommation d'énergie et à la consommation de bande passante. La gestion du réseau est l’un des défis de WMSN en raison de l’énorme quantité d’images envoyées simultanément par les capteurs au coordinateur. Dans cette thèse, pour surmonter ces problèmes, plusieurs contributions ont été apportées. Chaque contribution se concentre sur un ou deux défis, comme suit: Dans la première contribution, pour réduire la consommation d'énergie, une nouvelle approche pour l'agrégation des données dans WVSN basée sur des fonctions de similarité des plans est proposée. Il est déployé sur deux niveaux: le niveau du nœud du capteur vidéo et le niveau du coordinateur. Au niveau du nœud de capteur, nous proposons une technique d'adaptation du taux de trame et une fonction de similarité pour réduire le nombre de trames détectées par les nœuds de capteur et envoyées au coordinateur. Au niveau du coordinateur, après avoir reçu des plans de différents nœuds de capteurs voisins, la similarité entre ces plans est calculée pour éliminer les redondances. Dans la deuxième contribution, certains traitements et analyses sont ajoutés en fonction de la similarité entre les images au niveau du capteur-nœud pour n'envoyer que les cadres importants au coordinateur. Les fonctions cinématiques sont définies pour prévoir l'étape suivante de l'intrusion et pour planifier le système de surveillance en conséquence. Dans la troisième contribution, sur la phase de transmission, au niveau capteur-nœud, un nouvel algorithme d'extraction des différences entre deux images est proposé. Cette contribution prend également en compte le défi de sécurité en adaptant un algorithme de chiffrement efficace au niveau du nœud de capteur. Dans la dernière contribution, pour éviter une détection plus lente des intrusions conduisant à des réactions plus lentes du coordinateur, un protocole mac-layer basé sur le protocole S-MAC a été proposé pour contrôler le réseau. Cette solution consiste à ajouter un bit de priorité au protocole S-MAC pour donner la priorité aux données critiques. / The huge amount of data in Wireless Video Sensor Networks (WVSNs) for tiny limited resources sensor nodes increases the energy and bandwidth consumption challenges. Controlling the network is one of the challenges in WMSN due to the huge amount of images sent at the same time from the sensors to the coordinator. In this thesis, to overcome these problems, several contributions have been made. Each contribution concentrates on one or two challenges as follows: In the first contribution, to reduce the energy consumption a new approach for data aggregation in WVSN based on shot similarity functions is proposed. It is deployed on two levels: the video-sensor node level and the coordinator level. At the sensor node level, we propose a frame rate adaptation technique and a similarity function to reduce the number of frames sensed by the sensor nodes and sent to the coordinator. At the coordinator level, after receiving shots from different neighboring sensor nodes, the similarity between these shots is computed to eliminate redundancies. In the second contribution, some processing and analysis are added based on the similarity between frames on the sensor-node level to send only the important frames to the coordinator. Kinematic functions are defined to predict the next step of the intrusion and to schedule the monitoring system accordingly. In the third contribution, on the transmission phase, on the sensor-node level, a new algorithm to extract the differences between two images is proposed. This contribution also takes into account the security challenge by adapting an efficient ciphering algorithm on the sensor node level. In the last contribution, to avoid slower detection of intrusions leading to slower reactions from the coordinator, a mac-layer protocol based on S-MAC protocol has been proposed to control the network. This solution consists in adding a priority bit to the S-MAC protocol to give priority to critical data.
|
89 |
Détection de chute à l'aide d'une caméra de profondeurAlla, Jules-Ryane S. 04 1900 (has links)
Les chutes chez les personnes âgées représentent un problème important de santé publique.
Des études montrent qu’environ 30 % des personnes âgées de 65 ans et plus chutent chaque
année au Canada, entraînant des conséquences néfastes sur les plans individuel, familiale et
sociale. Face à une telle situation la vidéosurveillance est une solution efficace assurant la
sécurité de ces personnes.
À ce jour de nombreux systèmes d’assistance de services à la personne existent. Ces
dispositifs permettent à la personne âgée de vivre chez elle tout en assurant sa sécurité par le
port d'un capteur. Cependant le port du capteur en permanence par le sujet est peu confortable
et contraignant. C'est pourquoi la recherche s’est récemment intéressée à l’utilisation de
caméras au lieu de capteurs portables.
Le but de ce projet est de démontrer que l'utilisation d'un dispositif de vidéosurveillance peut
contribuer à la réduction de ce fléau. Dans ce document nous présentons une approche de
détection automatique de chute, basée sur une méthode de suivi 3D du sujet en utilisant une
caméra de profondeur (Kinect de Microsoft) positionnée à la verticale du sol. Ce suivi est
réalisé en utilisant la silhouette extraite en temps réel avec une approche robuste d’extraction
de fond 3D basée sur la variation de profondeur des pixels dans la scène. Cette méthode se
fondera sur une initialisation par une capture de la scène sans aucun sujet. Une fois la
silhouette extraite, les 10% de la silhouette correspondant à la zone la plus haute de la
silhouette (la plus proche de l'objectif de la Kinect) sera analysée en temps réel selon la vitesse
et la position de son centre de gravité. Ces critères permettront donc après analyse de détecter
la chute, puis d'émettre un signal (courrier ou texto) vers l'individu ou à l’autorité en charge
de la personne âgée. Cette méthode a été validée à l’aide de plusieurs vidéos de chutes
simulées par un cascadeur.
La position de la caméra et son information de profondeur réduisent de façon considérable les
risques de fausses alarmes de chute. Positionnée verticalement au sol, la caméra permet donc
d'analyser la scène et surtout de procéder au suivi de la silhouette sans occultation majeure, qui
conduisent dans certains cas à des fausses alertes. En outre les différents critères de détection
de chute, sont des caractéristiques fiables pour différencier la chute d'une personne, d'un
accroupissement ou d'une position assise. Néanmoins l'angle de vue de la caméra demeure un
problème car il n'est pas assez grand pour couvrir une surface conséquente. Une solution à ce
dilemme serait de fixer une lentille sur l'objectif de la Kinect permettant l’élargissement de la
zone surveillée. / Elderly falls are a major public health problem. Studies show that about 30% of people aged
65 and older fall each year in Canada, with negative consequences on individuals, their
families and our society. Faced with such a situation a video surveillance system is an
effective solution to ensure the safety of these people.
To this day many systems support services to the elderly. These devices allow the elderly to
live at home while ensuring their safety by wearing a sensor. However the sensor must be
worn at all times by the subject which is uncomfortable and restrictive. This is why research
has recently been interested in the use of cameras instead of wearable sensors.
The goal of this project is to demonstrate that the use of a video surveillance system can help
to reduce this problem. In this thesis we present an approach for automatic detection of falls
based on a method for tracking 3D subject using a depth camera (Kinect from Microsoft)
positioned vertically to the ground. This monitoring is done using the silhouette extracted in
real time with a robust approach for extracting 3D depth based on the depth variation of the
pixels in the scene. This method is based on an initial capture the scene without any body.
Once extracted, 10% of the silhouette corresponding to the uppermost region (nearest to the
Kinect) will be analyzed in real time depending on the speed and the position of its center of
gravity . These criteria will be analysed to detect the fall, then a signal (email or SMS) will be
transmitted to an individual or to the authority in charge of the elderly. This method was
validated using several videos of a stunt simulating falls.
The camera position and depth information reduce so considerably the risk of false alarms.
Positioned vertically above the ground, the camera makes it possible to analyze the scene
especially for tracking the silhouette without major occlusion, which in some cases lead to
false alarms. In addition, the various criteria for fall detection, are reliable characteristics for
distinguishing the fall of a person, from squatting or sitting. Nevertheless, the angle of the
camera remains a problem because it is not large enough to cover a large surface. A solution to
this dilemma would be to fix a lens on the objective of the Kinect for the enlargement of the
field of view and monitored area.
|
90 |
Détection de chute à l'aide d'une caméra de profondeurAlla, Jules-Ryane S. 04 1900 (has links)
Les chutes chez les personnes âgées représentent un problème important de santé publique.
Des études montrent qu’environ 30 % des personnes âgées de 65 ans et plus chutent chaque
année au Canada, entraînant des conséquences néfastes sur les plans individuel, familiale et
sociale. Face à une telle situation la vidéosurveillance est une solution efficace assurant la
sécurité de ces personnes.
À ce jour de nombreux systèmes d’assistance de services à la personne existent. Ces
dispositifs permettent à la personne âgée de vivre chez elle tout en assurant sa sécurité par le
port d'un capteur. Cependant le port du capteur en permanence par le sujet est peu confortable
et contraignant. C'est pourquoi la recherche s’est récemment intéressée à l’utilisation de
caméras au lieu de capteurs portables.
Le but de ce projet est de démontrer que l'utilisation d'un dispositif de vidéosurveillance peut
contribuer à la réduction de ce fléau. Dans ce document nous présentons une approche de
détection automatique de chute, basée sur une méthode de suivi 3D du sujet en utilisant une
caméra de profondeur (Kinect de Microsoft) positionnée à la verticale du sol. Ce suivi est
réalisé en utilisant la silhouette extraite en temps réel avec une approche robuste d’extraction
de fond 3D basée sur la variation de profondeur des pixels dans la scène. Cette méthode se
fondera sur une initialisation par une capture de la scène sans aucun sujet. Une fois la
silhouette extraite, les 10% de la silhouette correspondant à la zone la plus haute de la
silhouette (la plus proche de l'objectif de la Kinect) sera analysée en temps réel selon la vitesse
et la position de son centre de gravité. Ces critères permettront donc après analyse de détecter
la chute, puis d'émettre un signal (courrier ou texto) vers l'individu ou à l’autorité en charge
de la personne âgée. Cette méthode a été validée à l’aide de plusieurs vidéos de chutes
simulées par un cascadeur.
La position de la caméra et son information de profondeur réduisent de façon considérable les
risques de fausses alarmes de chute. Positionnée verticalement au sol, la caméra permet donc
d'analyser la scène et surtout de procéder au suivi de la silhouette sans occultation majeure, qui
conduisent dans certains cas à des fausses alertes. En outre les différents critères de détection
de chute, sont des caractéristiques fiables pour différencier la chute d'une personne, d'un
accroupissement ou d'une position assise. Néanmoins l'angle de vue de la caméra demeure un
problème car il n'est pas assez grand pour couvrir une surface conséquente. Une solution à ce
dilemme serait de fixer une lentille sur l'objectif de la Kinect permettant l’élargissement de la
zone surveillée. / Elderly falls are a major public health problem. Studies show that about 30% of people aged
65 and older fall each year in Canada, with negative consequences on individuals, their
families and our society. Faced with such a situation a video surveillance system is an
effective solution to ensure the safety of these people.
To this day many systems support services to the elderly. These devices allow the elderly to
live at home while ensuring their safety by wearing a sensor. However the sensor must be
worn at all times by the subject which is uncomfortable and restrictive. This is why research
has recently been interested in the use of cameras instead of wearable sensors.
The goal of this project is to demonstrate that the use of a video surveillance system can help
to reduce this problem. In this thesis we present an approach for automatic detection of falls
based on a method for tracking 3D subject using a depth camera (Kinect from Microsoft)
positioned vertically to the ground. This monitoring is done using the silhouette extracted in
real time with a robust approach for extracting 3D depth based on the depth variation of the
pixels in the scene. This method is based on an initial capture the scene without any body.
Once extracted, 10% of the silhouette corresponding to the uppermost region (nearest to the
Kinect) will be analyzed in real time depending on the speed and the position of its center of
gravity . These criteria will be analysed to detect the fall, then a signal (email or SMS) will be
transmitted to an individual or to the authority in charge of the elderly. This method was
validated using several videos of a stunt simulating falls.
The camera position and depth information reduce so considerably the risk of false alarms.
Positioned vertically above the ground, the camera makes it possible to analyze the scene
especially for tracking the silhouette without major occlusion, which in some cases lead to
false alarms. In addition, the various criteria for fall detection, are reliable characteristics for
distinguishing the fall of a person, from squatting or sitting. Nevertheless, the angle of the
camera remains a problem because it is not large enough to cover a large surface. A solution to
this dilemma would be to fix a lens on the objective of the Kinect for the enlargement of the
field of view and monitored area.
|
Page generated in 0.0631 seconds