Global ETD Search

1	Application de techniques d’apprentissage pour la détection et la reconnaissance d’individus / Learning techniques application to person detection and recognition Hamoudi, Lyes 07 June 2011 (has links) Nous présentons dans cette thèse une approche de reconnaissance de personnes basée sur l’apparence. L’objectif est de fournir un bloc de traitement pouvant s’incorporer dans un système de surveillance plus global dédié à l’analyse comportementale. A l’inverse des méthodes de reconnaissance biométriques telles que la reconnaissance de visage ou la reconnaissance de la démarche, notre objectif est ici de distinguer des personnes entre elles, par le biais de leur « modèle d’apparence », plutôt que d’associer un identifiant unique à chaque individu. En outre, contrairement aux méthodes qui existent dans la littérature, le « modèle d’apparence » que nous construisons est issu de la modélisation séparée des parties supérieure et inférieure des corps des individus à reconnaitre. Ainsi, nous avons mis au point une stratégie de classification (basée sur la technique one-class SVM) nous permettant d’effectuer deux opérations. Nous appelons la première opération la « fusion des classes » et qui consistent à détecter en amont (c'est-à-dire lors de l’apprentissage) les classes de vêtement similaires et les rassembler en une seule classe. Cette opération est effectuée afin d’éviter des confusions entre les classes lors de la reconnaissance des individus. La deuxième opération est un « apprentissage en ligne ». Cette dernière permet au système, lors de la phase de reconnaissance, de reconnaitre que l’individu présent dans la scène correspond à une « nouveauté » (c'est-à-dire que cet individu n’a pas été appris), puis de l’incorporer dans la base d’apprentissage. / We present in this thesis an appearance-based person recognition approach. The goal is to provide a processing bloc that can be integrated to a global surveillance system for behaviour analysis. Contrary to biometric recognition methods as face recognition or gait recognition, our goal here is to distinguish between people using their “appearance model”, instead of associating one label to each individual. Besides, contrary to the existing methods, the “appearance model” we construct comes from the separated modelling of the upper and lower body parts of each individual to recognize. So, we developed a classification strategy (based on one-class SVM technique) that allows to carry out two operations. We call the first operation “classes fusion” and which consists in detecting upstream (i.e. during the learning phase) the similar clothes classes and in gathering them into one class. This procedure is used to avoid confusions between classes during the recognition phase. The second operation consists in an “on line learning” which allows the system, during the recognition phase, to recognize that the individual present in the scene is “new” (i.e. who has not been learnt), and to add him to the learning base. Vidéosurveillance 006.37
2	Modélisation des métadonnées spatio-temporelles associées aux contenus vidéos et interrogation de ces métadonnées à partir des trajectoires hybrides : application dans le contexte de la vidéosurveillance / Spatio-temporal metadata associated to video content modelling and querying based on hybrid trajectories : application in the videosurveillance context Codreanu, Dana 21 May 2015 (has links) Le nombre de caméras vidéos déployées de nos jours tant dans des contextes professionnels (e.g., dans le cadre des systèmes de vidéo surveillance urbaine) aussi bien que personnels (e.g., caméras de smartphones) augmente de façon exponentielle, générant des volumes de contenus considérables. Rendre le filtrage et la recherche de ces contenus plus efficace est une préoccupation inévitable, avec des exigences de vélocité et de mobilité des contenus liées aux nouvelles infrastuctures qui obligent à revitaliser les techniques d'indexation "classiques". Les approchent existantes pour répondre à ce besoin se focalisent sur deux axes: (1) la proposition d'outils d'analyse des contenus vidéos pour l'extraction automatique d'informations comme le contour des personnes ou la présence d'une activité "anormale"; (2) l'indexation des vidéos en utilisant des métadonnées liées aux contenus (e.g., un texte descriptif, des tags, des données de géolocalisation). Nos travaux se situent dans le second axe. Le contexte d'application de notre travail est celui des systèmes de vidéosurveillance. Notre recherche a été guidée par différents projets de recherche en collaboration avec la Police Nationale, la SNCF, la RATP et Thalès Sécurité. Dans le contexte, les systèmes visés sont caractérisés par: (1) une grande "variété" des contaxtes d'acquisition des contenus (e.g., indoor, outdoor), (2) un très grand volume de données et un manque d'accès à certains contenus, (3) la multitude des formats fermés propriétaires et l'absence de standards, qui engendre une hétérogénéité des formats des données et des métadonnées issues de tels systèmes. De ce fait, d'une part, le développement d'outils d'analyse du contenu génériques et performants dans tous les contextes est très problématique compte tenu des diversités des contextes d'acquisition, des volumes à traiter et de l'inaccessibilité directe de certianes sources. D'autre part, l'absence de métadonnées ajoutées aux vidéos (tags, commentaires) rend quasi caduque l'utilisation des approches d'indexation classique. La première contribution de ce mémoire est une conséquence directe de ce constat et consiste en un dictionnaire de métadonnées spécifique au contexte de la vidéosurveillance. Ce dictionnaire est structuré dans un format qui enrichit la norme ISO 22311 qui a comme objectif la facilitation de l'interopérabilité des systèmes de vidéosurveillance. La seconde contribution concerne la recherche et le filtrage de vidéos basés sur des métadonnées spatio-temporelles. Nous avons réalisé une étude sur le traitement actuel des requêtes dans le cadre des systèmes de vidéosurveillance qui met en évidence que le point d'entrée de toute requête est une trajectoire reconstituée à partir des positions d'une personne par exemple et d'un intervalle temporel qui est ensuite utilisée pour retrouver des extraits vidéos des caméras qui ont pu filmer une scène d'intérêt. De ce fait, la recherche de vidéos est positionnée comme un problème de modélisation des données spatio-temporelles. / The number of video cameras deployed nowadays in both professional (e.g., urban videosurveillance systems) and personal (e.g., smartphone's cameras) contexts is growing exponentially, producing some considerable volumes of data. Driving the flitering and the retrieval of this content more effective is a major concern, driven by the content mobility and velocity requirements related to the utilization of new technologies, requirements that lead to the need to revitalize the classical indexing techniques. The actual approches that aim to satisfy these requirements have a twofold orientation: (1) the proposition of video content based indexing tools that automatically extract information like a person's shape or the persence of an "abnormal" activity in the video; (2) the video indexing based on metadata like textual descriptions, tags or geolocalisation data. Our work concern this second research direction. the application context of our work is related to videosurveillance systems. Our research was guided by different research projects in collaboration with the National Police, SNCF, RATP end Thales Sécurité. In the context, the targeted systems are characterized by: (1) the big "variety" of content acquisition contexts (e.g., indoor, outdoor), (2) the big data volume and the lack of access to some content, (3) the multitude of system owners and the lack of standards, wich leads to a heterogeneity of data and metadata formats generated by videosurveillance systems. Consequently, on one hand, the developement of content based indexing tools generic and reliable in all contexts is problematic given tha acquisition contexts diversity, the content volume and the lack of direct access to certain sources. On the other hand, the lack of metadata associated to the video (tags, comments) makes the use of classical indexing approaches very difficult. The first contribution of this report is a direct consequence of this assessment and consists of a metadata dictionary specific for the videosurveillance context. This dictionary is structure in a format that enriches the ISO 22311 standard whose objective is to facilitate the interoperability of videosurveillance systems. The second contribution concerns the video filtering and retrieval. We did an analysis of the current query processing mechanism within the videosurveillance systems that highlighted the fact that the entry point of any query is a trajectory reconstituted based on a person's positions and a time interval. These elements are used to select the videos of the cameras that are likely to have filmed the scenery of interest. Consequently, the video retrieval is trated as a spatio-temporal data modelling problem. Vidéosurveillance Multimédia metadata Forensic
3	Vidéosurveillance pour le contrôle de la prise de médicaments Valin, Myriam January 2006 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Vidéosurveillance Prise de médicaments Détection Suivi Reconnaissance d'activité Maisons intelligentes
4	De la vidéoprojection à la vidéosurveillance : une étude sur l'acceptabilité sociale de la caméra / From video protection to video surveillance : a study on the social acceptability of the camera Ory, Murielle 21 September 2012 (has links) Des élus politiques, des membres des forces de l’ordre et des citoyens s’opposent sur la question du bien fondé de l’utilisation de la vidéosurveillance en milieu urbain lorsqu’on la met au service de la gestion de la sécurité. Si les uns voient dans l’installation de ces systèmes un danger pour les libertés fondamentales du citoyen, les autres considèrent que l’usage de la vidéosurveillance se justifie par la pression de l’insécurité. Il s’agit dans cette recherche de présenter les argumentaires des partisans et des détracteurs de la vidéosurveillance en distinguant les éléments divergents ou contradictoires du débat public sur ces dispositifs. Je me penche d’autre part sur la réception de ces systèmes par une population d’enquêtés strasbourgeois. L’analyse des discours recueillis permet à la fois de mettre en lumière des systèmes de représentations et de croyances concernant la surveillance vidéo de la ville dans laquelle ces vidéosurveillés vivent et agissent quotidiennement et de dégager les éléments qui entrent en considération lorsqu’un acteur formule une appréciation individuelle sur la légitimité de la vidéosurveillance. On verra que le type d’impression que provoque la caméra sur celui qui la perçoit n’est jamais constant mais qu’il varie selon la construction de la figure du vidéosurveillant, avec la nature du lieu dans lequel l’expérience de la vidéosurveillance est vécue mais aussi en fonction de la valeur attribuée à l’image du corps dans les différents espaces filmés. / Elected representatives, members of the police and citizens are at odds concerning the appropriateness of using video surveillance (closed-circuit television) in towns for security management purposes. Some see the implementation of these systems as a danger for the fundamental freedoms of citizens, while others consider that the use of video surveillance can be justified by the pressure of insecurity. The point of this research is to present the arguments of the supporters and critics of video surveillance by distinguishing the divergent and contradictory factors of the public debate on these devices. Furthermore, I focus on the reception of these systems by the people from Strasbourg, I have interviewed. Not only does the analysis of the gathered speeches highlight systems of representation and belief, relative to the video surveillance of the town in which the video-monitored people live and behave, on a daily basis, but it also reveals the factors to be taken into account when a person formulates an individual judgement on the legitimacy of video surveillance. We will see that the type of impression the camera provokes on the person who perceives it, is never constant, and varies according to the construction of the character/behaviour of the video surveillance operator, to the nature of the place in which the video surveillance experience is carried out, and also according to the value attributed to the image of the body, in the different filmed places. Vidéosurveillance Contrôle social Déviance Regard Sociologie urbaine Sociologie de la réception 303.3
5	Examen empirique de la gestion de l'affichage en vidéosurveillance Latulippe-Thériault, Jean-Denis 13 December 2024 (has links) Des investissements substantiels sont effectués dans le domaine de la vidéosurveillance dans le but d’augmenter la sécurité du public et des infrastructures. Dans les salles de contrôle, l’opérateur humain doit surveiller un nombre de scènes visuelles qui dépasse généralement le nombre d’écrans disponibles. Dans ce contexte, deux approches de surveillance peuvent être privilégiées : la stratégie « paritaire », où une répartition égale dans l’affichage des caméras est favorisée, et la stratégie « prioritaire », où l’affichage de certaines caméras est priorisé par rapport aux autres. Toutefois, l’impact de ces stratégies de surveillance sur la performance de l’opérateur n’est toujours pas connu. La présente étude cherche à vérifier dans quelle mesure les deux stratégies sont utilisées naturellement par des surveillants non-experts, puis à évaluer leur impact sur la performance à l’aide d’une simulation réaliste de vidéosurveillance. Placés dans un contexte de surveillance de sécurité lors d’un festival extérieur, les participants doivent surveiller huit flux vidéo dans le but de détecter et rapporter des incidents (p. ex., un enfant disparu). L’interface ne permet toutefois d’afficher que six écrans à la fois. La stratégie de gestion de l’affichage des caméras utilisée est évaluée à l’aide d’un index mathématique basé sur le temps d’affichage des caméras. Cet index révèle que la stratégie prioritaire est utilisée par la majorité des sujets (60,3%). Cependant, le taux de détection des incidents ne diffère pas significativement selon la stratégie employée. Ainsi, il semble que la stratégie paritaire soit aussi valable que la stratégie prioritaire. En outre, le nombre de fausses alarmes est marginalement inférieur chez les surveillants paritaires. Ces résultats suggèrent qu’il n’est pas nécessaire de favoriser l’une des deux stratégies d’affichage à l’étude. Ainsi, le choix de la stratégie d’affichage pourrait revenir au surveillant (en fonction de ses préférences) et ne devrait pas nécessairement être imposé. / Substantial investments are being made in the area of video surveillance in order to increase public and infrastructure safety. In control rooms, the operator must monitor a number of visual scenes that usually exceeds the number of screens available. In this context, two surveillance different approaches to surveillance may be favoured: the "equally distributed" strategy, where equal distribution in the display time of cameras is preferred, and the "prioritized" strategy, where the display duration of some cameras is longer compared to other feeds. However, the impact of these monitoring strategies on operator performances is still unclear. This study seeks to assess the extent to which both strategies are used spontaneously by (non-expert) operators, and then to assess their impact on performance using a realistic video surveillance simulation. Placed in a security monitoring environment at an outdoor festival, participants must monitor eight video streams for the purpose of detecting and reporting incidents (for example, a missing child). However, the interface can only display six screens at a time. The strategy for managing the display of the cameras used is evaluated using a mathematical index based on the display time of the cameras. This index reveals that the "prioritized" strategy is used by the majority of subjects (60.3%). Yet, the detection rate of incidents does not differ significantly according to the strategy used. These results suggest that the equally distributed strategy is equally valuable as the prioritized strategy. In addition, the number of false alarms is marginally inferior for participants who equally distributed video feeds. These findings suggest that it is unnecessary to favour one of the two camera display strategies under study. Thus, either of these strategies could be chosen by operators according to their preferences rather than being imposed. BF 20.5 UL 2017 Vidéosurveillance. Gardiens. Efficience (Psychologie)
6	Système de vidéosurveillance et de monitoring Dahmane, Mohamed January 2004 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Vidéosurveillance Détection de mouvement Segmentation temps-réel Pousuite de cibles Trajectoires spatio-temporelles Réseaux de neurones
7	Employeur, salarié et vie privée / Employer, employee and private life Dirrenberger, Géraldine 21 December 2012 (has links) La frontière entre vie privée et vie professionnelle tend vers la confusion. La notion de vie privée est variable par l'importance que chaque individu lui accorde, elle suit également l'évolution de la société. Au sein de la relation de travail, caractérisée par le lien de subordination, quelle place doit-on lui assigner ? S'il est admis qu'il existe bel et bien une sphère privée résiduelle dans l'entreprise, comment la conjuguer efficacement avec les impératifs de productivité du monde du travail ? Malgré une forte protection de la vie privée du travailleur, l'empiètement de la sphère professionnelle sur la sphère privée est un risque supplémentaire de voir la notion se vider de sa substance. Notre étude s'attache à mettre en exergue les mutations intervenues dans l'entreprise notamment par l'usage des nouvelles technologies et les difficultés qu'elles occasionnent au regard de l'impératif de respect des libertés individuelles du salarié. Dans ce contexte, nous envisagerons des solutions pour faire coexister les deux sphères au regard de l'exigence de proportionnalité qui doit présider à la relation de travail. / The border between private and professional life can be confusing. The notion of private life differs from the importance each individual allows it, it follows as well the evolution of the society. Inside the working relationship, distinguished among the subordination connection, which priority should we assign it ? If there is agreement that in the working place a remaining private sphere truly exists, how can we efficiently unite it with the productivity requirements of the working environment ? Despite a strong protection of the employee's private life, the professional sphere stepping into the private one is an additional risk to see this idea to lose its meaning. The goal of our study is to point out the changes that occurred at work especially with the use of new technologies and the difficulties experienced due to the requirements to respect the employee's personal freedom. In this context we are considering some solutions to have those two spheres working together despite the balance requirement that must oversee the working relationship. Vie privée Vie personnelle Employeur Vidéosurveillance Salarié NTIC Private life Personal life Employer CCTV Employee ICT
8	Indexation et recherche de vidéo pour la vidéosurveillance Le, Thi Lan 03 February 2009 (has links) (PDF) L'objectif de cette thèse est de proposer une approche générale pour l'indexation et la recherche de vidéos pour la vidéosurveillance. En se basant sur l'hypothèse que les vidéos sont prétraitées par un module d'analyse vidéo, l'approche proposée comprend deux phases : la phase d'indexation et celle de recherche. Afin d'utiliser les résultats de différents modules d'analyse vidéo, un modèle de données comprenant deux concepts, objets et événements, est proposé. La phase d'indexation visant à préparer des données déterminées dans ce modèle de données effectue trois tâches. Premièrement, deux nouvelles méthodes de détection des blobs représentatifs de la tâche représentation d'objets déterminent un ensemble de blobs associés à leurs poids pour chaque objet. Deuxièmement, la tâche extraction de descripteurs consiste à analyser des descripteurs d'apparence et aussi temporels sur les objets indexés. Finalement, la tâche indexation calcule les attributs des deux concepts et les stocke dans une base de données. La phase de recherche commence avec une requête de l'utilisateur et comprend quatre tâches. Dans la tâche formulation de requêtes, afin de permettre à l'utilisateur d'exprimer ses requêtes, un nouveau langage est proposé. La requête est traitée par la tâche analyse syntaxique. Une nouvelle méthode dans la tâche mise en correspondance permet de retrouver efficacement les résultats pertinents. Deux méthodes dans la tâche retour de pertinence permettent d'interagir avec l'utilisateur afin d'améliorer les résultats de recherche. Dans le but d'évaluer la performance de l'approche proposée, nous utilisons deux bases de vidéos dont l'une provenant du projet CARETAKER et l'autre provenant du projet CAVIAR. Les vidéos du projet CARETAKER sont analysées en utilisant la plate-forme VSIP de l'équipe PULSAR alors que les vidéos du projet CAVIAR sont manuellement annotées. La méthode de détection des blobs représentatifs améliore la performance d'une méthode dans l'état de l'art. L'utilisation du langage de requêtes montre qu'il permet d'exprimer de nombreuses requêtes à différents niveaux. La méthode de mise en correspondance obtient de meilleurs résultats en comparaison avec deux méthodes de l'état de l'art. Les résultats expérimentaux montrent que l'approche proposée retrouve efficacement les objets d'intérêt et les événements complexes. indexation de vidéos recherche de vidéos langage de requêtes mise en correspondance vidéosurveillance
9	Vidéosurveillance pour appartements intelligents : application à la détection de prise de médicaments / Smart home : application to the detection of medication intake Huynh, Huu Hung 14 December 2010 (has links) L'objectif de cette thèse est de proposer une approche hiérarchique pour la reconnaissance de la prise de médicaments chez les personnes âgées. En effet, l'activité globale de la prise de médicaments se compose de plusieurs activités à différents niveaux de complexité.La reconnaissance est donc faite de bas en haut, de l'activité élémentaire à l'activité simple et ensuite à l'activité complexe. De plus, un modèle simple de calibration, utilisant une caméra stéréo, est proposé pour estimer la profondeur des objets, et ainsi mieux traiter l'occultation des objets. Par conséquence, la reconnaissance de la prise de médicaments est plus précise.Premièrement, la méthode de soustraction du fond est utilisée pour détecter les objets mobiles, dans un environnement intérieur. La segmentation des régions de peau, et des flacons se fait ensuite en utilisant l'information de couleur par seuillage.Deuxièmement, en observant que le déplacement des régions de peau dans deux trames consécutives est petit, nous utilisons la distance minimale de déplacement pour suivre les régions de peau. Les régions des mains sont détectées en exploitant l'intensité de contours.Nous détectons la bouche par la méthode AdaBoost et le suivi de bouche se fait en utilisant le filtre de Kalman et le ratio des couleurs R/G. Le filtre de Kalman est aussi utilisé pour le traitement d'occultation entre les régions d'intérêt main-visage, main-main.Finalement, pour la reconnaissance de la prise de médicaments, une approche hiérarchique est proposée, en commençant par les activités élémentaires. Sur la base du chevauchement entre les régions d'intérêt, nous détectons les activités élémentaires. En exploitant la séquence des activités élémentaires, nous détectons les activités simples, celles-ci sont en suite utilisées pour reconnaître des activités complexes, correspondant à la prise de médicaments. La profondeur des objets occultés est estimée afin de vérifier l'état de contact entre ces objets, et reconnaître plus précisément les activités.L'expérience montre que notre approche est plus robuste et souple que les travaux précédents sur le sujet. Elle permet de reconnaître des scénarios différents de prise de médicaments et peut être appliqué pour reconnaître d'autres activités complexes en général. / The objective of this thesis is to propose a hierarchical approach for recognition of themedication intake for elderly people. By analyzing the complex activity of the medicationintake we show that it consists of several activities, from low of high levels. So recognition ismade from top to bottom, from primary activity to simple activity and then complex activity.In addition, a simple calibration model, using a stereo camera is proposed to estimatethe depth of objects, for better handling of object occlusions. Consequently, the recognitionof the medication intake is more accurate.First of all, a background subtraction method is used to detect moving objects in theindoor environment. The segmentation of skin regions, and medication bottles is made usingcolor information, by thresholding.Secondly, by observing that the displacement of skin regions in two consecutive frames issmall, we use the minimum distance of displacement to track the skin regions. The regionsof hands are detected by exploiting the intensity contours. We detect the mouth by theAdaBoost method and the tracking of mouth is done using the Kalman filter and the ratioof colors R/G. The Kalman filter is also used for handling occlusions of regions of interest,between hand-face, and hand-hand.Finally, for the recognition of the medication intake, a hierarchical approach is proposed,based on primary activities. By detecting the overlap between the regions of interest, weidentify the primary activities. By exploiting the sequence of primary activities, we recognizesimple activities, that are inputs for recognizing complex activities, which correspond tomedication intake. The depth of occluded objects is estimated at the end to check thecontact state between these objects, to recognize more precisely the activities.Experience showed that our approach is more robust and flexible than prior works inthe literature on this subject. It allows to recognize different scenarios of medication intakeand can be applied to recognize other complex activities in general. Videosurveillance Prise de médicaments Reconnaissance d'activité Détection et suivi Vidéosurveillance Medication intake Activities recognition Detection and tracking
10	Utilisation du contexte pour la détection et le suivi d'objets en vidéosurveillance / Using the context for objects detection and tracking in videosurveillance Rogez, Matthieu 09 June 2015 (has links) Les caméras de surveillance sont de plus en plus fréquemment présentes dans notre environnement (villes, supermarchés, aéroports, entrepôts, etc.). Ces caméras sont utilisées, entre autres, afin de pouvoir détecter des comportements suspects (intrusion par exemple) ou de reconnaître une catégorie d'objets ou de personnes (détection de genre, détection de plaques d'immatriculation par exemple). D'autres applications concernent également l'établissement de statistiques de fréquentation ou de passage (comptage d'entrée/sortie de personnes ou de véhicules) ou bien le suivi d'un ou plusieurs objets se déplaçant dans le champ de vision de la caméra (trajectoires d'objets, analyse du comportement des clients dans un magasin). Compte tenu du nombre croissant de caméras et de la difficulté à réaliser ces traitements manuellement, un ensemble de méthodes d'analyse vidéo ont été développées ces dernières années afin de pouvoir automatiser ces tâches. Dans cette thèse, nous nous concentrons essentiellement sur les tâches de détection et de suivi des objets mobiles à partir d'une caméra fixe. Contrairement aux méthodes basées uniquement sur les images acquises par les caméras, notre approche consiste à intégrer un certain nombre d'informations contextuelles à l'observation afin de pouvoir mieux interpréter ces images. Ainsi, nous proposons de construire un modèle géométrique et géolocalisé de la scène et de la caméra. Ce modèle est construit directement à partir des études de prédéploiement des caméras et peut notamment utiliser les données OpenStreetMap afin d'établir les modèles 3d des bâtiments proches de la caméra. Nous avons complété ce modèle en intégrant la possibilité de prédire la position du Soleil tout au long de la journée et ainsi pouvoir calculer les ombres projetées des objets de la scène. Cette prédiction des ombres a été mise à profit afin d'améliorer la segmentation des piétons par modèle de fond en supprimant les ombres du masque de mouvement. Concernant le suivi des objets mobiles, nous utilisons le formalisme des automates finis afin de modéliser efficacement les états et évolutions possibles d'un objet. Ceci nous permet d'adapter le traitement de chaque objet selon son état. Nous gérons les occultations inter-objets à l'aide d'un mécanisme de suivi collectif (suivi en groupe) des objets le temps de l'occultation et de ré-identification de ceux-ci à la fin de l'occultation. Notre algorithme s'adapte à n'importe quel type d'objet se déplaçant au sol (piétons, véhicules, etc.) et s'intègre naturellement au modèle de scène développé. Nous avons également développé un ensemble de "rétro-actions" tirant parti de la connaissance des objets suivis afin d'améliorer les détections obtenues à partir d'un modèle de fond. En particulier, nous avons abordé le cas des objets stationnaires, souvent intégrés à tort dans le fond, et avons revisité la méthode de suppression des ombres du masque de mouvement en tirant parti de la connaissance des objets suivis. L'ensemble des solutions proposées a été implémenté dans le logiciel de l'entreprise Foxstream et est compatible avec la contrainte d'exécution en temps réel nécessaire en vidéosurveillance. / Video-surveillance cameras are increasingly used in our environment. They are indeed present almost everywhere in the cities, supermarkets, airports, warehouses, etc. These cameras are used, among other things, in order to detect suspect behavior (an intrusion for instance) or to recognize a specific category of object or person (gender detection, license plates detection). Other applications also exist to count and/or track people in order to analyze their behavior. Due to the increasing number of cameras and the difficulty to achieve these tasks manually, several video analysis methods have been developed in order to address them automatically. In this thesis, we mainly focus on the detection and tracking of moving objects from a fixed camera. Unlike methods based solely on images captured by cameras, our approach integrates contextual pieces of information in order better interpret these images. Thus we propose to build a geometric and geolocalized model of the scene and the camera. This model is built directly from the pre-deployment studies of the cameras and uses the OpenStreetMap geographical database to build 3d models of buildings near the camera. We added to this model the ability to predict the position of the sun throughout the day and the resulting shadows in the scene. By predicting the shadows, and deleting them from the foreground mask, our method is able to improve the segmentation of pedestrians. Regarding the tracking of multiple mobile objects, we use the formalism of finite state machines to effectively model the states and possible transitions that an object is allowed to take. This allows us to tailor the processing of each object according to its state. We manage the inter-object occlusion using a collective tracking strategy. When taking part in an occlusion, objects are regrouped and tracked collectively. At the end of the occlusion, each object is re-identified and individual tracking resume. Our algorithm adapts to any type of ground-moving object (pedestrians, vehicles, etc.) and seamlessly integrates in the developed scene model. We have also developed several retro-actions taking advantage of the knowledge of tracked objects to improve the detections obtained with the background model. In particular, we tackle the issue of stationary objects often integrated erroneously in the background and we revisited the initial proposal regarding shadow removal. All proposed solutions have been implemented in the Foxstream products and are able to run in real-time. Modèle de fond Suivi multi-objets Ombres Vidéosurveillance OpenStreetMap Background model Multi-object tracking Shadows Videosurveillance OpenStreetMap

Search results