Spelling suggestions: "subject:"colocalisation"" "subject:"delocalisation""
21 |
Localisation d'un véhicule à l'aide d'un SLAM visuel contraint / Location of a vehicle using a constrained visual SLAMLarnaout, Dorra 06 May 2014 (has links)
Pour se localiser en ville, la majorité des solutions commercialisées se base sur les systèmes GPS. Même si ces systèmes offrent une précision suffisante hors agglomération, celle-ci se dégradent considérablement en villes à cause des phénomènes connus sous le nom du canyon urbain (i.e. réflexion du signal GPS sur les façades des bâtiments). Pour pallier ce problème, les solutions basées sur un SLAM visuel (Simultaneous Localization And Mapping) semblent une alternative prometteuse. En plus de l’estimation des six degrés de liberté de la caméra mobile, il fournit une carte 3D de la scène observée. Toutefois, la localisation assurée par le SLAM visuel n’est pas géo-référencée et présente souvent des dérives (e.g. mauvaise estimation du facteur d’échelle, accumulation des erreurs). Pour faire face à ces limitations et afin de proposer une solution facile à déployer, nous avons étudié la possibilité d’intégrer au SLAM des informations supplémentaires qui pourraient contraindre l’ensemble de la reconstruction fournie. Ces dernières doivent alors être peu couteuses et disponibles en milieux urbains denses et péri-urbains. C’est pour cette raison que nous avons choisi d’exploiter les contraintes fournies par un GPS standard et celles apportées par des modèles issus des Systèmes d’Information Géographique, plus précisément : des modèles 3D des bâtiments et des modèles d’élévation de terrain. La principale contribution de ces travaux réside en l’intégration de ces contraintes au sein de l’ajustement de faisceaux (i.e. processus d’optimisation du SLAM). Ceci n’est pas trivial étant donné que combiner des contraintes agissant sur la trajectoire de la caméra et la reconstruction 3D peut entrainer des problèmes de convergences, en particulier lorsque les informations exploitées ont des incertitudes variées, voire même des données biaisées ou aberrantes (e.g. Pour les mesures du GPS). Différentes solutions Larnaout et al. (2012, 2013a,b,c) permettant de combiner plusieurs de ces contraintes simultanément tout en limitant les problèmes de convergence ont été développées. Les solutions proposées ont été validées sur des séquences de synthèse et d’autres réelles de plusieurs kilomètres enregistrées dans des conditions de circulation normale. Les résultats obtenus montrent que la précision atteinte au niveau de l’estimation des six degrés de liberté de la caméra permet d’assurer des nouvelles applications d’aide à la navigation par le biais de la Réalité Augmentée. En plus de leur précision, nos approches ont l’avantage d’être rapides, peu couteuses et faciles à déployer (ne nécessitant pas un matériel sophistiqué). / To ensure a global localization in urban environment, the majority of commercial solutions is based on Global Positioning Systems (GPS). While these systems offer sufficient accuracy in peri-urban or rural areas, their accuracy decreases significantly in cities because of the urban canyon (i.e. reflections of the GPS signal through the facades of buildings). To overcome this problem, vision based solutions such as the visual SLAM (Simultaneous Localization And Mapping) seem to be a promising alternative. In addition to the estimation of the six degrees of freedom of the mobile camera, such approach provides a 3D map of the observed scene. However, the localization provided by the visual SLAM is not geo-referenced and is often subject of drifts (e.g. poor estimate of the scale factor, accumulations errors). To address these limitations and to provide a solution easy to deploy, we studied the possibility of integrating to the SLAM algorithm additional information that could constrain the entire reconstruction. These data must then be inexpensive and available in dense urban and peri-urban areas. For these reasons, we chose to exploit the constraints provided by a standard GPS and those provided by models from Geographic Information Systems, more precisely, the 3D buildings models and the digital elevation models. The main contribution of this work lies in the integration of these constraints in the bundle adjustment (i.e. the optimization process of the SLAM algorithm). This is not trivial since combining constraints acting on the trajectory of the camera and the 3D reconstruction can lead to convergence problems, especially when the information used have various uncertainties and even outliers (e.g. specially GPS measurements). Different solutions Larnaout et al. (2012, 2013a,b,c) to combine these constraints simultaneously while limiting the problems of convergence have been developed. The proposed solutions have been evaluated on synthetic sequences and large scale real sequences recorded in normal traffic conditions. The results show that the accuracy achieved on the six degrees of freedom of the mobile camera is sufficient to ensure new service of aided navigation through Augmented Reality. In addition to the accuracy, our approaches have the advantage of being fast, inexpensive and easy to deploy (not requiring sophisticated equipment).
|
22 |
Filtres de Kalman étendus reposant sur une variable d'erreur non linéaire avec applications à la navigation / Non-linear state error based extended Kalman filters with applications to navigationBarrau, Axel 15 September 2015 (has links)
Cette thèse étudie l'utilisation de variables d'erreurs non linéaires dans la conception de filtres de Kalman étendus (EKF). La théorie des observateurs invariants sur les groupes de Lie sert de point de départ au développement d'un cadre plus général mais aussi plus simple, fournissant des variables d'erreur non linéaires assurant la propriété nouvelle et surprenante de suivre une équation différentielle (partiellement) linéaire. Ce résultat est mis à profit pour prouver, sous des hypothèses naturelles d'observabilité, la stabilité de l'EKF invariant (IEKF) une fois adapapté à la classe de systèmes (non-invariants) introduite. Le gain de performance remarquable par rapport à l'EKF classique est illustré par des applications à des problèmes industriels réels, réalisées en partenariat avec l'entreprise SAGEM.Dans une seconde approche, les variables d'erreurs sont étudiées en tant que processus stochastiques. Pour les observateurs convergeant globalement si les bruits sont ignorés, on montre que les ajouter conduit la variable d'erreur à converger en loi vers une distribution limite indépendante de l'initialisation. Ceci permet de choisir des gains à l'avance en optimisant la densité asymptotique. La dernière approche adoptée consiste à prendre un peu de recul vis-à-vis des groupes de Lie, et à étudier les EKF utilisant des variables d'erreur non linéaires de façon générale. Des propriété globales nouvelles sont obtenues. En particulier, on montre que ces méthodes permettent de résoudre le célèbre problème de fausse observabilité créé par l'EKF s'il est appliqué aux questions de localisation et cartographie simultanées (SLAM). / The present thesis explores the use of non-linear state errors to devise extended Kalman filters (EKFs). First we depart from the theory of invariant observers on Lie groups and propose a more general yet simpler framework allowing to obtain non-linear error variables having the novel unexpected property of being governed by a (partially) linear differential equation. This result is leveraged to ensure local stability of the invariant EKF (IEKF) under standard observability assumptions, when extended to this class of (non-invariant) systems. Real applications to some industrial problems in partnership with the company SAGEM illustrate the remarkable performance gap over the conventional EKF. A second route we investigate is to turn the noise on and consider the invariant errors as stochastic processes. Convergence in law of the error to a fixed probability distribution, independent of the initialization, is obtained if the error with noise turned off is globally convergent, which in turn allows to assess gains in advance that minimize the error's asymptotic dispersion. The last route consists in stepping back a little and exploring general EKFs (beyond the Lie group case) relying on a non-linear state error. Novel mathematical (global) properties are derived. In particular, these methods are shown to remedy the famous problem of false observability created by the EKF if applied to simultaneous localization and mapping (SLAM), which is a novel result.
|
23 |
Développement d'une méthode de géolocalisation à l'intérieur de bâtiments par classification des fingerprints GSM et fusion de données de capteurs embarqués / Practical indoor localization system using GSM fingerprints and embedded sensorsTian, Ye 13 February 2015 (has links)
L’objet de cette thèse est l’étude de la localisation et de la navigation à l’intérieur de bâtiments à l’aide des signaux disponibles dans les systèmes mobiles cellulaires et, en particulier, les signaux GSM.Le système GPS est aujourd’hui couramment utilisé en extérieur pour déterminer la position d’un objet, mais les signaux GPS ne sont pas adaptés à la localisation en intérieurIci, la localisation en intérieur est obtenue à partir de la technique des «empreintes» de puissance des signaux reçus sur les canaux utilisés par les réseaux GSM. Elle est réalisée à l’échelle de la pièce. Une classification est effectuée à partir de machines à vecteurs supports et les descripteurs utilisés sont les puissances de toutes les porteuses GSM. D’autres capteurs physiques disponibles dans les téléphones portables fournissent des informations utiles pour déterminer la position ou le déplacement de l’utilisateur. Celles-ci, ainsi que la cartographie de l’environnement, sont associées aux résultats obtenus à partir des «empreintes» GSM au sein de filtres particulaires afin d’obtenir une localisation plus précise, et sous forme de coordonnées continues.Les résultats obtenus montrent que l’utilisation des seules empreintes GSM permet de déterminer la pièce correcte dans 94% des cas sur une durée courte et que les performances restent stables pendant plusieurs mois, de l’ordre de 80%, si les données d’apprentissage sont enregistrées sur quelques jours. L’association de la cartographie du lieu et des informations issues des autres capteurs aux données de classification permettent d’obtenir les coordonnées de la trajectoire du système mobile avec une bonne précision et une bonne fiabilité. / GPS has long been used for accurate and reliable outdoor localization, but it cannot operate in indoor environments, which suggests developing indoor localization methods that can provide seamless and ubiquitous services for mobile users.In this thesis, indoor localization is realized making use of received signal strength fingerprinting technique based on the existing GSM networks. A room is defined as the minimum location unit, and support vector machine are used as a mean to discriminate the rooms by classifying received signal strengths from very large number of GSM carriers. At the same time, multiple sensors, such as accelerometer and gyroscope, are widely available for modern mobile devices, which provide additional information that helps location determination. The hybrid approach that combines the GSM fingerprinting results with mobile sensor and building layout information using a particle filter provides a more accurate and fine-grained localization result.The results of experiments under realistic conditions demonstrate that correct room number can be obtained 94% of the time provided the derived model is used before significant received signal strength drift sets in. Furthermore, if the training data is sampled over a few days, the performance can remain stable exceeding 80% over a period of months, and can be further improved with various post-processing techniques. Moreover, including the mobile sensors allows the system to localize the mobile trajectory coordinates with high accuracy and reliability.
|
24 |
Practically preserving and evaluating location privacy / Préservation et évaluation pratiques de la confidentialité des lieuxPrimault, Vincent 01 March 2018 (has links)
Depuis quelques dizaines d’années, l’utilisation de téléphones contenant un capteur GPS a fortement augmenté. Cependant, tous ces usages ne sont pas sans menace pour la vie privée des utilisateurs. En effet, les données de mobilité qu’ils envoient à ces services peuvent être utilisées pour inférer des informations sensibles telles que leur domicile ou leur lieu de travail. C’est à ce moment qu’entrent en action les mécanismes de protection, visant à redonner aux utilisateurs le contrôle sur leur vie privée. Nous commençons par répertorier les mécanismes de protection existants et les métriques utilisées pour les évaluer. Cette première analyse met en avant une information particulièrement sensible : les points d’intérêt. Ces derniers représentent tous les lieux où les utilisateurs passent la majeure partie de leur temps. Cela nous conduit à proposer un nouveau mécanisme de protection, PROMESSE, dont le but principal est de cacher ces points d’intérêt. Les mécanismes de protection sont en général configurés par des paramètres, qui ont un grand impact sur leur efficacité. Nous proposons ALP, une solution destinée à aider les utilisateurs à configurer leurs mécanismes de protection à partir d’objectifs qu’ils ont spécifié. Enfin, nous présentons Accio, un logiciel regroupant la majeure partie du travail de cette thèse. Il permet de lancer facilement des expériences destinées à étudier des mécanismes de protection, tout en renforçant leur reproductibilité. / In the past decades, the usage of GPS-enabled smartphones has dramatically risen. However, all these usages do not come without privacy threats. Indeed, location data that users are sending to these services can be used to infer sensitive knowledge about them, such as where they live or where they work. This is were protection mechanisms come into play, whose goal is to put users back in control of their privacy. We start by surveying existing protection mechanisms and metrics used to evaluate them. This first analysis highlights a particularly sensitive information, namely the points of interest. These are all the places where users use to spend most of their time. This leads us towards building a new protection mechanism, PROMESSE, whose main goal is to hide these points of interest. Protection mechanisms tend to be configured by parameters, which highly impact their effectiveness in terms of privacy and utility. We propose ALP, a solution to help users to configure their protection mechanisms from a set of objectives they specified. Finally, we introduce Accio, which is a software encompassing most of our work. Its goal is to allow to easily launch location privacy experiments and enforce their reproducibility.
|
25 |
Integration of heterogeneous data from multiple location-based services providers : A use case on tourist points of interest / Intégration des données hétérogènes issues de plusieurs fournisseurs de services géo-localisés : Un cas d'utilisation sur les points d'intérêt touristiqueBerjawi, Bilal 01 September 2017 (has links)
Les fournisseurs de services géo-localisés (LBS) offrent des données textuelles et spatiales complémentaires, parfois incohérentes et imprécises, représentant les différents points d’intérêt (POI) sur un territoire donné. Ainsi, une même requête lancée auprès de divers fournisseurs de services touristiques peut donner des résultats différents et parfois incohérents, pour les attributs terminologiques et/ou les attributs spatiaux. De plus, chaque fournisseur utilise sa propre convention graphique pour représenter les POIs. L’intégration de ces données spatiales hétérogènes dans un contexte dynamique, large échelle, utilisant des sources incomplètes et de qualités variables est actuellement un verrou technologique. Dans ce travail de thèse, nous cherchons une solution à cette intégration aussi bien au niveau des données que de leur représentation. / Location Based Services (LBS) had been involved to deliver relevant geospatial information based on a geographic position or address. The amount of geospatial data is constantly increasing, making it a valuable source of information for enriching LBS applications. However, these geospatial data are highly inconsistent and contradictory from one source to another. We assume that integrating geospatial data from several sources may improve the quality of information offered to users. In this thesis, we specifically focus on data representing Points of Interest (POIs) that tourists can get through LBS. Retrieving, matching and merging such geospatial entities lead to several challenges. We mainly focus on three main challenges including (i) detecting and merging corresponding entities across multiple sources and (ii) considering the uncertainty of integrated entities and their representation in LBS applications.
|
26 |
Vers une sémantique floue : application à la géolocalisationAbchir, M.-A. 25 November 2013 (has links) (PDF)
Dans le domaine du "calcul à l'aide de mots" (CW : Computing with words), les approches linguistiques floues ont démontré leur pertinence dans de nombreux problèmes de prise de décision. En effet, elles permettent de modéliser le raisonnement humain en remplaçant les mots, les évaluations, les préférences, les choix, les souhaits, etc. par des variables ad hoc, telles que les sous-ensembles flous ou des variables plus complexes. Dans cette thèse, nous partons d'un problème concret en géolocalisation : la configuration des boîtiers permettant le suivi des mobiles à surveiller et la mise en place des alertes liées au suivi. Il s'agit de mettre en place un système offrant la possibilité de passer des objectifs métiers de l'utilisateur final exprimés sous la forme de paramètres linguistiques (grâce à un dialogue en langage naturel) à une combinaison appropriée des paramètres techniques de l'application. La recherche a visé à montrer comment on peut améliorer une interface utilisateur existante pour passer d'un traitement quantitatif à un traitement qualitatif des occurrences d'événements et des contraintes de géolocalisation. Nous avons ainsi défini les extensions théoriques qui semblaient nécessaires dans le CW : un modèle, fondé sur les 2-tuples sémantiques que nous introduisons, permet de représenter, avec une grande précision et une grande justesse, des ensembles de termes linguistiques même lorsque ces derniers sont positionnés de façon fortement déséquilibrée sur leur axe. Ces 2-tuples sémantiques ont été mis en oeuvre pour interpréter sémantiquement les termes linguistiques issus du dialogue, en leur rattachant une sémantique floue contextuelle.
|
27 |
Attaques d'inférence sur des bases de données géolocaliséesNunez Del Prado Cortez, Miguel 12 December 2013 (has links) (PDF)
Au cours des dernières années, nous avons observé le développement de dispositifs connectés et nomades tels que les téléphones mobiles, tablettes ou même les ordinateurs portables permettant aux gens d'utiliser dans leur quotidien des services géolocalisés qui sont personnalisés d'après leur position. Néanmoins, les services géolocalisés présentent des risques en terme de vie privée qui ne sont pas forcément perçus par les utilisateurs. Dans cette thèse, nous nous intéressons à comprendre les risques en terme de vie privée liés à la dissémination et collection de données de localisation. Dans ce but, les attaques par inférence que nous avons développé sont l'extraction des points d'intérêts, la prédiction de la prochaine localisation ainsi que la désanonymisation de traces de mobilité, grâce à un modèle de mobilité que nous avons appelé les chaînes de Markov de mobilité. Ensuite, nous avons établi un classement des attaques d'inférence dans le contexte de la géolocalisation se basant sur les objectifs de l'adversaire. De plus, nous avons évalué l'impact de certaines mesures d'assainissement à prémunir l'efficacité de certaines attaques par inférence. En fin nous avons élaboré une plateforme appelé GEoPrivacy Enhanced TOolkit (GEPETO) qui permet de tester les attaques par inférences développées.
|
28 |
Localisation d'un véhicule à l'aide d'un SLAM visuel contraintLarnaout, Dorra 06 May 2014 (has links) (PDF)
Pour se localiser en ville, la majorité des solutions commercialisées se base sur les systèmes GPS. Même si ces systèmes offrent une précision suffisante hors agglomération, celle-ci se dégradent considérablement en villes à cause des phénomènes connus sous le nom du canyon urbain (i.e. réflexion du signal GPS sur les façades des bâtiments). Pour pallier ce problème, les solutions basées sur un SLAM visuel (Simultaneous Localization And Mapping) semblent une alternative prometteuse. En plus de l'estimation des six degrés de liberté de la caméra mobile, il fournit une carte 3D de la scène observée. Toutefois, la localisation assurée par le SLAM visuel n'est pas géo-référencée et présente souvent des dérives (e.g. mauvaise estimation du facteur d'échelle, accumulation des erreurs). Pour faire face à ces limitations et afin de proposer une solution facile à déployer, nous avons étudié la possibilité d'intégrer au SLAM des informations supplémentaires qui pourraient contraindre l'ensemble de la reconstruction fournie. Ces dernières doivent alors être peu couteuses et disponibles en milieux urbains denses et péri-urbains. C'est pour cette raison que nous avons choisi d'exploiter les contraintes fournies par un GPS standard et celles apportées par des modèles issus des Systèmes d'Information Géographique, plus précisément : des modèles 3D des bâtiments et des modèles d'élévation de terrain. La principale contribution de ces travaux réside en l'intégration de ces contraintes au sein de l'ajustement de faisceaux (i.e. processus d'optimisation du SLAM). Ceci n'est pas trivial étant donné que combiner des contraintes agissant sur la trajectoire de la caméra et la reconstruction 3D peut entrainer des problèmes de convergences, en particulier lorsque les informations exploitées ont des incertitudes variées, voire même des données biaisées ou aberrantes (e.g. Pour les mesures du GPS). Différentes solutions Larnaout et al. (2012, 2013a,b,c) permettant de combiner plusieurs de ces contraintes simultanément tout en limitant les problèmes de convergence ont été développées. Les solutions proposées ont été validées sur des séquences de synthèse et d'autres réelles de plusieurs kilomètres enregistrées dans des conditions de circulation normale. Les résultats obtenus montrent que la précision atteinte au niveau de l'estimation des six degrés de liberté de la caméra permet d'assurer des nouvelles applications d'aide à la navigation par le biais de la Réalité Augmentée. En plus de leur précision, nos approches ont l'avantage d'être rapides, peu couteuses et faciles à déployer (ne nécessitant pas un matériel sophistiqué).
|
29 |
Impact du déversement pétrolier "Deepwater Horizon" sur le statut endocrinien d'un oiseau migrateur : cas du fou de bassan (Morus bassanus) de l'Île Bonaventure hivernant dans le Golfe du MexiqueFranci, Cynthia Daniela 07 1900 (has links) (PDF)
L'explosion de la plateforme de forage « Deepwater Horizon » dans le Golfe du Mexique en avril 2010 a provoqué le déversement d'un grand volume de pétrole brut dans les eaux de la région ce qui a conduit à des répercussions importantes sur la faune locale. Les impacts d'une telle catastrophe à long terme sur les oiseaux de mer ont peu été étudiés par la communauté scientifique. Pourtant, les effets délétères induits par l'action des hydrocarbures aromatiques polycycliques (HAPs) contenus dans le pétrole brut représentent la principale source d'inquiétude d'une exposition chronique sous-létale. L'île Bonaventure, situé dans le parc national de l'île-Bonaventure-et-du-Rocher-Percé, accueil l'une des plus grandes colonies de fous de bassan (Morus bassanus) au monde. Environ un quart de cette colonie migre dans le Golfe du Mexique une fois la saison de reproduction terminée, courant ainsi le risque d'être exposé au pétrole déversé soit directement (ingestion et absorption dermique) ou indirectement (consommation de proies contaminées). Une contamination au pétrole peut engendrer une détérioration de la condition physiologique des oiseaux exposés et altérer, entre autres, le fonctionnement du système endocrinien. Ainsi, il est justifié de craindre une portée sur la santé de ces oiseaux et donc, ultimement sur la dynamique de population de cette colonie (taux de survie, succès de reproduction, etc.). Cette étude avait pour but d'évaluer les effets potentiels de l'exposition aux HAPs, provenant du pétrole déversé dans le Golfe du Mexique, sur la santé de 34 fous de bassan de l'île Bonaventure lors de la période d'incubation à l'été 2011. Le premier objectif spécifique était de déterminer le lieu d'hivernage des fous de bassan à l'étude, soit le Golfe du Mexique ou la côte Atlantique, à l'aide de consignateurs d'intensité lumineuse afin de cibler les oiseaux potentiellement exposés au pétrole. Le second objectif consistait à déterminer le profil de contamination (HAPs) des oiseaux ainsi que de doser les concentrations hormonales (prolactine et corticostérone) circulant chez ces oiseaux. Finalement, il était question de mettre en relation le lieu d'hivernage, le profil de contamination et les concentrations hormonales des oiseaux en fonction du temps dans l'incubation (tôt ou tard). Il était attendu que les oiseaux ayant fréquenté le Golfe du Mexique aient des concentrations d'HAPs supérieures aux oiseaux de la côte Atlantique et que leurs concentrations en corticostérone et prolactine en soient affectés ce qui diminuerait leur succès de reproduction. Les concentrations sanguines en HAPs se sont révélées être sous les limites de détection de l'instrument analytique (HPLC). De plus, les concentrations hormonales ne semblaient pas différer selon le lieu de migration des oiseaux, ni le temps dans l'incubation. Leur succès de reproduction ne semblait pas affecté à l'été 2011. Toutefois, l'absence d'effets visibles au niveau de la reproduction de ces oiseaux n'implique pas nécessairement une absence d'impact physiologique. Finalement, cette étude a permis de démontrer l'utilité de la géolocation dans un contexte d'étude d'impact lors de déversement pétrolier, ce qui n'avait encore jamais été fait.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : prolactine, corticostérone, HAPs, Golfe du Mexique, Sulidae, oiseaux de mer
|
30 |
Modélisation spatio-temporelle pour la détection d’événements de sécurité publique à partir d’un flux TwitterBoileau, Donald January 2017 (has links)
Twitter est un réseau social très répandu en Amérique du Nord, offrant aux autorités policières une opportunité pour détecter les événements d’intérêt public. Les messages Twitter liés à un événement contiennent souvent les noms de rue où se déroule l’événement, ce qui permet la géolocalisation en temps réel.
Plusieurs logiciels commerciaux sont offerts pour effectuer la vigie des réseaux sociaux. L’efficacité de ces outils pour les autorités policières pourrait être grandement améliorée avec un accès à un plus grand échantillon de messages Twitter, avec un tri préalable pour dégager les événements pertinents en moins de temps et avec une mesure de la fiabilité des événements détectés.
Ce mémoire vise à proposer une démarche afin de détecter, à partir du flux de messages Twitter, les événements de sécurité publique d’un territoire, automatiquement et avec un niveau de fiabilité acceptable. Pour atteindre cet objectif, un modèle informatisé a été conçu, basé sur les quatre composantes suivantes: a) la cueillette de tweets à partir de mots clés avec un filtrage géographique, b) l’analyse linguistique et l’utilisation d’un répertoire de rues pour déceler les tweets localisables et pour trouver leurs coordonnées à partir des noms de rue et de leur intersection, c) une méthode spatio-temporelle pour former des grappes de tweets, et d) la détection des événements en identifiant les grappes contenant au moins deux (2) tweets communs touchant le même sujet.
Ce travail de recherche diffère des articles scientifiques recensés car il combine l’analyse textuelle, la recherche et le géocodage de toponymes à partir d’un répertoire de noms de rue, la formation de grappes avec la géomatique et l’identification de grappes contenant des tweets communs pour détecter localement des événements de sécurité publique.
L’application du modèle aux 90 347 tweets cueillis dans la région de Toronto-Niagara au Canada a résulté en l’identification et la géolocalisation de 1 614 tweets ainsi qu’en la formation de 172 grappes dont 79 grappes d’événements contenant au moins deux (2) tweets touchant le même sujet, soit un taux de fiabilité de 45,9 %. / Abstract : Twitter is a social media that is very popular in North America, giving law enforcement
agencies an opportunity to detect events of public interest. Twitter messages (tweets) tied
to an event often contain street names, indicating where this event takes place, which can
be used to infer the event's geographical coordinates in real time.
Many commercial software tools are available to monitor social media. The performance
of these tools could be greatly improved with a larger sample of tweets, a sorting
mechanism to identify pertinent events more quickly and to measure the reliability of the
detected events.
The goal of this master‟s thesis is to detect, from a public Twitter stream, events relative
to public safety of a territory, automatically and with an acceptable level of reliability. To
achieve this objective, a computer model based on four components has been developed:
a) capture of public tweets based on keywords with the application of a geographic filter,
b) natural language processing of the text of these tweets, use of a street gazetteer to
identify tweets that can be localized and geocoding of tweets based on street names and
intersections, c) a spatio-temporal method to form tweet clusters and, d) event detection
by isolating clusters containing at least two tweets treating the same subject.
This research project differs from existing scientific research as it combines natural
language processing, search and geocoding of toponyms based on a street gazetteer, the
creation of clusters using geomatics and identification of event clusters based on common
tweets to detect public safety events in a Twitter public stream.
The application of the model to the 90,347 tweets collected for the Toronto-Niagara
region in Ontario, Canada has resulted in the identification and geocoding of 1,614 tweets
and the creation of 172 clusters from which 79 event clusters contain at least two tweets
having the same subject showing a reliability rate of 45.9 %.
|
Page generated in 0.0878 seconds