1 |
Multiplexage par division modale pour les applications à courte distanceMirzaei Nejad, Reza 07 May 2018 (has links)
Le multiplexage par division de mode (MDM) a reçu une attention considérable de la part des chercheurs au cours des dernières années. La principale motivation derrière l'utilisation de différents modes de fibre optique est d'augmenter la capacité des réseaux de transport. Les expériences initiales ont montré une grande complexité dans le traitement de signal (DSP) du récepteur. Dans cette thèse, nous étudions la viabilité et les défis de la transmission de données sur des fibres à quelques modes (FMF) pour des systèmes MDM à complexité de DSP réduite. Nos études comprennent à la fois une transmission de données cohérente et non cohérente. Dans notre première contribution, nous démontrons, pour la première fois, la transmission de données sur 4 canaux dans une nouvelle fibre OAM sans démultiplexage de polarisation optique. Nous utilisons une complexité de DSP réduite: deux jeux d'égaliseurs MIMO (multiple-input multiple-output) 2 × 2 au lieu d'un bloc égaliseur MIMO 4 × 4 complet. Nous proposons un nouveau démultiplexeur de mode permettant de recevoir simultanément deux polarisations d'un mode et de réaliser électriquement un démultiplexage de polarisation dans le récepteur DSP. Nous étudions également la pénalité OSNR due aux imperfections dans le démultiplexeur de mode et nous examinons la vitesse de transmission maximum accessible pour notre système. Dans notre deuxième contribution, nous étudions les dégradations modales dans les systèmes OAM-MDM, en nous concentrant sur leur effet sur la performance et la complexité du récepteur. Dans notre étude expérimentale, nous discutons pour la première fois de l'impact de deux modes non porteurs de données sur les canaux de données véhiculés par les modes OAM. Deux types différents de fibres OAM sont étudiés. Nous caractérisons notre liaison MDM en utilisant les techniques de mesure du temps de vol et de réponse impulsionnelle. Nous discutons des conclusions des résultats de caractérisation en étudiant l'impact des interactions modales sur la complexité de l'égaliseur du récepteur pour différents scénarios de transmission de données. Dans le troisième chapitre, nous étudions un nouveau FMF à maintien de polarisation et conduisons deux séries d'expériences de transmission de données cohérentes et de radio sur fibre (RoF). Nous démontrons pour la première fois, la transmission de données sans MIMO sur six et quatre canaux dans les systèmes cohérents et RoF, respectivement. Nous démontrons également, pour la première fois, la transmission de données RoF sur deux polarisations d'un mode dans une FMF. Nous discutons de la dégradation des performances due à la diaphonie dans de tels systèmes. Nous étudions également l'impact de la courbure sur cette fibre dans un contexte de RoF. La propriété de maintien de polarisation de cette fibre sous courbure est étudiée à la fois par des expériences de caractérisation et de transmission de données. / Mode division multiplexing (MDM) has received extensive attention by researchers in the last few years. The main motivation behind using different modes of optical fiber is to increase the capacity of transport networks. Initial experiments showed high complexity in DSP of the receiver. In this thesis, we investigate the viability and challenges for data transmission over specially designed few mode fibers (FMF) for MDM systems with reduced DSP. Our studies include both coherent and non-coherent data transmission. In our first contribution, we demonstrate, for the first time, data transmission over 4 channels in a novel OAM fiber without optical polarization demultiplexing. We use reduced DSP complexity: two sets of 2×2 multiple-input multiple-output (MIMO) equalizers instead of a full 4×4 MIMO equalizer block. We propose a novel mode demultiplexer enabling us to receive two polarizations of a mode simultaneously and conducting polarization demultiplexing electrically in receiver DSP. We also investigate the OSNR penalty due to imperfections in the mode demultiplexer and we examine the maximum reachable baud rate for our system. In our second contribution, we study the modal impairments in OAM-MDM systems, focusing on their effect on receiver performance and complexity. In our experimental study, for the first time, we discuss the impact of two non-data carrying modes on data channels carried by OAM modes. Two different types of OAM fibers are studied. We characterize our MDM link using time-of-flight and impulse response measurement techniques. We discuss conclusions from characterization results with studies of the impact of modal interactions on receiver equalizer complexity for different data transmission scenarios . In the third contribution, we study a novel polarization-maintaining FMF and conduct two sets of coherent data transmission and non-coherent radio over fiber (RoF) experiments. We demonstrate for the first time, MIMO –Free data transmission over six and four channels in coherent and RoF systems, respectively. We also demonstrate, for the first time, RoF data transmission over two polarizations of a mode in a FMF. We discuss the performance degradation due to crosstalk in such systems. We also study the impact of bending on this fiber in RoF context. The polarization maintaining property of this fiber under bending is studied both via characterization and data transmission experiments.
|
2 |
Learning geometric and lighting priors from natural imagesHold-Geoffroy, Yannick 20 September 2018 (has links)
Comprendre les images est d’une importance cruciale pour une pléthore de tâches, de la composition numérique au ré-éclairage d’une image, en passant par la reconstruction 3D d’objets. Ces tâches permettent aux artistes visuels de réaliser des chef-d’oeuvres ou d’aider des opérateurs à prendre des décisions de façon sécuritaire en fonction de stimulis visuels. Pour beaucoup de ces tâches, les modèles physiques et géométriques que la communauté scientifique a développés donnent lieu à des problèmes mal posés possédant plusieurs solutions, dont généralement une seule est raisonnable. Pour résoudre ces indéterminations, le raisonnement sur le contexte visuel et sémantique d’une scène est habituellement relayé à un artiste ou un expert qui emploie son expérience pour réaliser son travail. Ceci est dû au fait qu’il est généralement nécessaire de raisonner sur la scène de façon globale afin d’obtenir des résultats plausibles et appréciables. Serait-il possible de modéliser l’expérience à partir de données visuelles et d’automatiser en partie ou en totalité ces tâches ? Le sujet de cette thèse est celui-ci : la modélisation d’a priori par apprentissage automatique profond pour permettre la résolution de problèmes typiquement mal posés. Plus spécifiquement, nous couvrirons trois axes de recherche, soient : 1) la reconstruction de surface par photométrie, 2) l’estimation d’illumination extérieure à partir d’une seule image et 3) l’estimation de calibration de caméra à partir d’une seule image avec un contenu générique. Ces trois sujets seront abordés avec une perspective axée sur les données. Chacun de ces axes comporte des analyses de performance approfondies et, malgré la réputation d’opacité des algorithmes d’apprentissage machine profonds, nous proposons des études sur les indices visuels captés par nos méthodes. / Understanding images is needed for a plethora of tasks, from compositing to image relighting, including 3D object reconstruction. These tasks allow artists to realize masterpieces or help operators to safely make decisions based on visual stimuli. For many of these tasks, the physical and geometric models that the scientific community has developed give rise to ill-posed problems with several solutions, only one of which is generally reasonable. To resolve these indeterminations, the reasoning about the visual and semantic context of a scene is usually relayed to an artist or an expert who uses his experience to carry out his work. This is because humans are able to reason globally on the scene in order to obtain plausible and appreciable results. Would it be possible to model this experience from visual data and partly or totally automate tasks? This is the topic of this thesis: modeling priors using deep machine learning to solve typically ill-posed problems. More specifically, we will cover three research axes: 1) surface reconstruction using photometric cues, 2) outdoor illumination estimation from a single image and 3) camera calibration estimation from a single image with generic content. These three topics will be addressed from a data-driven perspective. Each of these axes includes in-depth performance analyses and, despite the reputation of opacity of deep machine learning algorithms, we offer studies on the visual cues captured by our methods.
|
3 |
Analysis of camera pose estimation using 2D scene features for augmented reality applicationsMeshkat Alsadat, Shabnam 03 July 2018 (has links)
La réalité augmentée (RA) a récemment eu un impact énorme sur les ingénieurs civils et les travailleurs de l'industrie de la construction, ainsi que sur leur interaction avec les plans ar-chitecturaux. La RA introduit une superposition du modèle 3D d'un bâtiment sur une image 2D non seulement comme une image globale, mais aussi potentiellement comme une repré-sentation complexe de ce qui va être construit et qui peut être visualisée par l'utilisateur. Pour insérer un modèle 3D, la caméra doit être localisée par rapport à son environnement. La lo-calisation de la caméra consiste à trouver les paramètres extérieurs de la caméra (i.e. sa po-sition et son orientation) par rapport à la scène observée et ses caractéristiques. Dans ce mémoire, des méthodes d'estimation de la pose de la caméra (position et orientation) par rapport à la scène utilisant des correspondances cercle-ellipse et lignes droites-lignes droites sont explorées. Les cercles et les lignes sont deux des caractéristiques géométriques qui sont principalement présentes dans les structures et les bâtiments. En fonction de la rela-tion entre les caractéristiques 3D et leurs images 2D correspondantes détectées dans l'image, la position et l'orientation de la caméra sont estimées. / Augmented reality (AR) had recently made a huge impact on field engineers and workers in construction industry, as well as the way they interact with architectural plans. AR brings in a superimposition of the 3D model of a building onto the 2D image not only as the big picture, but also as an intricate representation of what is going to be built. In order to insert a 3D model, the camera has to be localized regarding its surroundings. Camera localization con-sists of finding the exterior parameters (i.e. its position and orientation) of the camera with respect to the viewed scene and its characteristics. In this thesis, camera pose estimation methods using circle-ellipse and straight line corre-spondences has been investigated. Circles and lines are two of the geometrical features that are mostly present in structures and buildings. Based on the relationship between the 3D features and their corresponding 2D data detected in the image, the position and orientation of the camera is estimated.
|
4 |
Adaptation d'un algorithme de deuxième ordre pour l'analyse haute-résolution de courbes électrochimiquesMathault, Jessy 03 July 2018 (has links)
Ce mémoire présente une nouvelle méthode d'analyse des courbes de voltampérométrie cyclique. Cette méthode utilise deux algorithmes distincts afin de permettre la caractérisation automatique et précise des pics gaussiens d'oxydoréduction qui sont liés à la concentration des molécules en solution. En premier lieu, des améliorations significatives sont apportées à un algorithme de suppression de la courbe de fond qui fonctionne par approximation polynomiale itérative. Avec les améliorations proposées, l'algorithme isole les pics d'oxydoréduction à partir des mesures de voltampérométrie cyclique automatiquement. La variation de l'amplitude des pics en fonction de la concentration est alors mieux conservée et les erreurs d'estimation sont diminuées par rapport à l'algorithme initial. Ensuite, le développement d'un algorithme qui permet de caractériser des pics gaussiens basé sur l'algorithme de deuxième ordre MUSIC est présenté. Cet algorithme est adapté de manière à caractériser avec une haute précision le nombre, la position, la largeur et l'amplitude des pics d'oxydoréduction. Finalement, les performances de cet algorithme sont comparées à celles d'autres algorithmes similaires à l'aide de courbes simulées et expérimentales. L'algorithme proposé permet une meilleure caractérisation des pics sans chevauchement ainsi que des pics déformés. Il permet aussi de diminuer la fréquence des fausses détections et d'obtenir une haute précision de la mesure de position, et ce même lorsque les signaux sont bruités. / This master's thesis describes a new method for analyzing cyclic voltammetry curves for an efficient peak detection and automatic baseline substraction. This method uses two distinct algorithms for a precise characterization of Gaussian redox peaks which are correlated with molecules' concentration in a solution. First, significant improvements are made to an existing algorithm that uses iterative polynomial approximations to suppress the baseline automatically from the voltammetric curves. With these enhancements, the algorithm extracts redox peaks from cyclic voltammetry measurements automatically and allows a better representation of the variation of peak's amplitude according to concentration. In addition, the approximation errors are reduced compared to the initial algorithm. Then, the development of an algorithm for characterizing Gaussian peaks based on the MUSIC second-order algorithm is presented. This algorithm is adapted to characterize the number, position, width and amplitude of redox peaks with high accuracy. Finally, the performances of this algorithm are compared with those of other similar algorithms using simulated and experimental curves. The suggested algorithm leads to a better characterization of non-overlapping peaks as well as distorted peaks. It also reduces the frequency of false detections and allows the precise measurement of peaks' positions in noisy signals.
|
5 |
Depth texture synthesis for high resolution seamless reconstruction of large scenesLabrie-Larrivée, Félix 09 July 2018 (has links)
La numérisation 3D de scène à grande échelle est un problème complexe sans solution à la fois précise, rapide et abordable. Les scènes à grande échelle comme les façades d'édices comportent cependant des éléments répétitifs (fenêtres, briques, panneaux de bois) qui peuvent être utilisés pour améliorer le processus de numérisation. Notre approche, Depth Texture Synthesis, utilise un scan haute résolution d'un de ces éléments, effectué avec un scanneur RGBD, et transmet cette résolution élevée aux endroits où l'élément est répété ailleurs dans la scène. Cette transmission s'effectue suivant l'information fournie par une reconstruction SfM. Pour effectuer une procédure de Depth Texture Synthesis, la façade de l'édice est simplifiée en une géométrie planaire qui nous sert de canevas. Sur ce canevas nous projetons l'information RGB ainsi que l'information de profondeur du modèle échantillon haute résolution et du modèle SfM basse résolution. Ensuite, un algorithme puissant de synthèse de texture 2D est employé pour transmettre l'information de profondeur haute résolution suivant les patrons de profondeur basse résolution et d'information RGB. La nouvelle carte de profondeur haute résolution peut alors être reconvertie en modèle 3D pour un résultat beaucoup plus réaliste et visuellement détaillé que la reconstruction SfM. Il est aussi intéressant de noter que notre approche est beaucoup moins fastidieuse qu'un scan complet de la scène utilisant des scanneurs RGBD. Les outils utilisés (Kinect v2 et appareil photo) sont aussi très abordables en comparaison avec le Lidar. / Large scenes such as building facades are challenging environments for 3D reconstruction. These scenes often include repeating elements (windows, bricks, wood paneling) that can be exploited for the task of 3D reconstruction. Our approach, Depth Texture Synthesis, is based on that idea and aims to improve the quality of 3D model representation of large scenes. By scanning a sample of a repeating structure using a RGBD sensor, Depth Texture Synthesis can propagate the high resolution of that sample to similar parts of the scene. It does so following RGB and low resolution depth information of a SfM reconstruction. To handle this information the building facade is simplified into a planar primitive and serves as our canvas. The high resolution depth of the Kinect sample and low resolution depth of the SfM model as well as the RGB information are projected onto the canvas. Then, powerful image based texture synthesis algorithms are used to propagate the high resolution depth following cues in RGB and low resolution depth. The resulting synthesized high resolution depth is converted back into a 3D model that greatly improves on the SfM model with more detailed, more realistic looking geometry. Our approach is also much less labor intensive than RGBD sensors in large scenes and it is much more affordable than Lidar.
|
6 |
Polarization management : an efficient polarization rotator splitter on silicon-on-insulator platformSherafati, Bahareh 03 August 2018 (has links)
Ce mémoire vise à étudier la gestion de la polarisation et est axé sur la conception, la simulation et la fabrication d'un rotateur séparateur de polarisation (PSR) sur des plates-formes en silicium en utilisant une structure combinant un cône adiabatique à deux niveaux et un coupleur adiabatique. Après une introduction sur les systèmes de communication optique, spécifiquement sur les systèmes photoniques intégrés, nous introduisons le silicium sur isolateur (SOI) comme plateforme la plus attrayante pour notre circuit photonique intégré. Bien que la propriété intrinsèque de contraste élevé de SOI entraîne la petite taille de la puce, cette propriété entraîne également une forte dépendance de polarisation pour les dispositifs silicium photoniques (SiP). Pour résoudre le problème et supprimer cette dépendance, des circuits de diversité de polarisation ont été proposés et il est important de traiter la gestion de la polarisation sur la puce. Dans ce mémoire, le principe général de fonctionnement de la gestion de la polarisation est étudié en profondeur. Comme la rotation de polarisation est la fonction la plus importante de la gestion de la polarisation, nous nous concentrons sur les principes de base de la rotation de polarisation dans un dispositif à section unique. Nous discutons également de différents types de rotateurs de polarisation et donnons une introduction à l'évolution historique des rotateurs de polarisation. Enfin, les séparateurs de polarisation sont présentés comme le deuxième élément important dans la gestion de la polarisation, et différents types de séparateurs de polarisation sont présentés. Pour gérer efficacement la polarisation, il est essentiel de développer un PSR haute performance. Par conséquent, nous introduisons une structure efficace qui est basée sur la conversion de mode TM0-TE1 dans une conicité (taper) à deux niveaux sur SOI. Nous expliquons et motivons ce choix. Ensuite, nous décrivons la modélisation avec le logiciel Lumerical Finite Difference Time Domain (FDTD) ; les résultats de la simulation fournissent l'évolution des profils d'intensité des modes le long du dispositif. Par la suite, nous présentons les détails de la disposition sur la carte (layout) pour la fabrication et la caractérisation éventuelle des conceptions utilisant des coupleurs de bordure (edge couplers), ainsi que des conceptions utilisant des coupleurs à réseau (grating couplers). Pour évaluer la performance du PSR conçu pour deux applications différentes, nous proposons un modèle mathématique et iv les matrices de transfert. Enfin, la performance du PSR proposé est analysée dans un système de communication optique. / This thesis aims to study polarization management, and focuses on design, simulation and fabrication layout of a polarization splitter rotator (PSR) on silicon platforms by utilizing a structure combining an adiabatic bi-level taper and an adiabatic coupler. Following an introduction about optical communication systems and specifically integrated photonic systems, we introduce silicon-on-isolator (SOI) as the most attractive platform for our integrated photonic circuit. Although the intrinsic high-index contrast property of SOI leads to a very small footprint, this property also results in high polarization dependence for silicon photonic (SiP) devices. To solve the problem and remove this dependency, polarization diversity circuits have been proposed and it is important to deal with on-chip polarization management. In this thesis, the general operating principle of polarization management is thoroughly studied. As polarization rotation is the most important function of polarization management, we concentrate on the basic principles of polarization rotation in a single section device. We also discuss different types of polarization rotators and give an introduction to the historic evolution of polarization rotators. Finally, polarization beam splitters are introduced as the second important element in polarization management, and different types of polarization splitters are presented. To efficiently manage polarization, it is critical to develop a high performance PSR. Therefore, we introduce an efficient structure that is based on TM0-TE1 mode conversion in a bi-level taper on SOI. We explain and motivate that choice. Afterwards, we describe the modeling in Finite Difference Time Domain (FDTD) Lumerical software; simulation results provide the evolution of mode intensity profiles along the device. Subsequently, we present the layout details for fabrication and eventual characterization for designs using edge couplers, as well as designs using grating couplers. To evaluate the performance of the designed PSR for two different applications, we propose a mathematical model and the transfer matrices. Finally, the performance of the proposed PSR is analyzed in an optical communication system.
|
7 |
Écosystème : un Framework pour la simulation visuelle interactive assistéeDrouin, Richard. 03 May 2018 (has links)
La simulation visuelle interactive (SVI) permet d’analyser et de comprendre des systèmes complexes. Par contre, leur compréhension est limitée par la capacité humaine de traiter et d’analyser l’information véhiculée par la simulation afin de prendre de bonne décision concernant son déroulement futur. Le projet présenté dans cette thèse vise à aider la compréhension d’un scénario simulé par l’utilisation d’un Framework qui permet de simplifier la tâche d’analyse de l’utilisateur. En effet, le Framework effectue de façon autonome des tâches d’analyse et de traitement pour informer l’utilisateur du type d’interactions entre les entités du scénario simulé. Pour ce faire, le Framework permet tout d’abord de structurer les éléments de la simulation en s’inspirant du paradigme des écosystèmes. Ensuite, le Framework trouve et identifie les types d’interactions présentes dans le scénario. Finalement, le Framework informe l’utilisateur de façon claire et simple des comportements à noter. Comme les résultats obtenus le démontrent, le Framework permet de simplifier la tâche d’analyse d’un utilisateur de SVI en l’informant du type d’interactions présentes dans le scénario à l’étude. -- Mots clés : Simulation visuelle interactive, logique floue, écosystème, interaction biologique, détection d’interaction, Framework, architecture logiciel, interaction, biomimétisme, système complexe, modélisation.
|
8 |
Système de détection de mouvements complexes de la main à partir des signaux EMG, pour le contrôle d'une prothèse myoélectriqueCrepin, Roxane 21 December 2018 (has links)
Les avancées technologiques en ingénierie biomédicale à travers le monde permettent le développement de systèmes automatisés et adaptés, visant à fournir aux personnes vivant avec un handicap un meilleur confort de vie. Les prothèses intelligentes basées sur l'activité myoélectrique permettent aux personnes amputées d'interagir intuitivement avec leur environnement et d'effectuer des activités de la vie quotidienne. Des électrodes placées sur la surface de la peau et une électronique embarquée dédiée recueillent les signaux musculaires et les traduisent en commandes pour piloter les actionneurs de la prothèse. Atteindre une performance accrue tout en diminuant le coût des prothèses myoélectriques est une étape importante dans l'ingénierie de réadaptation. Les mains prothétiques, actuellement disponibles à travers le monde, bénéficieraient d'un contrôle plus efficace et plus intuitif. Ce mémoire présente une approche en temps réel pour classifier les mouvements des doigts à l’aide des signaux d'électromyographie (EMG) de surface. Une plateforme multicanale d'acquisition de signaux, de notre conception, est utilisée pour enregistrer 7 canaux EMG provenant de l'avant-bras. La classification des signaux EMG est effectuée en temps réel, en utilisant une approche d'analyse discriminante linéaire. Treize mouvements de la main peuvent être identifiés avec une précision allant jusqu'à 95,8% et de 92,7% en moyenne pour 8 participants, avec une prédiction mise à jour toutes les 192 ms. L'approche a voulu être adaptée pour créer un système embarqué ouvrant de grandes opportunités pour le développement des prothèses myoélectriques légères, peu coûteuses et plus intuitives. / Technological advances in biomedical engineering worldwide enable the development of automated and patient-friendly systems, aiming at providing the severely disabled a better comfort of life. Intelligent prostheses based on myoelectric activity allow amputees to intuitively interact with their environment and perform daily life activities. Electrodes placed on the surface of the skin, and dedicated embedded electronics allow to collect muscle signals and translate them into commands to drive a prosthesis actuators. Increasing performance while decreasing the cost of surface electromyography (sEMG) prostheses is an important milestone in rehabilitation engineering. The prosthetic hands that are currently available to patients worldwide would benefit from more effective and intuitive control. This memoir presents a real-time approach to classify finger motions based on sEMG signals. A multichannel signal acquisition platform of our design is used to record forearm sEMG signals from 7 channels. sEMG pattern classification is performed in real time, using a Linear Discriminant Analysis (LDA) approach. Thirteen hand motions can be successfully identified with an accuracy of up to 95.8% and of 92.7% on average for 8 participants, with an updated prediction every 192 ms. The approach wanted to be adapted to create an embedded system opening great opportunities for the development of lightweight, inexpensive and more intuitive electromyographic hand prostheses.
|
9 |
Mineral identification using data-mining in hyperspectral infrared imageryYousefi, Bardia 05 July 2018 (has links)
Les applications de l’imagerie infrarouge dans le domaine de la géologie sont principalement des applications hyperspectrales. Elles permettent entre autre l’identification minérale, la cartographie, ainsi que l’estimation de la portée. Le plus souvent, ces acquisitions sont réalisées in-situ soit à l’aide de capteurs aéroportés, soit à l’aide de dispositifs portatifs. La découverte de minéraux indicateurs a permis d’améliorer grandement l’exploration minérale. Ceci est en partie dû à l’utilisation d’instruments portatifs. Dans ce contexte le développement de systèmes automatisés permettrait d’augmenter à la fois la qualité de l’exploration et la précision de la détection des indicateurs. C’est dans ce cadre que s’inscrit le travail mené dans ce doctorat. Le sujet consistait en l’utilisation de méthodes d’apprentissage automatique appliquées à l’analyse (au traitement) d’images hyperspectrales prises dans les longueurs d’onde infrarouge. L’objectif recherché étant l’identification de grains minéraux de petites tailles utilisés comme indicateurs minéral -ogiques. Une application potentielle de cette recherche serait le développement d’un outil logiciel d’assistance pour l’analyse des échantillons lors de l’exploration minérale. Les expériences ont été menées en laboratoire dans la gamme relative à l’infrarouge thermique (Long Wave InfraRed, LWIR) de 7.7m à 11.8 m. Ces essais ont permis de proposer une méthode pour calculer l’annulation du continuum. La méthode utilisée lors de ces essais utilise la factorisation matricielle non négative (NMF). En utlisant une factorisation du premier ordre on peut déduire le rayonnement de pénétration, lequel peut ensuite être comparé et analysé par rapport à d’autres méthodes plus communes. L’analyse des résultats spectraux en comparaison avec plusieurs bibliothèques existantes de données a permis de mettre en évidence la suppression du continuum. Les expérience ayant menés à ce résultat ont été conduites en utilisant une plaque Infragold ainsi qu’un objectif macro LWIR. L’identification automatique de grains de différents matériaux tels que la pyrope, l’olivine et le quartz a commencé. Lors d’une phase de comparaison entre des approches supervisées et non supervisées, cette dernière s’est montrée plus approprié en raison du comportement indépendant par rapport à l’étape d’entraînement. Afin de confirmer la qualité de ces résultats quatre expériences ont été menées. Lors d’une première expérience deux algorithmes ont été évalués pour application de regroupements en utilisant l’approche FCC (False Colour Composite). Cet essai a permis d’observer une vitesse de convergence, jusqu’a vingt fois plus rapide, ainsi qu’une efficacité significativement accrue concernant l’identification en comparaison des résultats de la littérature. Cependant des essais effectués sur des données LWIR ont montré un manque de prédiction de la surface du grain lorsque les grains étaient irréguliers avec présence d’agrégats minéraux. La seconde expérience a consisté, en une analyse quantitaive comparative entre deux bases de données de Ground Truth (GT), nommée rigid-GT et observed-GT (rigide-GT: étiquet manuel de la région, observée-GT:étiquetage manuel les pixels). La précision des résultats était 1.5 fois meilleur lorsque l’on a utlisé la base de données observed-GT que rigid-GT. Pour les deux dernières epxérience, des données venant d’un MEB (Microscope Électronique à Balayage) ainsi que d’un microscopie à fluorescence (XRF) ont été ajoutées. Ces données ont permis d’introduire des informations relatives tant aux agrégats minéraux qu’à la surface des grains. Les résultats ont été comparés par des techniques d’identification automatique des minéraux, utilisant ArcGIS. Cette dernière a montré une performance prometteuse quand à l’identification automatique et à aussi été utilisée pour la GT de validation. Dans l’ensemble, les quatre méthodes de cette thèse représentent des méthodologies bénéfiques pour l’identification des minéraux. Ces méthodes présentent l’avantage d’être non-destructives, relativement précises et d’avoir un faible coût en temps calcul ce qui pourrait les qualifier pour être utilisée dans des conditions de laboratoire ou sur le terrain. / The geological applications of hyperspectral infrared imagery mainly consist in mineral identification, mapping, airborne or portable instruments, and core logging. Finding the mineral indicators offer considerable benefits in terms of mineralogy and mineral exploration which usually involves application of portable instrument and core logging. Moreover, faster and more mechanized systems development increases the precision of identifying mineral indicators and avoid any possible mis-classification. Therefore, the objective of this thesis was to create a tool to using hyperspectral infrared imagery and process the data through image analysis and machine learning methods to identify small size mineral grains used as mineral indicators. This system would be applied for different circumstances to provide an assistant for geological analysis and mineralogy exploration. The experiments were conducted in laboratory conditions in the long-wave infrared (7.7μm to 11.8μm - LWIR), with a LWIR-macro lens (to improve spatial resolution), an Infragold plate, and a heating source. The process began with a method to calculate the continuum removal. The approach is the application of Non-negative Matrix Factorization (NMF) to extract Rank-1 NMF and estimate the down-welling radiance and then compare it with other conventional methods. The results indicate successful suppression of the continuum from the spectra and enable the spectra to be compared with spectral libraries. Afterwards, to have an automated system, supervised and unsupervised approaches have been tested for identification of pyrope, olivine and quartz grains. The results indicated that the unsupervised approach was more suitable due to independent behavior against training stage. Once these results obtained, two algorithms were tested to create False Color Composites (FCC) applying a clustering approach. The results of this comparison indicate significant computational efficiency (more than 20 times faster) and promising performance for mineral identification. Finally, the reliability of the automated LWIR hyperspectral infrared mineral identification has been tested and the difficulty for identification of the irregular grain’s surface along with the mineral aggregates has been verified. The results were compared to two different Ground Truth(GT) (i.e. rigid-GT and observed-GT) for quantitative calculation. Observed-GT increased the accuracy up to 1.5 times than rigid-GT. The samples were also examined by Micro X-ray Fluorescence (XRF) and Scanning Electron Microscope (SEM) in order to retrieve information for the mineral aggregates and the grain’s surface (biotite, epidote, goethite, diopside, smithsonite, tourmaline, kyanite, scheelite, pyrope, olivine, and quartz). The results of XRF imagery compared with automatic mineral identification techniques, using ArcGIS, and represented a promising performance for automatic identification and have been used for GT validation. In overall, the four methods (i.e. 1.Continuum removal methods; 2. Classification or clustering methods for mineral identification; 3. Two algorithms for clustering of mineral spectra; 4. Reliability verification) in this thesis represent beneficial methodologies to identify minerals. These methods have the advantages to be a non-destructive, relatively accurate and have low computational complexity that might be used to identify and assess mineral grains in the laboratory conditions or in the field.
|
10 |
Human shape modelling for carried object detection and segmentationGhadiri, Farnoosh 31 August 2018 (has links)
La détection des objets transportés est un des prérequis pour développer des systèmes qui cherchent à comprendre les activités impliquant des personnes et des objets. Cette thèse présente de nouvelles méthodes pour détecter et segmenter les objets transportés dans des vidéos de surveillance. Les contributions sont divisées en trois principaux chapitres. Dans le premier chapitre, nous introduisons notre détecteur d’objets transportés, qui nous permet de détecter un type générique d’objets. Nous formulons la détection d’objets transportés comme un problème de classification de contours. Nous classifions le contour des objets mobiles en deux classes : objets transportés et personnes. Un masque de probabilités est généré pour le contour d’une personne basé sur un ensemble d’exemplaires (ECE) de personnes qui marchent ou se tiennent debout de différents points de vue. Les contours qui ne correspondent pas au masque de probabilités généré sont considérés comme des candidats pour être des objets transportés. Ensuite, une région est assignée à chaque objet transporté en utilisant la Coupe Biaisée Normalisée (BNC) avec une probabilité obtenue par une fonction pondérée de son chevauchement avec l’hypothèse du masque de contours de la personne et du premier plan segmenté. Finalement, les objets transportés sont détectés en appliquant une Suppression des Non-Maxima (NMS) qui élimine les scores trop bas pour les objets candidats. Le deuxième chapitre de contribution présente une approche pour détecter des objets transportés avec une méthode innovatrice pour extraire des caractéristiques des régions d’avant-plan basée sur leurs contours locaux et l’information des super-pixels. Initiallement, un objet bougeant dans une séquence vidéo est segmente en super-pixels sous plusieurs échelles. Ensuite, les régions ressemblant à des personnes dans l’avant-plan sont identifiées en utilisant un ensemble de caractéristiques extraites de super-pixels dans un codebook de formes locales. Ici, les régions ressemblant à des humains sont équivalentes au masque de probabilités de la première méthode (ECE). Notre deuxième détecteur d’objets transportés bénéficie du nouveau descripteur de caractéristiques pour produire une carte de probabilité plus précise. Les compléments des super-pixels correspondants aux régions ressemblant à des personnes dans l’avant-plan sont considérés comme une carte de probabilité des objets transportés. Finalement, chaque groupe de super-pixels voisins avec une haute probabilité d’objets transportés et qui ont un fort support de bordure sont fusionnés pour former un objet transporté. Finalement, dans le troisième chapitre, nous présentons une méthode pour détecter et segmenter les objets transportés. La méthode proposée adopte le nouveau descripteur basé sur les super-pixels pour iii identifier les régions ressemblant à des objets transportés en utilisant la modélisation de la forme humaine. En utilisant l’information spatio-temporelle des régions candidates, la consistance des objets transportés récurrents, vus dans le temps, est obtenue et sert à détecter les objets transportés. Enfin, les régions d’objets transportés sont raffinées en intégrant de l’information sur leur apparence et leur position à travers le temps avec une extension spatio-temporelle de GrabCut. Cette étape finale sert à segmenter avec précision les objets transportés dans les séquences vidéo. Nos méthodes sont complètement automatiques, et font des suppositions minimales sur les personnes, les objets transportés, et les les séquences vidéo. Nous évaluons les méthodes décrites en utilisant deux ensembles de données, PETS 2006 et i-Lids AVSS. Nous évaluons notre détecteur et nos méthodes de segmentation en les comparant avec l’état de l’art. L’évaluation expérimentale sur les deux ensembles de données démontre que notre détecteur d’objets transportés et nos méthodes de segmentation surpassent de façon significative les algorithmes compétiteurs. / Detecting carried objects is one of the requirements for developing systems that reason about activities involving people and objects. This thesis presents novel methods to detect and segment carried objects in surveillance videos. The contributions are divided into three main chapters. In the first, we introduce our carried object detector which allows to detect a generic class of objects. We formulate carried object detection in terms of a contour classification problem. We classify moving object contours into two classes: carried object and person. A probability mask for person’s contours is generated based on an ensemble of contour exemplars (ECE) of walking/standing humans in different viewing directions. Contours that are not falling in the generated hypothesis mask are considered as candidates for carried object contours. Then, a region is assigned to each carried object candidate contour using Biased Normalized Cut (BNC) with a probability obtained by a weighted function of its overlap with the person’s contour hypothesis mask and segmented foreground. Finally, carried objects are detected by applying a Non-Maximum Suppression (NMS) method which eliminates the low score carried object candidates. The second contribution presents an approach to detect carried objects with an innovative method for extracting features from foreground regions based on their local contours and superpixel information. Initially, a moving object in a video frame is segmented into multi-scale superpixels. Then human-like regions in the foreground area are identified by matching a set of extracted features from superpixels against a codebook of local shapes. Here the definition of human like regions is equivalent to a person’s probability map in our first proposed method (ECE). Our second carried object detector benefits from the novel feature descriptor to produce a more accurate probability map. Complement of the matching probabilities of superpixels to human-like regions in the foreground are considered as a carried object probability map. At the end, each group of neighboring superpixels with a high carried object probability which has strong edge support is merged to form a carried object. Finally, in the third contribution we present a method to detect and segment carried objects. The proposed method adopts the new superpixel-based descriptor to identify carried object-like candidate regions using human shape modeling. Using spatio-temporal information of the candidate regions, consistency of recurring carried object candidates viewed over time is obtained and serves to detect carried objects. Last, the detected carried object regions are refined by integrating information of their appearances and their locations over time with a spatio-temporal extension of GrabCut. This final stage is used to accurately segment carried objects in frames. Our methods are fully automatic, and make minimal assumptions about a person, carried objects and videos. We evaluate the aforementioned methods using two available datasets PETS 2006 and i-Lids AVSS. We compare our detector and segmentation methods against a state-of-the-art detector. Experimental evaluation on the two datasets demonstrates that both our carried object detection and segmentation methods significantly outperform competing algorithms.
|
Page generated in 0.141 seconds