• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 104
  • 51
  • 16
  • 5
  • 1
  • Tagged with
  • 181
  • 181
  • 62
  • 52
  • 50
  • 41
  • 32
  • 28
  • 28
  • 25
  • 24
  • 24
  • 18
  • 18
  • 16
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Recherche linéaire et fusion de données par ajustement de faisceaux : application à la localisation par vision

Michot, Julien 09 December 2010 (has links) (PDF)
Les travaux présentés dans ce manuscrit concernent le domaine de la localisation et la reconstruction 3D par vision artificielle. Dans ce contexte, la trajectoire d'une caméra et la structure3D de la scène filmée sont initialement estimées par des algorithmes linéaires puis optimisées par un algorithme non-linéaire, l'ajustement de faisceaux. Cette thèse présente tout d'abord une technique de recherche de l'amplitude de déplacement (recherche linéaire), ou line search pour les algorithmes de minimisation itérative. La technique proposée est non itérative et peut être rapidement implantée dans un ajustement de faisceaux traditionnel. Cette technique appelée recherche linéaire algébrique globale (G-ALS), ainsi que sa variante à deux dimensions (Two way-ALS), accélèrent la convergence de l'algorithme d'ajustement de faisceaux. L'approximation de l'erreur de reprojection par une distance algébrique rend possible le calcul analytique d'une amplitude de déplacement efficace (ou de deux pour la variante Two way-ALS), par la résolution d'un polynôme de degré 3 (G-ALS) ou 5 (Two way-ALS). Nos expérimentations sur des données simulées et réelles montrent que cette amplitude, optimale en distance algébrique, est performante en distance euclidienne, et permet de réduire le temps de convergence des minimisations. Une difficulté des algorithmes de localisation en temps réel par la vision (SLAM monoculaire) est que la trajectoire estimée est souvent affectée par des dérives : dérives d'orientation, de position et d'échelle. Puisque ces algorithmes sont incrémentaux, les erreurs et approximations sont cumulées tout au long de la trajectoire, et une dérive se forme sur la localisation globale. De plus, un système de localisation par vision peut toujours être ébloui ou utilisé dans des conditions qui ne permettent plus temporairement de calculer la localisation du système. Pour résoudre ces problèmes, nous proposons d'utiliser un capteur supplémentaire mesurant les déplacements de la caméra. Le type de capteur utilisé varie suivant l'application ciblée (un odomètre pour la localisation d'un véhicule, une centrale inertielle légère ou un système de navigation à guidage inertiel pour localiser une personne). Notre approche consiste à intégrer ces informations complémentaires directement dans l'ajustement de faisceaux, en ajoutant un terme de contrainte pondéré dans la fonction de coût. Nous évaluons trois méthodes permettant de sélectionner dynamiquement le coefficient de pondération et montrons que ces méthodes peuvent être employées dans un SLAM multi-capteur temps réel, avec différents types de contrainte, sur l'orientation ou sur la norme du déplacement de la caméra. La méthode est applicable pour tout autre terme de moindres carrés. Les expérimentations menées sur des séquences vidéo réelles montrent que cette technique d'ajustement de faisceaux contraint réduit les dérives observées avec les algorithmes de vision classiques. Ils améliorent ainsi la précision de la localisation globale du système.
22

Reconstruction 3D infrarouge par perception active

Ducarouge, Benoit 26 September 2011 (has links) (PDF)
Ces travaux de thèse ont été menés dans le contexte du projet ANR blanc "Real Time and True Temperature measurement" (R3T), dédié à la métrologie thermique à partir de mesures dans l'infrarouge. L'estimation d'une température vraie à partir d'une mesure de température apparente par une caméra infrarouge, exploite un modèle radiométrique dans lequel apparaît des facteurs qui dépendent de la nature et de la forme de l'objet considéré. Ces travaux portent sur la construction d'un modèle géométrique de l'objet à partir de caméras infrarouges déplacées par un robot autour d'un objet. Ces caméras, par rapport à des caméras standards, ont des caractéristiques spé- ci ques : faible résolution, peu de texture. A n de faciliter la mise en oeuvre et de minimiser la complexité du système nal, nous avons choisi une approche de stéréovision non calibrée. Nous avons donc un banc de stéréovision infrarouge embarqué sur un robot cartésien, pour acquérir plusieurs vues de l'objet d'intérêt ; les principales étapes concernent la recti cation non calibrée des images acquises par le banc stéréo, puis le calibrage des caméras recti ées et de la relation main-oeil sans utilisation de mire, puis la construction de modèles 3D locaux denses et le recalage de ces modèles partiels pour construire un modèle global de l'objet. Les contributions portent sur les deux premières étapes, recti cation et calibrage pour la stéréovision. Pour la recti cation non calibrée, il est proposé une approche d'optimisation sous contraintes qui estime les homographies, à appliquer sur ces images pour les recti er, sans calcul préalable de la matrice Fondamentale, tout en minimisant les déformations projectives entre images d'origine et images recti ées. La fonction coût est calculée à partir de la distance de Sampson avec une décomposition de la matrice fondamentale. Deux types de contraintes, géométriques et algébriques, sont compar és pour minimiser les déformations projectives. L'approche proposée est comparé e aux méthodes proposées par Loop et Zhang, Hartley, Mallon et al... sur des jeux de données classiques de la littérature. Il est montré que les résultats sont au moins équivalents sur des images classiques et meilleurs sur des images de faible qualité comme des images infrarouges. Pour le calibrage sans mire, l'auteur propose de calibrer les caméras ainsi que la transformation main-oeil, indispensable dès lors que le banc stéréo est porté par un robot, en une seule étape ; l'une des originalités est que cette méthode permet de calibrer les caméras préalablement recti ées et ainsi de minimiser le nombre de paramètres à estimer. De même plusieurs critères sont proposés et évalués par de nombreux résultats sur des données de synthèse et sur des données réelles. Finalement, les méthodes de stéréovision testées pour ce contexte applicatif sont rapidement décrites ; des résultats expérimentaux acquis sur des objets sont présent és ainsi que des comparaisons vis-à-vis d'une vérité terrain connue.
23

Contribution à la reconstruction 3D des membres inférieurs reconstruits à partir des radios biplanes pour l'application à la planification et au suivi des chirurgies

Quijano, Sergio 19 July 2013 (has links) (PDF)
Pour comprendre et diagnostiquer les pathologies qui affectent l'organisation spatialede notre squelette, il est essentiel d'aborder ces problématiques en 3D. Le CT-Scan et l'IRMsont des modalités d'imagerie couramment utilisées en milieu clinique pour étudier en 3D notresystème musculosquelettique. La plupart de ces systèmes d'imagerie proposent une acquisitioncouchée sur laquelle les effets gravitaires ne sont pas pris en compte. Le CT-Scan est unemodalité particulièrement irradiante et l'IRM est plus spécifiquement dédiée à l'étude des tissusmous. Le système EOS permet de reconstruire en 3D les os à partir d'une paire deradiographies biplanes à faible dose d'irradiation. En plus, le système EOS propose uneacquisition en position debout, prenant en compte les effets gravitaires. Cette thèse contribue àl'amélioration des méthodes de reconstruction 3D des membres inférieurs à partir des radiosbiplanes. Dans le cadre de thèse on a proposé et évalué : 1) Une méthode de reconstruction3D des membres inférieurs s'appuyant sur des modèles paramétrés et des inférencesstatistiques. 2) Une méthode d'auto-amélioration de la reconstruction 3D des membresinférieurs en utilisant du traitement d'images local et le recalcul d'inférences statistiques. 3)Enfin, des méthodes utilisant des critères de similarité d'images et des critères morphologiquespour détecter de manière automatique le côté médial et latéral du fémur et du tibia. Le but estd'éviter l'inversion par l'opérateur de condyles fémoraux et plateaux tibiaux, affectant la valeurdes paramètres cliniques, surtout les torsions. La méthode de reconstruction proposée dans lecadre de cette thèse est intégrée dans le logiciel sterEOS® et utilisée dans une soixantained'hôpitaux au monde. Les méthodes développées dans le cadre de cette thèse ont permis deprogresser vers la reconstruction semi-automatisée, précise et robuste du membre inférieur
24

Contribution à la Perception Visuelle Basée Caméras Grand Angle pour la Robotique Mobile et Les Véhicules Autonomes / Contribution to wide angle visual perception for mobile robots and self driving cars

Khomutenko, Bogdan 15 June 2018 (has links)
Ce travail de thèse présente un nouveau modèle de projection pour les cameras fisheye, qui est mathématiquement simple et pourtant montre une haute précision une fois appliqué aux caméras réelles. Les propriétés géométriques de ce modèle ont été analysées en utilisant le concept de surface de projection, introduit dans ce travail. En particulier, une inverse analytique de ce modèle a été établie, ainsi qu'une équation implicite des projections de lignes droites. Cette dernière nous a permis de développer une méthode de reconstruction 3D directe basée vision pour les caméras fisheye sans rectifier les images. Cela a été fait grâce à une algorithme de rastérisation de courbes implicites. Cet algorithme de reconstruction nous permet d'employer le Semi-Global Matching pour obtenir une reconstruction 3D précise. Tous ces éléments ont été employés dans un système de localisation visuelle directe avec deux méthodes de recalage d'images : minimisation d'erreur photométrique et maximisation d'information mutuelle. L'étalonnage intrinsèque et extrinsèque d'un robot mobile équipé de caméras fisheye a été considéré et une toolbox d'étalonnage a été développée. / This thesis presents a novel projection model for fisheye cameras, which is mathematically simple and yet shows a high precision when applied to real cameras. Geometric properties of the model have been analyzed using the concept of projection surface, introduced in this work. In particular, a closed-form inverse mapping and an implicit equation for straight line projection have been found. This fact has been used to develop a method of direct stereo correspondence on raw fisheye images via rasterization of implicit curve. This correspondence algorithm allows us to apply the Semi-Global Matching algorithm to get an accurate 3D reconstruction using fisheye stereo systems. All these elements have been shown to be applicable to a direct visual localization system with two different methods of image registration: direct photometric error minimization and mutual information maximization. Intrinsic and extrinsic calibration of a mobile robot with fisheye cameras has been considered and a toolbox for such a calibration has been developed.
25

Optimisation discrète et indices de stabilité appliqués à la stéréoscopie en contexte routier / Discrete optimization and stability index apply on stereoscopy into a road context

Paget, Mathias 13 December 2017 (has links)
Les tâches réalisées en traitement d'image tendent à devenir de plus en plus complexes. Par exemple, dans le contexte routier, les systèmes d'aide à la conduite, (Advanced driver-assistance systems), visent à une automatisation complète de la tâche de conduite. L’évaluation de la fiabilité représente un enjeu important pour ce type d’application. Face à la difficulté des tâches à réaliser, les chaînes de traitements sont souvent divisées en de nombreuses étapes de calculs de sorte qu'il est difficile de caractériser les sorties de la chaîne en fonction des perturbations des entrées. Les étapes du traitement consistent le plus souvent en des problèmes formulés comme la minimisation d'une énergie. Cette énergie est généralement difficile à optimiser, ce qui nécessite la mise en œuvre de méthodes d’optimisation adaptées. Dans cette thèse, nous cherchons à caractériser la solution d’un traitement à partir des calculs réalisés au cours de l’étape d'optimisation. Cette approche nous a permis de proposer des indices de stabilité de la solution dans le cadre de deux méthodes d’optimisation discrètes : la coupure de graphe et la programmation dynamique. Tout d’abord, nous nous sommes intéressés au problème de la reconstruction stéréoscopique en contexte routier et au dé-bruitage, dans le cadre de l’optimisation par coupure de graphe. Les modèles issus de l’interprétation bayésienne amènent à optimiser des énergies qui ne peuvent pas être traitées avec les schémas d’optimisation classiques par fusion binaire. Nous avons proposé un schéma adapté qui met en jeu des fusions binaires par expansion et par saut. L’application de ce schéma aux problèmes de la reconstruction stéréoscopique et au dé-bruitage, nous a permis d’obtenir des solutions possédant les caractéristiques que nous recherchions : des contours d’objets nets et des dégradés progressifs dans les zones homogènes. Ensuite, dans le contexte de la programmation dynamique, nous avons réinterprété l’a priori mis en jeu dans la méthode de reconstruction Semi-Global Matching ainsi que certaines de ses variantes. Nous avons proposé d’ajouter un paramètre à ces méthodes afin de modifier les directions privilégiées par l’a priori. Enfin, nous avons proposé des indices de stabilité de la solution dans le cadre de la coupure de graphe et de la programmation dynamique. La prise en compte de ces indices, dans une étape de raffinement des solutions, permet une amélioration des résultats / Problems solved by image processing tend to be more and more complex. For instance, in road context, ADAS (Advanced driver-assistance systems) aim to a completely automatic diving tack. Evaluating system reliability is an important challenge in that case. These tasks being hard to perform, processing chains are often divide in numerous processing steps. As a consequence, characterizing the output using the input of the chain is not obvious. Most of the time, image processing steps are formulate as an energy minimization. These energies are often hard to minimize and need to apply suitable optimization methods. In this thesis, we aim to characterize the solution during the optimization step. Using this approach, we proposed stability index with two discrete optimization methods : graph-cut and dynamic optimization. First, we focused on stereoscopic reconstruction problem in road context and on denoising problem using graph-cut. Models obtained by Bayesian interpretation lead to optimize energies witch cannot be handled by classical binary fusion optimization scheme. We proposed a suitable scheme composed of fusion by expansion and fusions by step. When this scheme is apply to stereoscopic reconstruction and denoising, obtained solution have the wanted characteristics : sharp edges and shading in homogeneous areas. Next, in dynamic programming context, we reinterpreted the prior used in Semi-Global Matching (SGM) stereoscopic reconstruction method and in some of its variants. We proposed an additional parameter in order to modify the favored direction in the prior. At last, we proposed stability index of the solution in graph-cut and dynamic programing context. Using this index in a solution refinement step shows improvements
26

Data acquisition modeling and hybrid coronary tree 3D reconstruction in C-arm CBCT imaging / Modélisation du processus d'acquisition et reconstruction 3D hybride d'arbres coronaires en angiographie RX rotationelle

Li, Si 19 December 2017 (has links)
L'angiographie coronarienne RX (ou coronarographie) reste la modalité de référence permettant de déterminer avec précision le degré et le nombre de sténoses coronariennes ainsi que le nombre de vaisseaux atteints. L'objectif de ce travail de thèse de doctorat concerne l'amélioration de la reconstruction 3D des coronaires afin d'améliorer le diagnostic, ainsi que la sécurité et la précision des interventions minimalement invasives. Dans un premier temps, une contribution majeure vise à améliorer l'étape de calibration du système d'imagerie rotationnelle R-X. Premièrement, nous avons donc proposé un nouvel algorithme de calibrage basé objet inspiré de la méthode de Xu et al, dédié au système robotisé Artis Zeego. Deuxièmement, nous transposons les géométries de projection dans le système de coordonnées du C-arm. Nous avons proposé des modèles de mouvement des géométries de projection en considérant objectivement et systématiquement tous les facteurs possibles. Ces modèles de mouvement permettent de simplifier la procédure de calibration en routine clinique. The résultats expérimentaux indiquent que les modèles de mouvement proposés ont une précision acceptable afin estimer les paramètres d'acquisition. Dans un second temps, une contribution majeure vise à proposer une nouvelle méthode de reconstruction des coronaires par compensation de mouvement. Les étapes de reconstruction sont: l'opérateur de projection, la segmentation des projections acquises, le recalage iconique, la reconstruction initiale et la reconstruction avec compensation de mouvement. Nous avons opté pour l'opérateur de projection Distance Driven simplifié proposé par Oukili. Nous avons adopté comme mesure de similarité l'information Mutuelle (MI) avec un terme de rigidité. Pour optimiser cette fonction de coût, nous avons utilisé la méthode Advanced Adaptive Stochastic Gradient Descent (ASGD). Nous avons adopté une reconstruction statistique itérative basée on MAP et l'a priori L0. Les résultats expérimentaux indiquent que la méthode proposée améliore visuellement la qualité de la reconstruction. Le contraste et les détails des reconstructions sont améliorés par compensation de mouvement. / The rotational angiography RX of the coronaries is a standard modality to determine the degree and the number of the coronaries stenosis. The objective of this dissertation aims at improving the 3D reconstruction of the coronary arteries, which can improve the diagnosis, the security and the precision of the minimal invasive interventions.For the first part, the major contribution is improving the calibration procedure of the rotational R-X imaging system. First, we propose a new calibration algorithm based on the classical helical phantom on the Artis-Zeego system. Second, we transfer the geometries to the C-arm coordinate system. Last, we propose the movement models of the projection geometries objectively and systematically at 3 representative work positions. The movement models simplify the clinical procedures. The experiment results indicate that the proposed movement models have an acceptable precision to estimate the acquisition parameters.For the second part work, the major contribution is proposing a new reconstruction method by motion compensation. The steps of the reconstruction method include: the forward projection, the segmentation of the acquired projection, registration, the initial and motion compensated reconstruction. We adopt the advanced Simplified Distance Driven projector to generate the forward projection. We use the mutual information (MI) and rigidity penalty (RP) to be the similarity measure. We adopt the advanced Adaptive Stochastic Gradient Descent (ASGD) to realize the optimization. The initial and the compensated reconstruction are based on the MAP iterative reconstruction. The experiment results indicate that the proposed method improves the quality of the 3D reconstruction. The contrast and the details of the coronary arteries are improved by the proposed motion compensation reconstruction method.
27

Système de reconstruction d'environnement pour une aide au pilotage en environnement naturel / Unstructured environment reconstruction for driver assistance applications

Ricaud, Bruno 20 June 2016 (has links)
Le pilotage de véhicule blindé est rendu difficile par la faible visibilité offerte aux pilotes face aux environnements et aux situations complexes qu’ils doivent traverser.La protection des opérateurs de véhicules militaires et l’intégrité de ces véhicules sont des besoins primordiaux pour l’armée de terre.Afin de répondre à la problématique : sécuriser le pilotage des véhicules militaires avec comme périmètre la définition d’un système de perception d’environnement, nous avons procédé à l’étude au sens large de l’aide au pilotage dans le contexte militaire en environnement naturel et semi-structuré afin de mettre en exergue les moyens et les capteurs utilisables pour réaliser un système d’aide au pilotage.Ainsi, nous offrons une réponse technique pour la réalisation d’un tel système au travers premièrement d’une étude des méthodes et algorithmes existants applicables à notre cas d’application. Ensuite nous définissons les capteurs utilisables avec de telles méthodes. De cet état de l’art, nous définissonsune système répondant à notre problématique et nous expliquons sa mise en pratique au travers de la création d’une plateforme d’expérimentation.Cette plateforme se compose des solutions présentées et permet de valider le concept par l’évaluation des solutions d’acquisition de l’environnement afin d’offrir les données nécessaires à une aide au pilotage.Puis, l’étude des moyens d’analyse de cet environnement offre des pistes de réflexion sur le futur système d’aide au pilotage.Enfin, une l’étude d’un moyen alternatif de restitution de l’information à l’opérateur complète la solution présentée en offrant une piste de réflexion sur l’impact de la restitution dans les performances des opérateurs. / Armored vehicule driving is difficult because of low visibility given to pilots in tough environnements conditions and complex situations they have to manage.Soldiers safety and vehicle integrity are part of main topics for French “Armée de Terre”. To answer the problem Make the driving of military vehicles safer by improving environnement perception through driver asssistance systems, we study driving assistance in unstructured environnemnt by looking for sensors and methods which are suitable to realize such a system.First, we study existing methods and algorithms which fit our application case. Conclusion of this study is the definition of our system.Second, thanks to the previous study we explain the creation of an experimentation platform allowing evaluation of our concept. Data obtained from reconstruction are then exploited through environment analysis to bring obstacle extraction methods.Third, study of an alternative display solution is exposed and complete this work in explaining impact of restitution in operating cycle.
28

Squelettes pour la reconstruction 3D : de l'estimation de la projection du squelette dans une image 2D à la triangulation du squelette en 3D

Durix, Bastien 12 December 2017 (has links) (PDF)
La reconstruction 3D consiste à acquérir des images d’un objet, et à s’en servir pour en estimer un modèle 3D. Dans ce manuscrit, nous développons une méthode de reconstruction basée sur la modélisation par squelette. Cette méthode a l’avantage de renvoyer un modèle 3D qui est un objet virtuel complet (i.e. fermé) et aisément éditable, grâce à la structure du squelette. Enfin, l’objet acquis n’a pas besoin d’être texturé, et entre 3 et 5 images sont suffisantes pour la reconstruction. Dans une première partie, nous étudions les aspects 2D de l’étude. En effet, l’estimation d’un squelette 3D nécessite d’étudier la formation de la silhouette de l’objet à partir de son squelette, et donc les propriétés de sa projection perspective, appelée squelette perspectif. Cette étude est suivie par notre première contribution : un algorithme d’estimation de la projection perspective d’un squelette 3D curviligne, constitué d’un ensemble de courbes. Cet algorithme a toutefois tendance, comme beaucoup d’algorithmes estimant un squelette, à générer des branches peu informatives, notamment sur une image rastérisée. Notre seconde contribution est donc un algorithme d’estimation de squelette 2D, capable de prendre en compte la discrétisation du contour de la forme 2D, et d’éviter ces branches peu informatives. Cet algorithme, d’abord conçu pour estimer un squelette classique, est ensuite généralisé à l’estimation d’un squelette perspectif. Dans une seconde partie, nous estimons le squelette 3D d’un objet à partir de ses projections. Tout d’abord, nous supposons que le squelette de l’objet 3D à reconstruire est curviligne. Ainsi, chaque squelette perspectif estimé correspond à la projection du squelette 3D de l’objet, sous différents points de vue. La topologie du squelette étant affectée par la projection, nous proposons notre troisième contribution, l’estimation de la topologie du squelette 3D à partir de l’ensemble de ses projections. Une fois celle-ci estimée, la projection d’une branche 3D du squelette est identifiée sur chaque image, i.e. sur chacun des squelettes perspectifs. Avec cette identification, nous pouvons trianguler les branches du squelette 3D, ce qui constitue notre quatrième contribution : nous sommes donc en mesure d’estimer un squelette curviligne associé à un ensemble d’images d’un objet. Toutefois, les squelettes 3D ne sont pas tous constitués d’un ensemble de courbes : certains d’entre eux possèdent aussi des parties surfaciques. Notre dernière contribution, pour reconstruire des squelettes 3D surfaciques, est une nouvelle approche pour l’estimation d’un squelette 3D à partir d’images : son principe est de faire grandir le squelette 3D, sous les contraintes données par les images de l’objet.
29

Local analytic and global convex methods for the 3D reconstruction of isometric deformable surfaces. / Méthodes Analytiques Locales et Méthodes Globales Convexes pour la Reconstruction 3D de Surfaces Isométriquement Déformables.

Chhatkuli, Ajad 02 December 2016 (has links)
Cette thèse contribue au problème de la reconstruction 3D pour les surfaces déformables avec une seule caméra. Afin de modéliser la déformation de la surface, nous considérons l’isométrie puisque de nombreuses déformations d’objets réels sont quasi-isométriques. L’isométrie implique que, lors de sa déformation, la surface ne peut pas être étirée ou compressée. Nous étudions deux problèmes. Le premier est le problème basé sur une modèle 3D de référence et une seule image. L’état de l’art propose une méthode locale et analytique de calcul direct de profondeur sous l’hypothèse d’isométrie. Dans cette méthode, la solution pour le gradient de la profondeur n’est pas utilisée. Nous prouvons que cette méthode s’avère instable lorsque la géométrie de la caméra tend à être affine. Nous fournissons des méthodes alternatives basées sur les solutions analytiques locales des quantités de premier ordre, telles que les gradients de profondeur ou les normales de la surface. Nos méthodes sont stables dans toutes les géométries de projection. Dans le deuxième type de problème de reconstruction sans modèle 3D de référence, on obtient les formes de l’objet à partir d’un ensemble d’images où il apparaît déformé. Nous fournissons des solutions locales et globales basées sur le modéle de la caméra perspective. Dans la méthode locale ou par point, nous résolvons pour la normale de la surface en chaque point en supposant que la surface est infinitésimalement plane. Nous calculons ensuite la surface par intégration. Dans la méthode globale, nous trouvons une relaxation convexe du problème. Celle-ci est basée sur la relaxation de l’isométrie en contrainte d’inextensibilité et sur la maximisation de la profondeur en chaque point de la surface. Cette solution combine toutes les contraintes en un seul programme d’optimisation convexe qui calcule la profondeur et utilise une représentation éparse de la surface. Nous détaillons les expériences approfondies qui ont été réalisées pour démontrer l’efficacité de chacune des méthodes. Les expériences montrent que notre solution libre de modèle de référence local fonctionne mieux que la plupart des méthodes précédentes. Notre méthode local avec un modèle 3D de référence et notre méthode globale sans modèle 3D apportent de meilleurs résultats que les méthodes de l’état de l’art en étant robuste au bruit de la correspondance. En particulier, nous sommes en mesure de reconstruire des déformations complexes, non-lisses et d’articulations avec la seconde méthode; alors qu’avec la première, nous pouvons reconstruire avec précision de déformations larges à partir d’images prises avec des très longues focales. / This thesis contributes to the problem of 3D reconstruction for deformable surfaces using a single camera. In order to model surface deformation, we use the isometric prior because many real object deformations are near-isometric. Isometry implies that the surface cannot stretch or compress. We tackle two different problems. The first is called Shape-from-Template where the object’s deformed shape is computed from a single image and a texture-mapped 3D template of the object surface. Previous methods propose a differential model of the problem and compute the local analytic solutions. In the methods the solution related to the depth-gradient is discarded and only the depth solution is used. We demonstrate that the depth solution lacks stability as the projection geometry tends to affine. We provide alternative methods based on the local analytic solutions of first-order quantities, such as the depth-gradient or surface normals. Our methods are stable in all projection geometries. The second type of problem, called Non-Rigid Shape-from-Motion is the more general templatefree reconstruction scenario. In this case one obtains the object’s shapes from a set of images where it appears deformed. We contribute to this problem for both local and global solutions using the perspective camera. In the local or point-wise method, we solve for the surface normal at each point assuming infinitesimal planarity of the surface. We then compute the surface by integration. In the global method we find a convex relaxation of the problem. This is based on relaxing isometry to inextensibility and maximizing the surface’s average depth. This solution combines all constraints into a single convex optimization program to compute depth and works for a sparse point representation of the surface. We detail the extensive experiments that were used to demonstrate the effectiveness of each of the proposed methods. The experiments show that our local template-free solution performs better than most of the previous methods. Our local template-based method and our global template-free method performs better than the state-of-the-art methods with robustness to correspondence noise. In particular, we are able to reconstruct difficult, non-smooth and articulating deformations with the latter; while with the former we can accurately reconstruct large deformations with images taken at very long focal lengths.
30

Asynchronous event-based 3d vision / Evénement asynchrone à base de vision 3D

Amaro Da Costa Luz Carneiro, Joao Paulo 10 February 2014 (has links)
L’implementation de la vision biologique sur machine est un problème majeur que la recherche actuelle a à peine effleuré la surface. Les organismes vivants sont capables de réaliser des tâches visuelles très complexes et de manière très efficace. La stéréovision fait partie de ces mécanismes complexes que les sci- entifiques tentent de reproduire à l’aide de caméras à haute résolution. Cette thèse aborde le problème de la stéréovision d’une manière neuromorphique par l’intermédiaire d’une nouvelle génération de capteurs de vision appelés ”rétines de silicium”. Ces rétines de silicium imitent les rétines biologiques en capturant l’information visuelle sous forme de flux asynchrones d’événements codant les changements de contraste avec une grande précision temporelle. Ces capteurs sont utilisés pour étudier l’importance de la précision et de la dynamiquetemporelledelascènedansleproblèmedemiseencorrespondance stéréo. Nous proposons une des premières méthodes de reconstruction 3D capable de produire des modèles 3D d’une manière totalement asynchrone, á partir de l’information visuelle. Cette approche, outre son originalité, permet également de préserver la dynamique native de la scène. Cette thèse montre que le temps en tant que medium d’information, joue un rôle primordial dans la stéréovision. Le temps peut compléter, compenser, voire remplacer l’information apportée habituellement par la luminance et la géométrie. Ce travail établit également les fondations solides des futures recherches en vision stéréo á haute vitesse et haute dynamique, basée sur les événements. Il ouvre également de nouvelles perspectives prometteuses pour la résolution de problèmes traditionels de vision artificielle grâce à l’apport du nouveau paradigme de la vision asynchrone. / Reproducing biological vision in a machine is a challenging problem for which scientists have just scratched the surface. Living organisms are able to per- form complex tasks in an awestruckly efficient manner. The stereovision is one of these complex mechanisms that computer scientists try to replicate with high resolution cameras. This thesis takes on the stereovision problem in a neuromorphic way by mean of a new generation of vision sensors also called ”silicon retinas”. These silicon retinas mimic biological retinas by cap- turing the visual information into the form of asynchronous stream of events that encode contrast change at high temporal precision. These sensors are used to study the importance of the precise timing and the scene temporal dynamics in solving the stereo correspondence problem. We propose one of the first 3D reconstruction methods which is able to produce 3Dmodelsinatrulyevent-basedandasynchronousmanner, fromevent-based visual information. Besides the novelty of proposing a truly temporal- based asynchronous event-driven approach of 3D reconstructions, this work is also able to preserve the native dynamic of the scene. Time as information medium is proven to have a critical role in stereovision. Time can supplement, compensate and even replace the usual luminance and spatial information. This work lays strong foundations for future research on high temporal and event-based dynamic stereo vision. It also opens new promisingperspectivesforsolvingtraditionalmachinevisionproblemsthanks to the use of the new asynchronous vision paradigm.

Page generated in 0.0858 seconds