• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 152
  • 25
  • Tagged with
  • 177
  • 177
  • 169
  • 105
  • 105
  • 105
  • 105
  • 105
  • 94
  • 51
  • 45
  • 39
  • 39
  • 32
  • 22
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
101

Novel Edge-Preserving Filtering Model Based on the Quadratic Envelope of the l0 Gradient Regularization

Vásquez Ortiz, Eduar Aníbal 26 January 2023 (has links)
In image processing, the l0 gradient regularization (l0-grad) is an inverse problem which penalizes the l0 norm of the reconstructed image’s gradient. Current state-of-the art algorithms for solving this problem are based on the alternating direction method of multipliers (ADMM). l0-grad however, reconstructs images poorly in cases where the noise level is large, giving images with plain regions and abrupt changes between them, that look very distorted. This happens because it prioritizes keeping the main edges but risks losing important details when the images are too noisy. Furthermore, since kÑuk0 is a non-continuous and non-convex regularizer, l0-grad can not be directly solved by methods like the accelerated proximal gradient (APG). This thesis presents a novel edge-preserving filtering model (Ql0-grad) that uses a relaxed form of the quadratic envelope of the l0 norm of the gradient. This enables us to control the level of details that can be lost during denoising and deblurring. The Ql0-grad model can be seen as a mixture of the Total Variation and l0-grad models. The results for the denoising and deblurring problems show that our model sharpens major edges while strongly attenuating textures. When it was compared to the l0-grad model, it reconstructed images with flat, texture-free regions that had smooth changes between them, even for scenarios where the input image was corrupted with a large amount of noise. Furthermore the averages of the differences between the obtained metrics with Ql0- grad and l0-grad were +0.96 dB SNR (signal to noise ratio), +0.96 dB PSNR (peak signal to noise ratio) and +0.03 SSIM (structural similarity index measure). An early version of the model was presented in the paper Fast gradient-based algorithm for a quadratic envelope relaxation of the l0 gradient regularization which was published in the international and indexed conference proceedings of the XXIII Symposium on Image, Signal Processing and Artificial Vision.
102

Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo

Morales Pariona, Jose Ulises 16 April 2024 (has links)
Desde que aparecieron las redes GAN, se han realizado varias investigaciones sobre cómo generar imágenes en diversos ámbitos, como la generación de imágenes, conversión de imágenes, síntesis de videos, síntesis de imágenes a partir de textos y predicción de cuadros de videos. Basándose mayormente en mejorar la generación de imágenes de alta resolución y la reconstrucción o predicción de datos. El propósito de este trabajo es implementar las redes GAN en otros ámbitos, como la generación de imágenes de entidades realizando una acción. En este caso se consideró 3 acciones de personas, que son los ejercicios de Glúteo, Abdomen y Cardio. En primer lugar, se descargaron y procesaron las imágenes de YouTube, el cual incluye una secuencia de imágenes de cada acción. Posteriormente, se separó dos grupos de imágenes, de una sola persona, y de personas diferentes realizando las acciones. En segundo lugar, se seleccionó el modelo InfoGAN para la generación de imágenes, teniendo como evaluador de rendimiento, la Puntuación Inicial (PI). Obteniendo como resultados para el primer grupo, una puntuación máxima de 1.28 y en el segundo grupo, una puntuación máxima de 1.3. En conclusión, aunque no se obtuvo el puntaje máximo de 3 para este evaluador de rendimiento, debido a la cantidad y calidad de las imágenes. Se aprecia, que el modelo si logra diferenciar los 3 tipos de ejercicios, aunque existen casos donde se muestran incorrectamente las piernas, los brazos y la cabeza. / Since the appearance of GAN networks, various investigations have been carried out on how to generate images in various fields, such as image generation, image conversion, video synthesis, image synthesis from text, and video frame prediction. Based mostly on improving the generation of high resolution images and the reconstruction or prediction of data. The purpose of this work is to implement GAN networks in other areas, such as the generation of images of entities performing an action. In this case, 3 actions of people were considered, which are the Gluteus, Abdomen and Cardio exercises. First, the images from YouTube were downloaded and processed, which includes a sequence of images of each action. Subsequently, two groups of images were separated, of a single person, and of different people performing the actions. Secondly, the InfoGAN model was selected for image generation, having the Initial Score (PI) as a performance evaluator. Obtaining as results for the first group, a maximum score of 1.28 and in the second group, a maximum score of 1.3. In conclusion, although the maximum score of 3 was not obtained for this performance tester, due to the quantity and quality of the images. It can be seen that the model is able to differentiate the 3 types of exercises, although there are cases where the legs, arms and head are shown incorrectly.
103

Studies on obstacle detection and path planning for a quadrotor system

Valencia Mamani, Dalthon Abel 06 November 2017 (has links)
Autonomous systems are one interesting topic recently investigated; for land and aerial vehicles; however, the main limitation of aerial vehicles is the weight to carry on-board, since the power consumed depends on this and hardware like sensors and processor is limited. The present thesis develops an application of digital image processing to detect obstacles using only a monocamera, there are some approaches but the present report wants to focus on the distance estimation approach that, in future works, can be combined with other methods since this approach is more general. The distance estimation approach uses feature detection algorithms in two consecutive images, matching them and thus estimate the obstacle position. The estimation is computed through a mathematical model of the camera and projections between those two images. There are many parameters to improve final results and the best parameters are found and tested with consecutive images, which were captured every 0.5m along a straight path of 5m. Fraunhofer position modules are tested with the entire algorithm. Finally, in order to establish the new path without obstacles, an optimal binary integer programming problem is proposed, adapting the approach using results obtained from the distance estimation and obstacle detection. Resulting data is suitable for combining them with information obtained from conventional sensors, such as ultrasonic sensors. The obtained mean error is between 1% and 12% in short distances (less than 2.5 m) and greater with longer distances. The complexity of this study lies in the use of a single camera for the capture of frontal images and obtaining 3D information of the environment, the computation of the obstacle detection algorithm is tested off-line and the path-planning algorithm is proposed with detected keypoints in the background. / Autonome Systeme sind ein interessantes Thema vor kurzem untersucht; für Land- und Luftfahrzeuge; Allerdings ist die Hauptbegrenzung von Luftfahrzeugen das Gewicht, um an Bord zu tragen, da die verbrauchte Energie davon abhängt und Hardware wie Sensoren und Prozessor begrenzt ist. Die vorliegende Arbeit entwickelt eine Anwendung der digitalen Bildverarbeitung zur Erkennung von Hindernissen, die nur eine Monokamera verwenden, es gibt einige Ansätze, aber der vorliegende Bericht will sich auf den Abstandsschätzungsansatz konzentrieren, der in Zukunft mit anderen Methoden kombiniert werden kann, da dieser Ansatz ist allgemeiner. Der Abstandsschätzungsansatz verwendet Merkmalserkennungsalgorithmen in zwei aufeinanderfolgenden Bildern, passt sie an und schätzt somit die Hindernisposition ab. Die Schätzung wird durch ein mathematisches Modell der Kamera und Projektionen zwischen diesen beiden Bildern berechnet. Es gibt viele Parameter, um die endgültigen Ergebnisse zu verbessern, und die besten Parameter werden mit aufeinanderfolgenden Bildern gefunden und getestet, die alle 0,5 m auf einem geraden Weg von 5 m erfasst wurden. Fraunhofer-Positionsmodule werden mit dem gesamten Algorithmus getestet. Schließlich wird, um den neuen Weg ohne Hindernisse zu etablieren, ein optimales Binär-Integer-Programmierproblem vorgeschlagen, das den Ansatz unter Verwendung von Ergebnissen, die aus der Abstandsschätzung und der Hinderniserkennung erhalten wurden, anpasst. Die daraus resultierenden Daten eignen sich zur Kombination mit Informationen aus konventionellen Sensoren wie Ultraschallsensoren. Der erhaltene mittlere Fehler liegt zwischen 1 % und 12 % in kurzen Abständen (weniger als 2,5 m) und größer mit längeren Abständen. Die Komplexität dieser Studie liegt in der Verwendung einer einzigen Kamera für die Erfassung von Frontalbildern und dem Erhalten von 3D-Informationen der Umgebung, wird die Berechnung des Hinderniserfassungsalgorithmus off-line getestet und derWegplanungsalgorithmus wird mit erkannten Keypoints vorgeschlagen im Hintergrund. / Tesis
104

Desarrollo y comparación de diversos mapas de probabilidades en 3D del cáncer de próstata a partir de imágenes de histología

Díaz Rojas, Kristians Edgardo 04 December 2013 (has links)
Understanding the spatial distribution of prostate cancer and how it changes according to prostate specific antigen (PSA) values, Gleason score, and other clinical parameters may help comprehend the disease and increase the overall success rate of biopsies. This work aims to build 3D spatial distributions of prostate cancer and examine the extent and location of cancer as a function of independent clinical parameters. The border of the gland and cancerous regions from whole-mount histopathological images are used to reconstruct 3D models showing the localization of tumor. This process utilizes color segmentation and interpolation based on mathematical morphological distance. 58 glands are deformed into one prostate atlas using a combination of rigid, a ne, and b-spline deformable registration techniques. Spatial distribution is developed by counting the number of occurrences in a given position in 3D space from each registered prostate cancer. Finally a di erence between proportions is used to compare di erent spatial distributions. Results show that prostate cancer has a significant di erence (SD) in the right zone of the prostate between populations with PSA greater and less than 5 ng=ml. Age does not have any impact in the spatial distribution of the disease. Positive and negative capsule-penetrated cases show a SD in the right posterior zone. There is SD in almost all the glands between cases with tumors larger and smaller than 10% of the whole prostate. A larger database is needed to improve the statistical validity of the test. Finally, information from whole-mount histopathological images could provide better insight into prostate cancer. / Tesis
105

Software for calibrating a digital image processing

Lang, Kathrin 30 May 2014 (has links)
This work is about learning tool wich provides the necessary parameters for a program controlling robots of type LUKAS at the Faculty of Mechanical Engineering. The robot controlling program needs various parameters depending on its environment, like the light intensity distribution, and camera settings as exposure time and gain raw. These values have to be transmitted from the learning tool to the robot controlling software. Chapter one introduces the robots of type LUKAS which are created for the RoboCup Small Size League. Furthermore, it introduces the camera used for image processing. The second chapter explains the learning process according to Christoph UBfeller and deduces the requirements for this work. In the third chapter theoretical basics concerning image processing, wich are fundamental for this work, are explained. Chapter 4 describes the developed learning tool which is used for the learning process and generates the required parameters for the robot controlling software. In chapter five practical test with two persons are represented. The sixth and last chapter summarizes the results. / Tesis
106

A generative adversarial network approach for super resolution of sentinel-2 satellite images

Pineda Ancco, Ferdinand Edgardo 17 March 2020 (has links)
Recently, satellites in operation offering very high-resolution (VHR) images has experienced an important increase, but they remain as a smaller proportion against existing lower resolution (HR) satellites. Our work proposes an alternative to improve the spatial resolution of HR images obtained by Sentinel-2 satellite by using the VHR images from PeruSat1, a Peruvian satellite, which serve as the reference for the superresolution approach implementation based on a Generative Adversarial Network (GAN) model, as an alternative for obtaining VHR images. The VHR PeruSat-1 image dataset is used for the training process of the network. The results obtained were analyzed considering the Peak Signal to Noise Ratios (PSNR), the Structural Similarity (SSIM) and the Erreur Relative Globale Adimensionnelle de Synth`ese (ERGAS). Finally, some visual outcomes, over a given testing dataset, are presented so the performance of the model could be analyzed as well. / Trabajo de investigación
107

Sistema mecatrónico para determinar automáticamente las dimensiones de anchovetas usando visión artificial

Murrugarra Ortiz, Lhester 15 July 2021 (has links)
Este trabajo plantea el desarrollo de un sistema mecatrónico sumergible que trabaje junto a un computador en una embarcación. El proyecto tiene como propósito indicarle al operario si el cardumen se puede pescar según las reglas impuestas por el Instituto del Mar Peruano (IMARPE) y por el Ministerio de Producción (PRODUCE). Dichas instituciones indican que solo se puede pescar un cardumen donde la cantidad de juveniles, especies con menos de 12cm, sea menor al 10% del cardumen (MINISTERIO DE PRODUCCIÓN, 2015). Para ello, el vehículo sumergible (ROV) del sistema cuenta con cámaras estereoscópicas, las cuales son capaces de medir la longitud en centímetros de las imágenes tomadas. En el presente proyecto, se grabará un video del cardumen y este será enviado a la estación en tierra, donde el computador será el encargado de realizar el procesamiento y dar los resultados al usuario. El documento inicia una recopilación de información referente a la temática del sistema propuesto, presentando el estado del arte, el marco teórico y posibles interesados. Luego, se realiza un estudio de los requerimientos del proyecto, los procesos internos que este debe realizar, se proponen soluciones y se mejora la solución ganadora. Finalmente, se realizaron las modificaciones necesarias al ROV (a nivel mecánico y electrónico) y se desarrolló el algoritmo de procesamiento de imágenes. Este trabajo ha sido elaborado con la finalidad de sentar las bases para desarrollar proyectos que mejoren el uso de los recursos marinos sin dañarlos. Dado que el proyecto es bastante amplio y el procesamiento de las imágenes puede volverse muy complejo, se considera que el presente trabajo puede ser complementado y mejorado por especialistas en procesamiento de imágenes y en temas de diseño de vehículos sumergibles.
108

Integración de imágenes de nubes de puntos obtenidas por drones

Tippe Quintanilla, Percy Kim 16 September 2021 (has links)
The Lidar technology is an environment scanning method that produces point cloud images. In this work we study the use of a Kalman filter to combine point cloud images into a single unified 3D map.
109

Diseño e implementación de una interface usuario-máquina basada en visión computacional para automatizar la selección de frutos cítricos según la forma, tamaño, color y defectos externos

Campos Quispe, Luis Fernando 28 August 2020 (has links)
Dentro del proceso de producción de cítricos para exportación y consumo local existen etapas que, por su alta especialización, requiere de una persona para ser ejecutadas. Tales etapas pueden ser identificadas como la medición del tamaño, la forma, el color y la detección de defectos externos. La participación de una persona para llevar a cabo estas tareas trae como consecuencia una ralentización del proceso de producción debido a que la velocidad de trabajo de una persona no se puede comparar a la de una máquina industrial. En vista de este problema se ha trabajado en el diseño de una interface basada en una cámara de visión computacional para realizar todos los trabajos que aun dependían del ojo y del cerebro humano para ser llevadas a cabo. La interface diseñada es capaz de evaluar cada fruto a una velocidad de 0.6 segundo por fruto. Este es el tiempo que demora cada fruto en atravesar el campo de visión de la cámara del recinto de captura y procesamiento de imágenes. La interface está basada en algoritmos computacionales, los cuales a su vez están basados en métodos de procesamiento de imágenes para poder extraer las características más importantes de la fruta evaluada. Los resultados obtenidos, luego de probar la interface con diferentes frutos cítricos son alentadores. Se pudo medir con una precisión del 100% el calibre de cincuenta naranjas y con una precisión de 94% el calibre de cincuenta mandarinas. El error máximo obtenido en la medición de los diámetros de los frutos evaluados fue de 2.5% para el caso de las naranjas y de 4.8% para el caso de las mandarinas. También se lograron resultados importantes al momento de medir el color y el área externa defectuosa, sin embargo, estos aspectos requieren ser mejorados. En líneas generales los logros alcanzados en el presente trabajo de tesis representan la base para futuros trabajos más especializados. / Tesis
110

Técnicas de representación y reconstrucción de objetos 3D en el computador: una revisión de literatura

Sumoso Vicuña, Ernie Ludwick 18 February 2021 (has links)
Actualmente en el mundo, las tecnologías de escaneo 3D se clasifican en dos grupos: de contacto y sin contacto. El primer grupo se caracteriza por la necesidad de reposar el escáner sobre el objeto (Sreenivasa K. 2003). Este tipo de escáneres representan un riesgo cuando los objetos en cuestión no pueden ser manipulados libremente debido a su fragilidad. Por otro lado, el segundo grupo de tecnologías son mayormente usadas en investigaciones y poseen una amplia variedad de aplicaciones en la industria medicinal y de entretenimiento. Este último grupo a su vez se divide en dos sub-grupos: activos y pasivos (Pears N. 2012). Las tecnologías de escaneo 3D activos se basan en el análisis y medición del tiempo de envío y retorno de una señal hacia el objeto para estimar la posición de la superficie. Por otro lado, las técnicas de escaneo sin contacto-pasivas no necesitan de la manipulación del objeto ni medición de señales ya que aprovechan la luz ambiental. Dentro de las ciencias de la computación existe el problema de cómo sintetizar, procesar y analizar la información de una superficie obtenida mediante herramientas de escaneo 3D y guardarla en el computador con el fin de que este pueda ser visualizada y/o manipulada por otras herramientas informáticas. A lo largo de los años han surgido múltiples técnicas de representación de objetos en un espacio de tres dimensiones. Sin embargo, estas técnicas dependen fuertemente de las herramientas empleadas durante el proceso de escaneo. Es por ello que se han desarrollado también técnicas pasivas-sin contacto que permitan la obtención de superficies únicamente a partir de una colección de imágenes y haciendo uso de redes neuronales entrenadas en extensos conjuntos de datos. Para poder entender estas tecnologías emergentes es necesario investigar a profundidad cuales son los recientes métodos para generar superficies u objetos 3D, en qué casos se utilizan los distintos métodos y cuáles son los enfoques de los autores al emplear dichas técnicas.

Page generated in 0.0518 seconds