• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 22
  • 8
  • 1
  • Tagged with
  • 31
  • 31
  • 11
  • 9
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Un enfoque bayesiano para la extracción de características y agrupamiento en visión artificial

Cazorla, Miguel 19 May 2000 (has links)
No description available.
12

Sistema de visión artificial basado en la detección de los movimientos del ojo, para mejorar la atención de los pacientes con síndrome de Guillain Barré

Polo Castro, Julio Cesar, Polo Castro, Julio Cesar January 2015 (has links)
El síndrome de Guillain Barré es una polirradiculoneuropatía de evolución aguda o sub aguda que ataca progresivamente el sistema nervioso central impidiendo el movimiento de una persona progresivamente, empieza en los brazos y piernas y se extiende hasta el cuello, en el 50% de los casos se requiere de un ventilador mecánico, por lo que se considera una enfermedad critica, el problema de la enfermedad es que dificulta la comunicación entre los pacientes y su entorno, esto hace que durante el ciclo de la enfermedad, 1 año aproximadamente, este paciente presente complicaciones por la falta de comunicación. El presente proyecto de tesis está enfocado a desarrollar un Sistema de Visión artificial, basado en la detección de los movimientos del ojo que permitió solucionar el problema de la falta de comunicación de los pacientes con síndrome de Guillain Barre del Hospital Nacional Almanzor Aguinaga Asenjo. El SVA presenta una interfaz con algunos mensajes predefinidos, así como un teclado para escribir un mensaje propio, dirigiendo la mirada hacia el lugar que quieren realizar el “click”, referenciándose por un puntero que le permitirá asegurar el lugar exacto donde quiere clickear, para esto se usara la técnica de “tracking eye” o técnica de seguimiento de los ojos, mediante el uso de una cámara para captar los movimientos del ojo y poder usarlo en el sistema de visión artificial, que se desarrollara en base a la metodología propuesta por Kong y Nilson (2005), que consta de 3 etapas, la representación de la imagen, el procesamiento de la imagen y el análisis de la misma. La población de esta tesis es no probabilística por lo que se realiza en los 5 pacientes con SGB que se encontraban hospitalizados durante la realización de esta tesis. / Tesis
13

Contributions on Automatic Recognition of Faces using Local Texture Features

Monzó Ferrer, David 19 July 2012 (has links)
Uno de los temas más destacados del área de visión artifical se deriva del análisis facial automático. En particular, la detección precisa de caras humanas y el análisis biométrico de las mismas son problemas que han generado especial interés debido a la gran cantidad de aplicaciones que actualmente hacen uso de estos mecnismos. En esta Tesis Doctoral se analizan por separado los problemas relacionados con detección precisa de caras basada en la localización de los ojos y el reconomcimiento facial a partir de la extracción de características locales de textura. Los algoritmos desarrollados abordan el problema de la extracción de la identidad a partir de una imagen de cara ( en vista frontal o semi-frontal), para escenarios parcialmente controlados. El objetivo es desarrollar algoritmos robustos y que puedan incorpararse fácilmente a aplicaciones reales, tales como seguridad avanzada en banca o la definición de estrategias comerciales aplicadas al sector de retail. Respecto a la extracción de texturas locales, se ha realizado un análisis exhaustivo de los descriptores más extendidos; se ha puesto especial énfasis en el estudio de los Histogramas de Grandientes Orientados (HOG features). En representaciones normalizadas de la cara, estos descriptores ofrecen información discriminativa de los elementos faciales (ojos, boca, etc.), siendo robustas a variaciones en la iluminación y pequeños desplazamientos. Se han elegido diferentes algoritmos de clasificación para realizar la detección y el reconocimiento de caras, todos basados en una estrategia de sistemas supervisados. En particular, para la localización de ojos se ha utilizado clasificadores boosting y Máquinas de Soporte Vectorial (SVM) sobre descriptores HOG. En el caso de reconocimiento de caras, se ha desarrollado un nuevo algoritmo, HOG-EBGM (HOG sobre Elastic Bunch Graph Matching). Dada la imagen de una cara, el esquema seguido por este algoritmo se puede resumir en pocos pasos: en una primera etapa se ext / Monzó Ferrer, D. (2012). Contributions on Automatic Recognition of Faces using Local Texture Features [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/16698 / Palancia
14

Desarrollo de técnicas de visión hiperespectral y tridimensional para el sector agroalimentario

Ivorra Martínez, Eugenio 31 March 2015 (has links)
En la industria alimentaria, como en cualquier otra industria, la mejora de sus procesos productivos es un factor clave para mantener su competitividad e incrementar sus beneficios. Para cumplir este objetivo es necesario incorporar nuevos métodos que mejoren la calidad y eficiencia de estos procesos. Además, en los alimentos actuales cada vez hay una mayor distancia entre el lugar de producción del alimento y el lugar donde se consume aumentando las posibilidades de que se contamine o exista una incertidumbre acerca de su estado. Esto exige sistemas de calidad que puedan inspeccionar el 100% de los alimentos de una forma económica y no destructiva. En esta tesis se propone utilizar para ello técnicas hiperespectrales y tridimensionales. Se ha hecho una revisión del estado del arte de las diferentes técnicas de obtención de información tridimensional así como de sus usos en la industria alimentaria. En base a ello, se han seleccionado las técnicas basadas en luz estructurada (SL), estéreo-visión y tiempo de vuelo (TOF) como las técnicas más apropiadas. Se ha realizado una comparativa entre SL y TOF para la medida en línea de producción de 3 alimentos de origen animal y 3 de origen vegetal. De este estudio se concluye que ambas técnicas son válidas teniendo unos R2 CV medios de 0.85 el TOF y de 0.94 el SL para estimar el volumen de las muestras. Se profundizó en el estudio de SL mediante la resolución del problema de segmentación de raíces en tubérculos. Se trata de un problema difícil de resolver por técnicas clásicas de visión por computador en 2D debido a que las raíces tienen un color muy parecido a los tubérculos. Este problema se resolvió utilizando un modelo Adaboost que clasificó los puntos tridimensionales en raíces o puntos de superficie basándose en un vector de descriptores 3D. En este estudio, se llegó a alcanzar un porcentaje de acierto del 94%. Otro problema resuelto fue la determinación de la compacidad de racimos de uva basándose en descriptores 3D usando técnicas de estéreo visión. Se trata de un componente de calidad complicado de estimar debido al problema de subjetividad ya que actualmente se realiza de forma manual por un panel de expertos siguiendo el descriptor de la OIV Nº204. El método semi-automático desarrollado utiliza nuevos descriptores 3D y un modelo SVM, obteniendo un R2 en predicción de 0.8 para 100 racimos de 10 variedades diferentes. Por otro lado, se ha desarrollado una metodología para la obtención de resultados a partir de imágenes hiperespectrales. Esta metodología se ha aplicado en 3 casos prácticos de diferentes alimentos para medir su frescura, entendiendo frescura como el grado de deterioro de los alimentos respecto a la calidad inicial de los mismos. La frescura actualmente se estima de forma analítica como una combinación de una serie de análisis físico-químicos destructivos. Mediante la captura de imágenes hiperespectrales en el rango SW-NIR se estimó la frescura de los siguientes alimentos en sus envases comerciales con distintos tipos de procesado: pechugas de pollo fileteadas, pavo cocido, jamón cocido y salmón ahumado. Se empezó con la aplicación básica de la metodología desarrollada en el pavo y el jamón cocidos donde se consiguieron unos resultados medios de validación cruzada de R2 0.93 y de 0.9 respectivamente utilizando dos modelos PLSDA para correlar el tiempo con los espectros adquiridos. El siguiente caso práctico se realizó en pechugas de pollo, donde se amplió la metodología básica efectuando una selección de longitudes de onda mediante el algoritmo IPLSDA que redujo de 54 a 13 las variables al mismo tiempo que mejoró los resultados de los modelos PLSDA para estimar la frescura de R2 CV 0.77 a 0.85. También se estudió la influencia del film en cuanto al análisis de frescura con técnicas hiperespectrales, donde se concluyó que éste únicamente atenúa el espectro sin afectar a los resultados. En el último caso práctico se determinó si el salmón ahumado estaba caducado mediante imágenes hiperespectrales. Este caso se enfocó en la fase de segmentación espacial donde se obtuvo los espectros del tejido magro y del tejido graso por separado. Para ello se transformó la imagen hiperespectral a una imagen 2D en RGB empleando un modelo calculado del sistema hiperespectral. Una vez transformadas a imágenes 2D, se segmento la imagen mediante un algoritmo basado en segmentación por color. Se obtuvo un resultado de R2 CV=0.83 con la segmentación espacial propuesta. En este estudió se demostró la necesidad de realizar una buena segmentación espacial en los casos en que las muestras no son homogéneas como es el caso de los diferentes tejidos del salmón. La principal aportación de la tesis es la metodología desarrollada para la combinación de técnicas 3D e hiperespectrales en el sector alimentario. La gran ventaja que se consigue con estos nuevos procedimientos es disponer de una resolución espacial elevada mediante las técnicas 3D y una muy buena resolución espectral con las técnicas hiperespectrales. En esta tesis se presentan dos de las muchas posibilidades de unir ambas técnicas. En la primera de ellas se analizó la información tridimensional del proceso de fermentación de masas de harina. Esta información tridimensional se empleó para distinguir entre harinas supuestamente iguales (según los análisis realizados en la industria) que se comportaron de forma distinta durante la fermentación. Mediante la metodología desarrollada que emplea ambas técnicas, se consiguió predecir a partir de la información hiperespectrales el comportamiento dinámico que tuvo la muestra durante la fermentación. El conocimiento de este comportamiento es de gran interés puesto que por ejemplo permite ahorrar dinero agrupando muestras con tiempos similares de fermentación o seleccionando mejor la materia prima. El segundo caso donde se investigó y desarrolló esta conjunción de técnicas se basó en aprovechar la gran resolución espacial obtenida de las técnicas 3D. Concretamente, se utilizó en la fase de segmentación espacial al procesar imágenes hiperespectrales de dorada. El objetivo de la segmentación en base a la información tridimensional fue obtener la información espectral de zonas específicas del pescado como los ojos donde se puede estimar mejor la frescura. Los resultados de R2 CV fueron de 0.844 al correlacionar los espectros obtenidos de los ojos con el tiempo mediante un PLSDA. El desarrollo de estas técnicas tendrá un gran impacto en la industria agroalimentaria en un futuro próximo, ya que supone una clara innovación tecnológica respecto a realizar análisis físico-químicos destructivos en un subconjunto de las muestras. Estas técnicas permiten realizar el control de calidad y de seguridad de todas las muestras de forma no destructiva mejorando por tanto la calidad, rapidez, seguridad, fiabilidad y coste de los diferentes procesos de la industria alimentaria. / Ivorra Martínez, E. (2015). Desarrollo de técnicas de visión hiperespectral y tridimensional para el sector agroalimentario [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/48541 / TESIS
15

Expansión de la capacidad de los filtros convolucionales en redes neuronales

Larregui, Juan Ignacio 10 May 2021 (has links)
En los últimos años el campo de la Visión Artificial ha experimentado un crecimiento acelerado con el éxito de las Redes Neuronales Artificiales y el Aprendizaje Profundo. La cantidad de datos etiquetados que se han relevado, las mejoras en hardware especializado y las importantes modificaciones introducidas en los algoritmos tradicionales surgidos en la segunda mitad del siglo pasado han posibilitado el avance en problemas complejos que parecían imposibles de abordar pocos años atrás. En particular, las Redes Neuronales Convolucionales se han convertido en el modelo más popular dentro de este campo de las Ciencias de la Computación. A lo largo de la década del 2010, los trabajos que avanzaron el estado del arte en los diferentes problemas de la Visión Artificial han incluido casi exclusivamente redes de este tipo. Sin embargo, algunos componentes de las Redes Convolucionales han mantenido sus estructuras y definiciones originales. Este es el caso de los filtros convolucionales, los cuales han mantenido su estructura geométrica estática en las últimas décadas. El objetivo general de esta tesis es explorar las limitaciones inherentes a la estructura tradicional de los filtros convolucionales, proponiendo nuevas definiciones y operaciones para superar las mismas. En esta línea, se presenta una generalización de la definición de los filtros convolucionales, extendiendo el concepto de dilatación de los mismos a intervalos continuos sobre las dimensiones espaciales. Adicionalmente, se presenta una nueva definición de la Convolución Dilatada para permitir comportamientos dinámicos durante el proceso de entrenamiento. Basadas en las definiciones introducidas, se proponen las nuevas operaciones de Convolución de Dilatación Adaptativa y Convolución de Dilatación Aleatoria. La primera introduce a las redes convolucionales la capacidad de optimizar la dilatación de los filtros de acuerdo a los datos de entrada, de manera de adaptarse dinámicamente a los cambios semánticos y geométricos presentes en las diferentes escenas. La segunda permite explorar la utilización de filtros de dilataciones aleatorias para simular transformaciones de escala, con el objetivo de aumentar la invariancia a escala de una red convolucional, una de sus limitaciones más conocidas. Finalmente, se definieron casos de estudio para Clasificación de Imágenes y Segmentación Semántica, de manera de obtener métricas cuantitativas que permitan evaluar las propuestas realizadas. Se realizaron múltiples entrenamientos de diferentes arquitecturas y configuraciones para redes conocidas en la literatura, mostrando resultados favorables con la inclusión de las operaciones propuestas. Más aún, el diseño de estas es modular, por lo que pueden ser incluidas en arquitecturas arbitrarias. / In the last years, the field of Computer Vision has seen incredible success through the adoption of Artificial Neural Networks and Deep Learning. The amount of labeled data, the improvements in specialized hardware, and further development in the traditional algorithms, have enabled advances in complex problems that seemed impossible to approach a few years before. In particular, these networks have become the most popular models within this field of Computer Sciences. Throughout the last decade, the state-of-the-art research in the different Computer Vision problems had almost exclusively included this type of model. However, the structure of some components of Convolutional Networks has remained almost unaffected. This is the case with convolutional filters, which have kept their original geometric structure in the last decades. The overall goal of this thesis is to explore the limitations inherent to the traditional structure of the convolutional filters, introducing new definitions and operations to overcome them. In this context, a generalization of the definition of convolutional filters is presented, extending the concept of dilation to continuous intervals in the spatial dimensions. Additionally, a new definition for the Dilated or Atrous Convolution is proposed, which enables dynamic behaviors in the dilation of the filters during the training process. Based on these new definitions, two new operations are presented: the Adaptive Dilation Convolution and the Random Dilation Convolution. The first one introduces the capacity for Convolutional Networks to optimize the dilation of the filters according to the input data, dynamically adapting to the semantic and geometric differences found across scenes. The second, enables the exploration of random dilations to simulate different scale transformations in the data, aiming to increase the scale invariance of these networks, one of their known limitations. Finally, different study cases were defined for Image Classification and Semantic Segmentation, in order to evaluate the introduced operations using quantitative metrics. Several training experiments were performed, using different architectures and configurations for renowned networks, showing positive results during the inclusion of the proposed operations. Moreover, their design is modular, enabling them to be included in arbitrary architectures.
16

Desarrollo de algoritmos para la exploración submarina mediante vehículos autónomos con visión artificial monocular

Trabes, Emanuel 03 May 2018 (has links)
La motivación de esta tesis consistió en investigar el empleo de sistemas visuales monoculares en ambientes subacuáticos e implementar soluciones novedosas a los problemas complejos que en tales ambientes se presentan. Algunos de los principales aportes de este trabajo son: el desarrollo de algoritmos para la navegación en ambientes altamente auto-símiles, la implementación de un sistema monocular SLAM (Simultaneous localization and Mapping) denso orientado a su uso en ambientes subacuáticos, el desarrollo de una metodología robusta para la exploración retorno y revisita basada en SLAM, la implementación de un filtro de onda cáustica para ambientes tridimensionales. La validez de los resultados obtenidos teóricamente se verificó experimentalmente en ambientes subacuáticos controlados. / The motivation of this thesis consisted in researching the use of visual-monocular systems in underwater environments and to implement novel solutions to the complex problems that arise in such scenes. Some of the main contributions of this work are: the development of algorithms for navigation in highly self-similar scenes, the implementation of a dense monocular SLAM system (Simultaneous localization and Mapping) developed to be used in underwater scenes, the development of a robust methodology for exploration, return and revisiting based on SLAM, the implementation of a caustic wave filter for tridimentional environments. The validity of the obtained results were verified experimentally in controlled underwater environments.
17

Modelado de sistemas para visión realista en condiciones adversas y escenas sin estructura

Fuster-Guilló, Andrés 28 July 2003 (has links)
No description available.
18

Modelo de representación y procesamiento de movimiento para diseño de arquitecturas de tiempo real especializadas

Flórez-Revuelta, Francisco 18 December 2001 (has links)
Programa de Doctorado “Sistemas industriales, computación y reconocimiento de formas”. / Proyecto de investigación “Sistema de visión para navegación autónoma” (CICYT TAP98-0333-C03-03).
19

Aplicación de las técnicas de visión artificial como herramientas de expresión audiovisual en el campo del cine interactivo

Sanz Kirbis, David 20 March 2014 (has links)
En este estudio práctico sobre nuevas estrategias de lenguaje audiovisual se utilizan sistemas innovadores de hardware y software de visión artificial a la hora de buscar otras aplicaciones artísticas de los recursos cinematográficos tanto en la adquisición (encuadre, movimientos, fuera de campo, etc.) como en el montaje (fundidos, cortes, elipsis, metáforas, etc.). La hipótesis que aquí se propone es que las herramientas y técnicas de visión artificial pueden ser utilizadas para generar nuevos lenguajes audiovisuales en el campo del cine interactivo. Para demostrar esta hipótesis se siguen una serie de pasos consecutivos que han permitido llevar una investigación progresiva sobre la base de un estudio de referentes artísticos. A partir de este estudio se han sintetizado una serie de conceptos clave identificados tanto en las obras artísticas como en los debates críticos referenciados. Con estos conceptos como guía se han elaborado una serie de estudios experimentales previos al desarrollo de los prototipos que finalmente componen el sistema completo expuesto al público tras ser finalizado. Tanto de las pruebas de campo de los estudios experimentales como de la exposición del prototipo final se extrajeron una serie de conclusiones a modo de evaluación de los resultados globales del estudio. Finalmente, a partir de estas conclusiones se han perfilado posibles líneas futuras de investigación. Como resultado, por una parte se han obtenido relaciones entre sonido e imagen que son singulares en el empleo de recursos como el ritmo de cambio de plano, la interdependencia sonido-imagen o el tipo de sincronía sonido-imagen en comparación con los audiovisuales desarrollados habitualmente por otros medios en contextos similares; por otra parte se ha demostrado, por medio de una serie de experimentos de campo, que depositar parcialmente la responsabilidad creativa de audiovisuales en un dispositivo automático puede proporcionar nuevas experiencias estéticas al espectador. / Sanz Kirbis, D. (2014). Aplicación de las técnicas de visión artificial como herramientas de expresión audiovisual en el campo del cine interactivo [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/36531 / TESIS
20

Sistema de visión artificial basado en la detección de los movimientos del ojo, para mejorar la atención de los pacientes con síndrome de Guillain Barré

Polo Castro, Julio Cesar January 2015 (has links)
El síndrome de Guillain Barré es una polirradiculoneuropatía de evolución aguda o sub aguda que ataca progresivamente el sistema nervioso central impidiendo el movimiento de una persona progresivamente, empieza en los brazos y piernas y se extiende hasta el cuello, en el 50% de los casos se requiere de un ventilador mecánico, por lo que se considera una enfermedad critica, el problema de la enfermedad es que dificulta la comunicación entre los pacientes y su entorno, esto hace que durante el ciclo de la enfermedad, 1 año aproximadamente, este paciente presente complicaciones por la falta de comunicación. El presente proyecto de tesis está enfocado a desarrollar un Sistema de Visión artificial, basado en la detección de los movimientos del ojo que permitió solucionar el problema de la falta de comunicación de los pacientes con síndrome de Guillain Barre del Hospital Nacional Almanzor Aguinaga Asenjo. El SVA presenta una interfaz con algunos mensajes predefinidos, así como un teclado para escribir un mensaje propio, dirigiendo la mirada hacia el lugar que quieren realizar el “click”, referenciándose por un puntero que le permitirá asegurar el lugar exacto donde quiere clickear, para esto se usara la técnica de “tracking eye” o técnica de seguimiento de los ojos, mediante el uso de una cámara para captar los movimientos del ojo y poder usarlo en el sistema de visión artificial, que se desarrollara en base a la metodología propuesta por Kong y Nilson (2005), que consta de 3 etapas, la representación de la imagen, el procesamiento de la imagen y el análisis de la misma. La población de esta tesis es no probabilística por lo que se realiza en los 5 pacientes con SGB que se encontraban hospitalizados durante la realización de esta tesis.

Page generated in 0.085 seconds