• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 141
  • 37
  • 3
  • 3
  • 1
  • Tagged with
  • 185
  • 72
  • 46
  • 39
  • 34
  • 33
  • 30
  • 30
  • 30
  • 30
  • 30
  • 29
  • 28
  • 27
  • 23
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
171

A New Index for Detecting and Avoiding Type II Singularities for the Control of Non-Redundant Parallel Robots

Pulloquinga Zapata, José Luis 16 June 2023 (has links)
[ES] Los robots paralelos (PR por sus siglas en inglés) son mecanismos donde el efector final está unido a la base, mediante al menos dos cadenas cinemáticas abiertas. Los PRs ofrecen una gran capacidad de carga y alta precisión, lo que los hace adecuados para diversas aplicaciones, entre ellas la interacción persona-robot. Sin embargo, en las proximidades de una singularidad Tipo II (singularidad dentro del espacio de trabajo), un PR pierde el control sobre los movimientos del efector final. La pérdida de control representa un riesgo importante para los usuarios, especialmente en rehabilitación robótica. En las últimas décadas, los PR se han popularizado en la rehabilitación de miembros inferiores debido al aumento del número de personas que viven con limitaciones físicas. Así, esta tesis trata sobre la detección y evitación de singularidades de Tipo II para asegurar total control de un PR no redundante para la rehabilitación y diagnóstico de rodilla, denominado 3UPS+RPU. En la literatura, existen varios índices para detectar y medir la cercanía a una singularidad basados en métodos analíticos y geométricos. Sin embargo, algunos de estos índices carecen de significado físico y son incapaces de identificar los actuadores responsables de la pérdida de control. Esta tesis aporta dos novedosos índices para detectar y medir la proximidad a una singularidad de Tipo II, capaces de identificar el par de actuadores responsables de la singularidad. Los dos índices son los ángulos entre los componentes lineal (T_i,j) y angular (O_i,j) de dos Twist Screw de Salida (OTS por sus siglas en inglés) normalizados i,j. Una singularidad Tipo II es detectada cuando T_i,j = O_i,j = 0 y su proximidad se mide mediante los mínimos ángulos T_i,j (minT) y O_i,j (minO) para los casos plano y espacial, respectivamente. La eficacia de los índices T_i,j y O_i,j se evalúa de forma teórica y experimental en un robot 3UPS+RPU y un mecanismo de cinco barras. Además, se propone un procedimiento experimental para el adecuado establecimiento del límite de cercanía a una singularidad de Tipo II mediante la aproximación progresiva del PR a una singularidad y la medición de la última posición controlable. Posteriormente, se desarrollan dos nuevos algoritmos deterministas para liberar y evitar una singularidad de Tipo II basados en minT y minO para PR no redundantes. minT y minO se utilizan para identificar los dos actuadores a mover para liberar o evitar el PR de una singularidad. Ambos algoritmos requieren una medición precisa de la pose alcanzada por el efector final. El algoritmo para liberar un PR de una configuración singular se aplica con éxito en un controlador híbrido basado en visión artificial para el PR 3UPS+RPU. El controlador utiliza un sistema de fotogrametría para medir la pose del robot debido a la degeneración del modelo cinemático en las proximidades de una singularidad. El algoritmo de evasión de singularidades Tipo II se aplica a la planificación offline y online de trayectorias no singulares para un mecanismo de cinco barras y el PR 3UPS+RPU. Estas aplicaciones verifican el bajo coste computacional y la mínima desviación introducida en la trayectoria original por los nuevos algoritmos. La implementación directa de un controlador de fuerza/posición en el PR 3UPS+RPU es insegura porque el paciente podría llevar involuntariamente al PR a una singularidad. Por lo tanto, esta tesis concluye presentando un novedoso controlador de fuerza/posición complementado con el algoritmo de evasión de singularidades de Tipo II. El nuevo controlador se evalúa durante rehabilitación activa de una pierna de maniquí y una pierna humana no lesionada. Los resultados muestran que el nuevo controlador combinado mantiene el PR 3UPS+RPU lejos de configuraciones singulares con una desviación mínima de la trayectoria original. Por lo tanto, esta tesis habilita el 3UPS+RPU PR para la rehabilitación segura de miembros inferiores lesionados. / [CAT] Els robots paral·lels (PR per les seues sigles en anglés) són mecanismes on l'efector final està unit a la base, mitjançant almenys dues cadenes cinemàtiques obertes. Els PRs ofereixen una gran capacitat de càrrega i alta precisió, la qual cosa els fa adequats per a diverses aplicacions, entre elles la interacció persona-robot. No obstant això, en les proximitats d'una singularitat Tipus II (singularitat dins de l'espai de treball), un PR perd el control sobre els moviments de l'efector final. La pèrdua de control representa un risc important per als usuaris, especialment en rehabilitació robòtica. En les últimes dècades, els PR s'han popularitzat en la rehabilitació de membres inferiors a causa de l'augment del nombre de persones que viuen amb limitacions físiques. Així, aquesta tesi tracta sobre la detecció i evació de singularitats de Tipus II per a assegurar total control d'un PR no redundant per a la rehabilitació i diagnòstic de genoll, denominat 3UPS+RPU. En la literatura, existeixen diversos índexs per a detectar i mesurar la proximitat a una singularitat basats en mètodes analítics i geomètrics. No obstant això, alguns d'aquests índexs manquen de significat físic i són incapaços d'identificar els actuadors responsables de la pèrdua de control. Aquesta tesi aporta dos nous índexs per a detectar i mesurar la proximitat a una singularitat de Tipus II, capaços d'identificar el parell d'actuadors responsables de la singularitat. Els dos índexs són els angles entre els components lineal (T_i,j) i angular (O_i,j) de dues Twist Screw d'Eixida (OTS per les seues sigles en engonals) normalitzats i,j. Una singularitat Tipus II és detectada quan T_i,j = O_i,j = 0 i la seua proximitat es mesura mitjançant els minimos angles T_i,j (minT) i O_i,j (minO) per als casos pla i espacial, respectivament. L'eficàcia dels índexs T_i,j i O_i,j es evalua de manera teòrica i experimental en un robot 3UPS+RPU i un mecanisme de cinc barres. A més, es proposa un procediment experimental per a l'adequat establiment del límit de proximitat a una singularitat de Tipus II mitjançant l'aproximació progressiva del PR a una singularitat i el mesurament de l'última posició controlable. Posteriorment, es desenvolupen dos nous algorismes deterministes per a alliberar i evadir una singularitat de Tipus II basats en minT i minO per a PR no redundants. minT i minO s'utilitzen per a identificar els dos actuadors a moure per a alliberar o evadir el PR d'una singularitat. Aquests algorismes requereixen un mesurament precís de la posa aconseguida per l'efector final. L'algorisme per a alliberar un PR d'una configuració singular s'aplica amb èxit en un controlador híbrid basat en visió artificial per al PR 3UPS+RPU. El controlador utilitza un sistema de fotogrametria per a mesurar la posa del robot a causa de la degeneració del model cinemàtic en les proximitats d'una singularitat. L'algorisme d'evació de singularitats Tipus II s'aplica a la planificació offline i en línia de trajectòries no singulars per a un mecanisme de cinc barres i el PR 3UPS+RPU. Aquestes aplicacions verifiquen el baix cost computacional i la mínima desviació introduïda en la trajectòria original pels nous algorismes. La implementació directa d'un controlador de força/posició en el PR 3UPS+RPU és insegura perquè el pacient podria portar involuntàriament al PR a una singularitat. Per tant, aquesta tesi conclou presentant un nou controlador de força/posició complementat amb l'algorisme d'evació de singularitats de Tipus II. El nou controlador s'avalua durant la rehabilitació activa d'una cama de maniquí i una cama humana no lesionada. Els resultats mostren que el nou controlador combinat manté el PR 3UPS+RPU lluny de configuracions singulars amb una desviació mínima de la trajectòria original. Per tant, aquesta tesi habilita el 3UPS+RPU PR per a la rehabilitació segura dels membres inferiors lesionats. / [EN] Parallel Robots (PR)s are mechanisms where the end-effector is linked to the base by at least two open kinematics chains. The PRs offer a high payload and high accuracy, making them suitable for various applications, including human robot interaction. However, in proximity to a Type II singularity (singularity within the workspace), a PR loses control over the movements of the end-effector. The loss of control represents a major risk for users, especially in robotic rehabilitation. In the last decades, PRs have become popular in lower limb rehabilitation because of the increment in the number of people living with physical limitations. Thus, this thesis is about the detection and avoidance of Type II singularities to ensure complete control of a non-redundant PR for knee rehabilitation and diagnosis named 3UPS+RPU. In the literature, several indices exist to detect and measure the closeness to a singular configuration based on analytical and geometrical methods. However, some of these indices have no physical meaning, and they are unable to identify the actuators responsible for the loss of control. This thesis contributes two novel indices to detect and measure the proximity to a Type II singularity capable of identifying the pair of actuators responsible for the singularity. The two indices are the angles between the linear (T_i,j) and the angular (O_i,j) components of two i,j normalised Output Twist Screws (OTSs). A Type II singularity is detected when the angles T_i,j = O_i,j = 0 and its closeness is measured by the minimum T_i,j (minT) and minimum O_i,j (minO) for planar and spatial cases, respectively. The effectiveness of the indices T_i,j and O_i,j is evaluated from a theoretical and experimental perspective in a 3UPS+RPU and a five bars mechanism. Moreover, an experimental procedure is proposed for setting a proper limit of closeness to a Type II singularity by the progressive approach of the PR to singular configuration and measuring the last controllable pose. Subsequently, two novel deterministic algorithms for releasing and avoiding Type II singularities based on minT and minO are developed for non-redundant PRs. The minT and minO are used to identify the two actuators to move for release or prevent the PR from the singularity. Both algorithms require an accurate measuring of the pose reached by the end-effector. The algorithm to release a PR from a singular configuration is successfully applied in a vision-based hybrid controller for the 3UPS+RPU PR. The controller uses a photogrammetry system to measure the pose of the robot due to the degeneration of the kinematic model in the vicinity of a singularity. The Type II singularity avoidance algorithm is applied to offline and online free-singularity trajectory planning for a five-bar mechanism and the 3UPS+RPU PR. These applications verify the low computation cost and the minimum deviation introduced in the original trajectory for both novel algorithms. The direct implementation of a force/position controller in the 3UPS+RPU PR is unsafe because the patient could unintentionally drive the PR to a Type II singularity. Therefore, this thesis concludes by presenting a novel force/position controller complemented with the Type II singularity avoidance algorithm. The complemented controller is evaluated during patient-active exercises in a mannequin leg and an uninjured human limb. The results show that the novel combined controller keeps the 3UPS+RPU PR far from singular configurations with a minimum deviation on the original trajectory. Hence, this thesis enables the 3UPS+RPU PR for the safe rehabilitation of injured lower limbs. / Pulloquinga Zapata, JL. (2023). A New Index for Detecting and Avoiding Type II Singularities for the Control of Non-Redundant Parallel Robots [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/194271
172

Learning from limited labelled data: contributions to weak, few-shot, and unsupervised learning

Silva Rodríguez, Julio José 12 December 2022 (has links)
Tesis por compendio / [ES] En la última década, el aprendizaje profundo (DL) se ha convertido en la principal herramienta para las tareas de visión por ordenador (CV). Bajo el paradigma de aprendizaje supervisado, y gracias a la recopilación de grandes conjuntos de datos, el DL ha alcanzado resultados impresionantes utilizando redes neuronales convolucionales (CNNs). Sin embargo, el rendimiento de las CNNs disminuye cuando no se dispone de suficientes datos, lo cual dificulta su uso en aplicaciones de CV en las que sólo se dispone de unas pocas muestras de entrenamiento, o cuando el etiquetado de imágenes es una tarea costosa. Estos escenarios motivan la investigación de estrategias de aprendizaje menos supervisadas. En esta tesis, hemos explorado diferentes paradigmas de aprendizaje menos supervisados. Concretamente, proponemos novedosas estrategias de aprendizaje autosupervisado en la clasificación débilmente supervisada de imágenes histológicas gigapixel. Por otro lado, estudiamos el uso del aprendizaje por contraste en escenarios de aprendizaje de pocos disparos para la vigilancia automática de cruces de ferrocarril. Por último, se estudia la localización de lesiones cerebrales en el contexto de la segmentación no supervisada de anomalías. Asimismo, prestamos especial atención a la incorporación de conocimiento previo durante el entrenamiento que pueda mejorar los resultados en escenarios menos supervisados. En particular, introducimos proporciones de clase en el aprendizaje débilmente supervisado en forma de restricciones de desigualdad. Además, se incorpora la homogeneización de la atención para la localización de anomalías mediante términos de regularización de tamaño y entropía. A lo largo de esta tesis se presentan diferentes métodos menos supervisados de DL para CV, con aportaciones sustanciales que promueven el uso de DL en escenarios con datos limitados. Los resultados obtenidos son prometedores y proporcionan a los investigadores nuevas herramientas que podrían evitar la anotación de cantidades masivas de datos de forma totalmente supervisada. / [CA] En l'última dècada, l'aprenentatge profund (DL) s'ha convertit en la principal eina per a les tasques de visió per ordinador (CV). Sota el paradigma d'aprenentatge supervisat, i gràcies a la recopilació de grans conjunts de dades, el DL ha aconseguit resultats impressionants utilitzant xarxes neuronals convolucionals (CNNs). No obstant això, el rendiment de les CNNs disminueix quan no es disposa de suficients dades, la qual cosa dificulta el seu ús en aplicacions de CV en les quals només es disposa d'unes poques mostres d'entrenament, o quan l'etiquetatge d'imatges és una tasca costosa. Aquests escenaris motiven la investigació d'estratègies d'aprenentatge menys supervisades. En aquesta tesi, hem explorat diferents paradigmes d'aprenentatge menys supervisats. Concretament, proposem noves estratègies d'aprenentatge autosupervisat en la classificació feblement supervisada d'imatges histològiques gigapixel. D'altra banda, estudiem l'ús de l'aprenentatge per contrast en escenaris d'aprenentatge de pocs trets per a la vigilància automàtica d'encreuaments de ferrocarril. Finalment, s'estudia la localització de lesions cerebrals en el context de la segmentació no supervisada d'anomalies. Així mateix, prestem especial atenció a la incorporació de coneixement previ durant l'entrenament que puga millorar els resultats en escenaris menys supervisats. En particular, introduïm proporcions de classe en l'aprenentatge feblement supervisat en forma de restriccions de desigualtat. A més, s'incorpora l'homogeneïtzació de l'atenció per a la localització d'anomalies mitjançant termes de regularització de grandària i entropia. Al llarg d'aquesta tesi es presenten diferents mètodes menys supervisats de DL per a CV, amb aportacions substancials que promouen l'ús de DL en escenaris amb dades limitades. Els resultats obtinguts són prometedors i proporcionen als investigadors noves eines que podrien evitar l'anotació de quantitats massives de dades de forma totalment supervisada. / [EN] In the last decade, deep learning (DL) has become the main tool for computer vision (CV) tasks. Under the standard supervised learnng paradigm, and thanks to the progressive collection of large datasets, DL has reached impressive results on different CV applications using convolutional neural networks (CNNs). Nevertheless, CNNs performance drops when sufficient data is unavailable, which creates challenging scenarios in CV applications where only few training samples are available, or when labeling images is a costly task, that require expert knowledge. Those scenarios motivate the research of not-so-supervised learning strategies to develop DL solutions on CV. In this thesis, we have explored different less-supervised learning paradigms on different applications. Concretely, we first propose novel self-supervised learning strategies on weakly supervised classification of gigapixel histology images. Then, we study the use of contrastive learning on few-shot learning scenarios for automatic railway crossing surveying. Finally, brain lesion segmentation is studied in the context of unsupervised anomaly segmentation, using only healthy samples during training. Along this thesis, we pay special attention to the incorporation of tasks-specific prior knowledge during model training, which may be easily obtained, but which can substantially improve the results in less-supervised scenarios. In particular, we introduce relative class proportions in weakly supervised learning in the form of inequality constraints. Also, attention homogenization in VAEs for anomaly localization is incorporated using size and entropy regularization terms, to make the CNN to focus on all patterns for normal samples. The different methods are compared, when possible, with their supervised counterparts. In short, different not-so-supervised DL methods for CV are presented along this thesis, with substantial contributions that promote the use of DL in data-limited scenarios. The obtained results are promising, and provide researchers with new tools that could avoid annotating massive amounts of data in a fully supervised manner. / The work of Julio Silva Rodríguez to carry out this research and to elaborate this dissertation has been supported by the Spanish Government under the FPI Grant PRE2018-083443. / Silva Rodríguez, JJ. (2022). Learning from limited labelled data: contributions to weak, few-shot, and unsupervised learning [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/190633 / Compendio
173

Forma y Consciencia: Fundamentos para una Teoría Yántrica del Dibujo

Sevilla Seguí, Clara María 02 May 2016 (has links)
[EN] This PhD in Fine Arts is the introduction to a Yantric Theory of Drawing as a result of researching plastic forms from the universal principles present in perceptive reality. Based on the yantra as an active element in the drawing of a integral mandalic vision, Drawing re-presents a vision of the world based on aesthetic distance, in which the sum and multiplication of all the parts is contemplated from one point of view, a naked eye. This perspective is transdimensional, whereby co-creative man is capable of making his own vision real, enjoying the aesthetic experience through the practice of Art. Art is the fifth element in which contact with Beauty takes place in a disinterested way. This thesis in its Form and Consciousness explores the fundaments of these aesthetic formulations through its most yogic roots in India. We will add a metaphor to such aesthetic formulations and explain them through the voice of the artist, in which the process of transmutation of the matter, the transformation of the Nature into Art takes place. The shilpi yogi is the inspiration and aspiration of the being which indwells the imagery artist who develops images of himself, the imprints of personal consciousness transcended through transpersonal art forms. Its being, its Presence, can be modulated through plasticity, from the purest abstraction to the finest figurative art. This thesis represents a plastic voyage to the very heart of India, in which an artist and a sadhu go hand in hand as a symbolic encounter between indosophy and the sublime plastic representative of the tragedy of duality, sunk in life under the weight of chiaroscuro. Light is the Great Symbolic Metaphor and the primordial object of the mystery of Science. The space of the heart is the fifth plastic element on which we base our Yantric Theory of Drawing. We use this to reintegrate the coherence of Art from all times and places, reinterpreting it from an optimistic historical standpoint. Drawing gives us the power to make this real (maya-magic), through the yantric vision. This thesis is the foundational preface to a way to make real the dream of the imagined, a function which Art, the original inoculant, has had throughout history. Such a possibility of form-function-power is endorsed by the most ancient foundations of civilization: the great symbolic potential which was crystalised in Man, the complex system of ancient times which doesn't respond to limits, but rather to constellations, the tantra, inspiration and aspiration of quantic meta-physics. / [ES] Esta tesis doctoral en Bellas Artes es la introducción de una Teoría Yántrica del Dibujo como resultado de una investigación de la forma plástica desde principios universales presentes en la realidad perceptiva. Basada en el yantra como elemento activo dibujístico de una visión mandálica integral, el Dibujo viene a re-presentar una visión del mundo basada en la distancia estética, en la que la suma y multiplicación de todas las partes es contemplada desde un punto de vista y un ojo genuino, transdimensional, en el que el hombre co-creativo es capaz de realizar su propia visión y disfrutar de la experiencia estética a través de la práctica del Arte. El Arte es el quinto elemento en el que el contacto con la Belleza de modo desinteresado tiene lugar. Esta tesis, como Forma y Consciencia explora los fundamentos de estas formulaciones estéticas, a través de sus raíces más yóguicas, en India. A tales formulaciones estéticas les añadimos una metáfora y las explicamos a través de la voz del artista, en el que se da el proceso de transmutación de la materia, la transformación de la Naturaleza en Arte. El silpi yogui es la inspiración y aspiración del ser que habita en el artista imaginero, quien desarrolla sus propias imágenes o la huella de la consciencia personal que se supera a sí misma a través de la plástica de lo trans-personal. Su ser, solo Presencia, se deja modular en el vehículo plástico desde la más pura abstracción a la más fina figuración. Esta tesis representa un viaje plástico al corazón de la India, en el que van de la mano una artista y un sadhu como encuentro simbólico de la indosofía y el sublime representante plástico de la tragedia de la dualidad, sumido en la vida y el peso del claroscuro. La Luz es la Gran Metáfora simbólica y el objeto de misterio primordial de la Ciencia. El espacio del corazón es el quinto elemento plástico en el que se basa nuestra Teoría Yántrica del Dibujo para reintegrar la coherencia del Arte de todos los tiempos y lugares, desde un punto de vista histórico optimista que está en nuestras manos hacer real (magia-maya), a través de la visión yántrica para el Arte, a que da pie el Dibujo. Esta tesis es el prolegómeno fundacional de una vía de hacer real el sueño de lo imaginado, como ha venido haciendo el Arte como inóculo original a lo largo de la Historia. Tal posibilidad de forma-función-poder está avalada por los más antiguos fundamentos de la civilización, el gran potencial simbólico que fue posible cristalizar en el Hombre, el sistema complejo de la antigüedad que no responde a límites, sino a constelaciones, el tantra, inspiración y aspiración de la meta-física cuántica. CLARA M. SEVILLA SEGUÍ / [CAT] Aquesta tesi doctoral en Belles Arts és la introducció d'una Teoria Iàntrica del Dibuix com a resultat d'una investigació de la forma plàstica des de principis universals presents en la realitat perceptiva. Basada en el iantra com a element actiu del dibuix d'una visió integral del mandala, el Dibuix vindria a re-presentar una visió del món basada en la distància estètica, en què la suma i multiplicació de totes les parts és contemplada des d'un punt de vista i un ull genuí, "transdimensional", en què l'home co-creatiu és capaç de realitzar la pròpia visió i gaudir de l'experiència estètica a través de la pràctica de l'Art. L'Art és el cinquè element en què el contacte amb la Bellesa hi té lloc de forma desinteressada. Aquesta tesi, en tant que Forma i Consciència, explora els fonaments d'aquestes formulacions estètiques mitjançant unes arrels basades en sistema del ioga, pel que fa a l'Índia. A aitals formulacions estètiques els afegim una metàfora, i les expliquem per mitjà de la veu de l'artista, l'individu en qui es produeix el procés de transmutació de la matèria, la transformació de la Natura en Art. El silpi iogui és la inspiració i aspiració de l'ésser que habita en l'artista imaginer, qui desenvolupa les seves pròpies imatges o l'empremta de la consciència personal que se supera a si mateixa a través de la pràctica d'allò trans-personal. El seu ésser, tan sols Presència, es deixa modular en el vehicle plàstic des de la més pura abstracció fins a la figuració més fina. Aquesta tesi representa un viatge plàstic al cor de l'Índia, en què una artista i un sadhu, plegats, conflueixen de manera simbòlica en la indosofia i el sublim representant plàstic de la tragèdia de la dualitat, immers en la vida i el pes del clarobscur. La Llum és la Gran Metàfora simbòlica i l'objecte primordial de la ciència. L'espai del cor és el cinquè element plàstic en què es basa la nostra Teoria Iàntrica del Dibuix, el propòsit del qual consisteix a reintegrar la coherència de l'Art de tots els temps i llocs, des d'un punt de vista històric i optimista, que tenim a les nostres mans convertir en real (màgia-maia) a través de la visió iàntrica per a l'Art, a què dóna peu el Dibuix. Aquesta tesi és el prolegomen fundacional d'una via per tal de materialitzar el somni respecte d'allò imaginat, com ha vingut fent l'Art com a inòcul originari al llarg de la Història. Aquesta possibilitat de forma-funció-poder és avalada pels més antics fonaments de la civilització, el gran potencial simbòlic que fou possible cristal·litzar en la figura de l'Home, el sistema complex de l'antiguitat que no respon a límits, sinó a constel·lacions, el tantra: inspiració i aspiració de la meta-física quàntica. / Sevilla Seguí, CM. (2016). Forma y Consciencia: Fundamentos para una Teoría Yántrica del Dibujo [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/63259 / TESIS
174

Development and Evaluation of a Road Marking Recognition Algorithm implemented on Neuromorphic Hardware / Utveckling och utvärdering av en algoritm för att läsa av vägbanan, som implementeras på neuromorfisk hårdvara

Bou Betran, Santiago January 2022 (has links)
Driving is one of the most common and preferred forms of transport used in our actual society. However, according to studies, it is also one of the most dangerous. One solution to increase safety on the road is applying technology to automate and prevent avoidable human errors. Nevertheless, despite the efforts to obtain reliable systems, we have yet to find a reliable and safe enough solution for solving autonomous driving. One of the reasons is that many drives are done in conditions far from the ideal, with variable lighting conditions and fast-paced, unpredictable environments. This project develops and evaluates an algorithm that takes the input of dynamic vision sensors (DVS) and runs on neuromorphic spiking neural networks (SNN) to obtain a robust road lane tracking system. We present quantitative and qualitative metrics that evaluate the performance of lane recognition in low light conditions against conventional algorithms. This project is motivated by the main advantages of neuromorphic vision sensors: recognizing a high dynamic range and allowing a high-speed image capture. Another improvement of this system is the computational speed and power efficiency that characterize neuromorphic hardware based on spiking neural networks. The results obtained show a similar accuracy of this new algorithm compared to previous implementations on conventional hardware platforms. Most importantly, it accomplishes the proposed task with lower latency and computing power requirements than previous algorithms. / Att köra bil är ett av de vanligaste och mest populära transportsätten i vårt samhälle. Enligt forskningen är det också ett av de farligaste. En lösning för att öka säkerheten på vägarna är att med teknikens hjälp automatisera bilkörningen och på så sätt förebygga misstag som beror på den mänskliga faktorn. Trots ansträngningarna för att få fram tillförlitliga system har man dock ännu inte hittat en tillräckligt tillförlitlig och säker lösning för självkörande bilar. En av orsakerna till det är att många körningar sker under förhållanden som är långt ifrån idealiska, med varierande ljusförhållanden och oförutsägbara miljöer i höga hastigheter. I det här projektet utvecklar och utvärderar vi en algoritm som tar emot indata från dynamiska synsensorer (Dynamic Vision Sensors, DVS) och kör datan på neuromorfiska pulserande neuronnät (Spiking Neural Networks, SNN) för att skapa ett robust system för att läsa av vägbanan. Vi presenterar en kvantitativ och kvalitativ utvärdering av hur väl systemet läser av körbanans linjer i svagt ljus, och jämför därefter resultaten med dem för tidigare algoritmer. Detta projekt motiveras av de viktigaste fördelarna med neuromorfiska synsensorer: brett dynamiskt omfång och hög bildtagningshastighet. En annan fördel hos detta system är den korta beräkningstiden och den energieffektivitet som kännetecknar neuromorfisk hårdvara baserad på pulserande neuronnät. De resultat som erhållits visar att den nya algoritmen har en liknande noggrannhet som tidigare algoritmer på traditionella hårdvaruplattformar. I jämförelse med den traditionella tekniken, utför algoritmen i den föreliggande studien sin uppgift med kortare latenstid och lägre krav på processorkraft. / La conducción es una de las formas de transporte más comunes y preferidas en la actualidad. Sin embargo, diferentes estudios muestran que también es una de las más peligrosas. Una solución para aumentar la seguridad en la carretera es aplicar la tecnología para automatizar y prevenir los evitables errores humanos. No obstante, a pesar de los esfuerzos por conseguir sistemas fiables, todavía no hemos encontrado una solución suficientemente fiable y segura para resolver este reto. Una de las razones es el entorno de la conducción, en situaciones que distan mucho de las ideales, con condiciones de iluminación variables y entornos rápidos e imprevisibles. Este proyecto desarrolla y evalúa un algoritmo que toma la entrada de sensores de visión dinámicos (DVS) y ejecuta su computación en redes neuronales neuromórficas (SNN) para obtener un sistema robusto de seguimiento de carriles en carretera. Presentamos métricas cuantitativas y cualitativas que evalúan el rendimiento del reconocimiento de carriles en condiciones de poca luz, frente a algoritmos convencionales. Este proyecto está motivado por la validación de las ventajas de los sensores de visión neuromórficos: el reconocimiento de un alto rango dinámico y la captura de imágenes de alta velocidad. Otra de las mejoras que se espera de este sistema es la velocidad de procesamiento y la eficiencia energética que caracterizan al hardware neuromórfico basado en redes neuronales de impulsos. Los resultados obtenidos muestran una precisión similar entre el nuevo algoritmo en comparación con implementaciones anteriores en plataformas convencionales. Y lo que es más importante, realiza la tarea propuesta con menor latencia y requisitos de potencia de cálculo.
175

Estudios electrorretinográficos en modelos de neurodegeneración en el sistema visual del roedor adulto

Alarcón Martínez, Luis 23 October 2009 (has links)
Las enfermedades neurodegenerativas cursan con la degeneración y muerte de las neuronas las cuales son incapaces de suplir su propia muerte. Debido a esta característica enfermedades como el Alzheimer, el Parkinson o el Glaucoma no tienen cura en la actualidad. La retina es una proyección del sistema nervioso central (SNC) encapsulada en el globo ocular y aislada del resto del SNC, lo que la hace fácilmente accesible a la manipulación experimental. En este trabajo estudiamos las alteraciones funcionales de la retina con el electrorretinograma de campo completo (ERG), técnica basada en el registro de la respuesta eléctrica retiniana tras la presentación de un estímulo de luz homogéneo. Así hemos estudiado los efectos de la sección del nervio, del aumento de presión intraocular y de la fototoxicidad, dichas lesiones afectan selectivamente a determinadas poblaciones neuronales retinianas e imitan enfermedades neurodegenerativas como el Glaucoma o la Degeneración Macular Asociada a la Edad. / Neurodegenerative diseases are characterized by degeneration and death of neurons which are unable to recover after a given insult, thus impairing functional recuperation. Because of this, there is no cure for diseases such as Alzheimer, Parkinson or Glaucoma. The retina is a projection of the central nervous system (CNS) located in the eye and therefore, isolated from the rest of the CNS. This makes the retina a very good model for experimental manipulation. In this work we have studied the functional changes in the retina by full field electroretinograme (ERG). This technique records the electric response of the retina after presentation of homogeneous light stimuli. We have studied the effects that optic nerve sections, increase of the intraocular pressure and phototoxicity have on ERG recordings. These lesions impair selectively certain retinal neuronal populations and imitate neurodegenerative diseases as Glaucoma or Age-related Macular Degeneration.
176

Cellular Nonlinear Networks: optimized implementation on FPGA and applications to robotics

Albó Canals, Jordi 18 June 2012 (has links)
L'objectiu principal d'aquesta tesi consisteix a estudiar la factibilitat d'implementar un sensor càmera CNN amb plena funcionalitat basat en FPGA de baix cost adequat per a aplicacions en robots mòbils. L'estudi dels fonaments de les xarxes cel•lulars no lineals (CNNs) i la seva aplicació eficaç en matrius de portes programables (FPGAs) s'ha complementat, d'una banda amb el paral•lelisme que s'estableix entre arquitectura multi-nucli de les CNNs i els eixams de robots mòbils, i per l'altre banda amb la correlació dinàmica de CNNs i arquitectures memristive. A més, els memristors es consideren els substituts dels futurs dispositius de memòria flash per la seva capacitat d'integració d'alta densitat i el seu consum d'energia prop de zero. En el nostre cas, hem estat interessats en el desenvolupament d’FPGAs que han deixat de ser simples dispositius per a la creació ràpida de prototips ASIC per esdevenir complets dispositius reconfigurables amb integració de la memòria i els elements de processament general. En particular, s'han explorat com les arquitectures implementades CNN en FPGAs poden ser optimitzades en termes d’àrea ocupada en el dispositiu i el seu consum de potència. El nostre objectiu final ens ah portat a implementar de manera eficient una CNN-UM amb complet funcionament a un baix cost i baix consum sobre una FPGA amb tecnología flash. Per tant, futurs estudis sobre l’arquitectura eficient de la CNN sobre la FPGA i la interconnexió amb els robots comercials disponibles és un dels objectius d'aquesta tesi que se seguiran en les línies de futur exposades en aquest treball. / El objetivo principal de esta tesis consiste en estudiar la factibilidad de implementar un sensor cámara CNN con plena funcionalidad basado en FPGA de bajo coste adecuado para aplicaciones en robots móviles. El estudio de los fundamentos de las redes celulares no lineales (CNNs) y su aplicación eficaz en matrices de puertas programables (FPGAs) se ha complementado, por un lado con el paralelismo que se establece entre arquitectura multi -núcleo de las CNNs y los enjambres de robots móviles, y por el otro lado con la correlación dinámica de CNNs y arquitecturas memristive. Además, los memristors se consideran los sustitutos de los futuros dispositivos de memoria flash por su capacidad de integración de alta densidad y su consumo de energía cerca de cero. En nuestro caso, hemos estado interesados en el desarrollo de FPGAs que han dejado de ser simples dispositivos para la creación rápida de prototipos ASIC para convertirse en completos dispositivos reconfigurables con integración de la memoria y los elementos de procesamiento general. En particular, se han explorado como las arquitecturas implementadas CNN en FPGAs pueden ser optimizadas en términos de área ocupada en el dispositivo y su consumo de potencia. Nuestro objetivo final nos ah llevado a implementar de manera eficiente una CNN-UM con completo funcionamiento a un bajo coste y bajo consumo sobre una FPGA con tecnología flash. Por lo tanto, futuros estudios sobre la arquitectura eficiente de la CNN sobre la FPGA y la interconexión con los robots comerciales disponibles es uno de los objetivos de esta tesis que se seguirán en las líneas de futuro expuestas en este trabajo. / The main goal of this thesis consists in studying the feasibility to implement a full-functionality CNN camera sensor based on low-cost FPGA device suitable for mobile robotic applications. The study of Cellular Nonlinear Networks (CNNs) fundamentals and its efficient implementation on Field Programmable Gate Arrays (FPGAs) has been complemented, on one side with the parallelism established between multi-core CNN architecture and swarm of mobile robots, and on the other side with the dynamics correlation of CNNs and memristive architectures. Furthermore, memristors are considered the future substitutes of flash memory devices because of its capability of high density integration and its close to zero power consumption. In our case, we have been interested in the development of FPGAs that have ceased to be simple devices for ASIC fast prototyping to become complete reconfigurable devices embedding memory and processing elements. In particular, we have explored how the CNN architectures implemented on FPGAs can be optimized in terms of area occupied on the device or power consumption. Our final accomplishment has been implementing efficiently a fully functional reconfigurable CNN-UM on a low-cost low-power FPGA based on flash technology. Therefore, further studies on an efficient CNN architecture on FPGA and interfacing it with commercially-available robots is one of the objectives of this thesis that will be followed in the future directions exposed in this work.
177

Appearance-based mapping and localization using feature stability histograms for mobile robot navigation

Bacca Cortés, Eval Bladimir 20 June 2012 (has links)
This work proposes an appearance-based SLAM method whose main contribution is the Feature Stability Histogram (FSH). The FSH is built using a voting schema, if the feature is re-observed, it will be promoted; otherwise it progressively decreases its corresponding FSH value. The FSH is based on the human memory model to deal with changing environments and long-term SLAM. This model introduces concepts of Short-Term memory (STM), which retains information long enough to use it, and Long-Term memory (LTM), which retains information for longer periods of time. If the entries in the STM are rehearsed, they become part of the LTM (i.e. they become more stable). However, this work proposes a different memory model, allowing to any input be part of the STM or LTM considering the input strength. The most stable features are only used for SLAM. This innovative feature management approach is able to cope with changing environments, and long-term SLAM. / Este trabajo propone un método de SLAM basado en apariencia cuya principal contribución es el Histograma de Estabilidad de Características (FSH). El FSH es construido por votación, si una característica es re-observada, ésta será promovida; de lo contrario su valor FSH progresivamente es reducido. El FSH es basado en el modelo de memoria humana para ocuparse de ambientes cambiantes y SLAM a largo término. Este modelo introduce conceptos como memoria a corto plazo (STM) y largo plazo (LTM), las cuales retienen información por cortos y largos periodos de tiempo. Si una entrada a la STM es reforzada, ésta hará parte de la LTM (i.e. es más estable). Sin embargo, este trabajo propone un modelo de memoria diferente, permitiendo a cualquier entrada ser parte de la STM o LTM considerando su intensidad. Las características más estables son solamente usadas en SLAM. Esta innovadora estrategia de manejo de características es capaz de hacer frente a ambientes cambiantes y SLAM de largo término.
178

Diseño de un plan estratégico para mejorar la gestión administrativa de la empresa TECEME Perú S.A.C.

Cachay Maluquish, Josselyne Grace, Eguiluz Rivera, Arlett Katherin, Villanueva Campana, Pamela Milagros January 2015 (has links)
La Tesis realizada consiste en la Elaboración de un Plan Estratégico para la Empresa Teceme Perú SAC, con el objetivo de proporcionar los pasos para que la organización pueda implementar el plan estratégico y así se pueda alcanzar los objetivos a corto y largo plazo para lograr la mejora de la empresa. Con la realización del plan estratégico se cumplen los siguientes objetivos: Con el análisis interno y externo, se logró identificar las fortalezas, debilidades, oportunidades y amenazas reflejadas en la matriz FODA. Para realizar el análisis interno se establecieron reuniones con los miembros de la gerencia de la organización con el objetivo de realizar el levantamiento de información y para el análisis externo se analizaron los factores externos a la organización que pudieran perjudicar a la organización. La evaluación de la misión, visión y valores corporativos con el objetivo de identificar si están alineados a la razón de ser de la empresa, a los objetivos a futuro y a su cultura. Para ello se establecieron reuniones con los gerentes de la organización en la cual se definieron características que deben de tener y se encuestaron a los colaboradores para la obtención de puntajes y así se pudo obtener la misión, visión y valores corporativos evaluados. Formulación de estrategias para que así la organización pueda cumplir con los objetivos estratégicos formulados. Para lograr la formulación de las estrategias se tomó como base los objetivos estratégicos definidos de acuerdo al análisis FODA. Formulación de indicadores, para que la organización pueda tener control de la gestión. Para la formulación de indicadores se elaboró el mapa estratégico, el cual nos ayudó a identificas las cuatro perspectivas existentes, y así poder definir los indicadores para cada perspectiva. The thesis is made in developing a Strategic Plan for the Company Teceme Peru SAC, in order to provide the steps to enable the organization to implement the strategic plan and thus can achieve the objectives in the short and long term to improve of the company. With the completion of the strategic plan the following objectives are met: With internal and external analysis, it was possible to identify the strengths, weaknesses, opportunities and threats reflected in the SWOT matrix. For internal analysis meetings with members of management of the organization with the aim of making the collection of information they were established for external analysis and factors outside the organization that might harm the organization were analyzed. The assessment mission, vision and corporate values in order to identify if they are aligned to the rationale of the company, future goals and culture. For this meeting with the managers of the organization in which features must have defined and surveyed employees to obtain scores and thus could get the mission, vision and corporate values assessed established. Formulating strategies so that the organization can meet the stated strategic ambitions. To achieve the formulation of strategies was based the strategic objectives defined according to SWOT analysis. Formulation of indicators, so that the organization can have management control. For the formulation of indicators the strategic map, which helped to identify the four existing prospects, so you can define indicators for each perspective was developed.
179

Voces femeninas de la América decimonónica: Juana Manuela Gorriti, Soledad Acosta de Samper y Joséphine Marchand-Dandurand en sus diarios íntimos y publicaciones periódicas

Michaud-Mastoras, Danaé 07 1900 (has links)
Cette recherche a reçu le soutien financier du CRSH, de la FESP et du DLLM. / Le XIXe siècle représente une période prépondérante de l'histoire des femmes en Occident, celle de la naissance d’une conscience féminine de nature publique, des premiers balbutiements du féminisme. Dans ce contexte, il est important d'étudier où se situent certaines personnalités féminines dans leur société. À cette époque, deux pratiques d'écriture connaissent leur apogée, la presse et le journal intime, qui permettent aux femmes de prendre la parole et d’intervenir dans la sphère publique. Ces formes d'écriture peuvent être considérées comme des espaces discursifs nés de conflits et de tensions sociales; elles sont le produit d’une même personne qui commente l’actualité de façon quotidienne, hebdomadaire ou mensuelle. La femme de lettres reconstitue les événements et faits du passé, transmet ses observations et opinions personnelles sur divers sujets; elle remet aussi en question le discours normatif institutionnel à partir de ses propres expériences et connaissances. Les écritures intime et journalistique témoignent de la vision plurielle du monde des intellectuelles et de leur participation au devenir historique, d'où l'intérêt de les étudier en parallèle dans ce travail. À travers l'étude d’écrits intimes et journalistiques, l'objectif principal de cette thèse est de faire entendre trois voix féminines de l’Amérique face à la culture patriarcale: celles de l'Argentine Juana Manuela Gorriti, de la Colombienne Soledad Acosta de Samper et de la Québécoise Joséphine Marchand-Dandurand. Nous nous demandons dans quelle mesure leur écriture s’inscrit dans un projet collectif lié à l’avancement des femmes et de la nation. L’hypothèse qui guide notre travail est que les auteures développent et partagent une écriture de dénonciation et de revendication liée à la situation des femmes et de la nation. Nous partons du contexte universel d'invisibilité des femmes, de leur manque de reconnaissance comme sujets de la société du XIXe siècle ; nous suivons la ligne foucaultienne de la généalogie, en y ajoutant la variable de genre, dans le but de récupérer les traces d’une contre-mémoire manifeste dans les textes choisis et de mettre l’accent sur la contribution des auteures. L’analyse explore le dialogue entre le discours des écrivaines et l’hégémonie masculine. Elle reconstitue le contenu social de nature idéologique, indique les fonctions des textes analysés, examine attentivement leur contexte de création ainsi que l’expérience biographique des auteures et leur apport intellectuel. Alors que Gorriti, Acosta de Samper et Marchand-Dandurand proviennent de cultures et d’époques différentes, l'objectif est de préciser les éléments homologues sur les plans thématique et stratégique, tant dans leur écriture personnelle que dans leurs publications périodiques. Cet exercice permet de vérifier si, tant au niveau privé qu’au niveau public, les intellectuelles expriment les mêmes idées avec les mêmes stratégies énonciatives ; s’il existe une continuité ou, au contraire, une rupture entre les écrits autobiographiques et les essais publics qui rendent légitime leur vision du monde. Par la même occasion, nous examinons si le « je » des écrits intimes correspond à celui des publications périodiques de chacune des auteures à l’étude. / The nineteenth century is a key period in the history of Western women. This is when a public female consciousness emerges for the first time and an incipient feminism can be observed. In this context, it is important to study how certain female public figures positioned themselves in their respective societies. During this period two genres of writing, journalism and the personal diary, were at their height, and allowed women to take the floor and enter the public sphere. These forms of writing can be regarded as discursive spaces arising from social conflicts and tensions, but they are also the product of an individual who comments daily, weekly or monthly on current events. The woman writer reconstructs events and facts from the past, and reveals her personal observations and opinions on various subjects. She also uses her own experiences and knowledge to cast doubt on normative institutional discourses. Journalistic and personal writing bear witness to the pluralistic worldview of these female intellectuals and to their participation in contemporary historical developments; hence the interest in studying them comparatively in this investigation. The main objective of this dissertation is to analyse, through the study of their journalism and diaries, the work of three female writers from the Americas—the Argentinian Juana Manuela Gorriti, the Colombian Soledad Acosta de Samper, and the Quebecer Joséphine Marchand-Dandurand—whose voices have been silenced by patriarchal culture. Fundamentally, this thesis asks to what extent their writing is inscribed in a collective project related to the advancement of women and the nation. This investigation’s hypothesis is that the authors develop and share a critique of both the situation of women and the nation, as well as calling for women's recognition. Starting from the basis that women's invisibility is universal, and that women were not recognised as subjects in nineteenth-century society, the study deploys the Foucault’s theory of genealogy, adding the gender variable, in order to rescue the traces of a counter-memory in the texts selected and to value the contributions of the authors. The analysis explores the dialogue between the discourse of women writers and male hegemony, restoring the social content of an ideological nature, pointing out the functions provided by the texts analyzed and carefully examining the contexts of their production, as well as the biographical experiences of the writers and their intellectual contributions. Even though Gorriti, Acosta de Samper and Marchand-Dandurand come from different cultures and epochs, the objective is to define the similarities in their personal and journalistic writing on both a thematic and strategic levels. This exercise allows us to verify if these female intellectuals expressed the same ideas in both public and private spheres with the same enunciative strategies; if there is continuity or rupture between autobiographical writings and public essays, which legitimize their worldview. At the same time, the study examines if there is any correspondence between the authorial self of the intimate writings and that of the periodical publications. / El siglo XIX es un período clave en la historia de las mujeres occidentales ya que es el momento en el que surge una conciencia femenina de naturaleza pública y en el que se observan los primeros balbuceos del feminismo. En este contexto, resulta importante estudiar el posicionamiento de ciertas individualidades femeninas frente a la sociedad de su tiempo. Tanto la prensa como el diario personal son dos prácticas escriturales que conocen su auge en esta época y que permiten a las mujeres tomar la palabra y el espacio público. Estas formas de escritura pueden ser consideradas como espacios discursivos surgidos de conflictos y tensiones de carácter social, siendo producto de una misma personalidad que comenta diaria, periódica o mensualmente la actualidad. La mujer escritora reconstituye acontecimientos y hechos del pasado, da a conocer sus observaciones y opiniones personales sobre varios temas; cuestiona también el discurso normalizado e institucionalizado a partir de su propia experiencia y en función de sus conocimientos. Las escrituras íntima y periodística constituyen testimonios de la visión plural del mundo de las intelectuales y de su participación en el devenir histórico. De ahí el interés de estudiarlas en paralelo en este trabajo. El objetivo principal de esta tesis es el de hacer oír, a través del estudio de escritos íntimos y periodísticos, tres voces femeninas americanas frente a la cultura patriarcal: las de la argentina Juana Manuela Gorriti, de la colombiana Soledad Acosta de Samper y de la quebequense Joséphine Marchand-Dandurand. Nos preguntamos en qué medida su escritura se inscribe en un proyecto colectivo relacionado con el avance de la mujer y de la nación. La hipótesis que guía nuestra investigación es la de que las autoras desarrollan y comparten una escritura de denuncia y de reivindicación relacionada con la situación de la mujer y de la nación. Partiendo del contexto universal de invisibilidad de la mujer, de su falta de homologación como sujeto en la colectividad decimonónica, seguimos la línea foucaultiana de la genealogía, agregándole la variable de género, con el fin de rescatar las huellas de una contramemoria manifiesta en los textos seleccionados y de valorar las aportaciones de las autoras. El análisis considera la interlocución entre el discurso de las escritoras con la hegemonía masculina, restituyendo el contenido social de naturaleza ideológica, señalando las funciones y apuestas que proporcionan los textos analizados y examinando cuidadosamente el contexto de su creación, así como la experiencia biográfica de las escritoras y su aporte intelectual. Si bien Gorriti, Acosta de Samper y Marchand-Dandurand proceden de culturas y épocas distintas, el objetivo es deslindar los elementos que pueden ser considerados homólogos a nivel temático y estratégico, tanto a través de su escritura personal como de sus publicaciones periódicas. Este ejercicio nos permite comprobar si, tanto en el plano privado como en el público, las intelectuales expresan las mismas ideas con las mismas estrategias enunciativas, si existe continuidad o si, por el contrario, se evidencia una ruptura entre los escritos autobiográficos y los ensayos públicos, que legitiman su visión del mundo. Al mismo tiempo, examinamos si hay una concordancia entre el yo autoral de los escritos íntimos y el de las publicaciones periódicas.
180

Clearing the Way in Capsule Endoscopy with Deep Learning and Computer Vision.

Noorda, Reinier Alexander 01 July 2022 (has links)
[ES] La endoscopia capsular (CE) es una ampliamente utilizada alternativa mínimamente invasiva a la endoscopia tradicional, que permite la visualización de todo el intestino delgado, mientras no es posible hacerlo fácilmente con los procedimientos más invasivos. Sin embargo, esos métodos tradicionales aún suelen ser la primera opción de tratamiento, ya que todavía existen desafíos importantes en el campo de la CE, incluyendo el tiempo necesario para el diagnóstico por vídeo después del procedimiento, el hecho de que la cápsula no se puede controlar activamente, la falta de consenso sobre una buena preparación del paciente y el coste alto. En esta tesis doctoral, nuestro objetivo es extraer más información de los procedimientos de endoscopía por cápsula para ayudar a aliviar estos problemas desde una perspectiva que parece estar subrepresentada en la investigación actual. Primero, como el objetivo principal en esta tesis, pretendemos desarrollar un método de evaluación de la limpieza en procedimientos de CE automático y objetivo para asistir la investigación médica en métodos de preparación de los pacientes. Específicamente, a pesar de que una preparación adecuada del paciente pueda ayudar a obtener una mejor visibilidad, los estudios sobre el método más efectivo son contradictorios debido a la ausencia de tal método. Por lo tanto, pretendemos proporcionar un método de ese tipo, capaz de presentar la limpieza en una escala intuitiva, con una novedosa arquitectura relativamente ligera de una red neuronal convolucional en su núcleo. Entrenamos este modelo en un conjunto de datos extensivo de más de 50,000 parches de imágenes, obtenidos de 35 procedimientos CE diferentes, y lo comparamos con métodos de clasificación del estado del arte. A partir de la clasificación, desarrollamos un método para automáticamente estimar las probabilidades a nivel de píxel y deducir los puntos en la escala de la evaluación de la limpieza a través de umbrales aprendidos. Después, validamos nuestro método en un entorno clínico en 30 videos de CE obtenidos nuevamente, comparando las puntuaciones resultantes con las asignadas de forma independiente por especialistas humanos. Obtuvimos la mayor precisión de clasificación para el método propuesto (95,23%), con tiempos de predicción promedios significativamente más bajos que para el segundo mejor método. En la validación, encontramos un acuerdo aceptable con dos especialistas humanos en comparación con el acuerdo interhumano, mostrando su validez como método de evaluación objetivo. Adicionalmente, otro objetivo de este trabajo es detectar automáticamente el túnel y ubicar el túnel en cada fotograma. Para este objetivo, entrenamos un modelo basado en R-CNN, concretamente el detector ligero YOLOv3, en un total de 1385 fotogramas, extraídos de procedimientos de CE de 10 pacientes diferentes. De tal manera, alcanzamos una precisión del 86,55% y una recuperación del 88,79% en nuestro conjunto de datos de test. Ampliando este objetivo, también pretendemos visualizar la motilidad intestinal de una manera análoga a una manometría intestinal tradicional, basada únicamente en la técnica mínimamente invasiva de CE. Para esto, alineamos los fotogramas con similar orientación y derivamos los parámetros adecuados para nuestro método de segmentación de las propiedades del rectángulo delimitador del túnel. Finalmente, calculamos el tamaño relativo del túnel para construir un equivalente de una manometría intestinal a partir de información visual. Desde que concluimos nuestro trabajo, nuestro método para la evaluación automática de la limpieza se ha utilizado en un estudio a gran escala aún en curso, en el que participamos activamente. Mientras gran parte de la investigación se centra en la detección automática de patologías, como tumores, pólipos y hemorragias, esperamos que nuestro trabajo pueda hacer una contribución significativa para extraer más información de la CE también en otras áreas frecuentemente subestimadas. / [CA] L'endoscòpia capsular (CE) és una àmpliament utilitzada alternativa mínimament invasiva a l'endoscòpia tradicional, que permet la visualització de tot l'intestí prim, mentre no és possible fer-lo fàcilment amb els procediments més invasius. No obstant això, aqueixos mètodes tradicionals encara solen ser la primera opció de tractament, ja que encara existeixen desafiaments importants en el camp de la CE, incloent el temps necessari per al diagnòstic per vídeo després del procediment, el fet que la càpsula no es pot controlar activament, la falta de consens sobre una bona preparació del pacient i el cost alt. En aquesta tesi doctoral, el nostre objectiu és extraure més informació dels procediments de endoscopía per càpsula per a ajudar a alleujar aquests problemes des d'una perspectiva que sembla estar subrepresentada en la investigació actual. Primer, com l'objectiu principal en aquesta tesi, pretenem desenvolupar un mètode d'avaluació de la neteja en procediments de CE automàtic i objectiu per a assistir la investigació mèdica en mètodes de preparació dels pacients. Específicament, a pesar que una preparació adequada del pacient puga ajudar a obtindre una millor visibilitat, els estudis sobre el mètode més efectiu són contradictoris a causa de l'absència de tal mètode. Per tant, pretenem proporcionar un mètode d'aqueix tipus, capaç de presentar la neteja en una escala intuïtiva, amb una nova arquitectura relativament lleugera d'una xarxa neuronal convolucional en el seu nucli. Entrenem aquest model en un conjunt de dades extensiu de més de 50,000 pegats d'imatges, obtinguts de 35 procediments CE diferents, i el comparem amb mètodes de classificació de l'estat de l'art. A partir de la classificació, desenvolupem un mètode per a automàticament estimar les probabilitats a nivell de píxel i deduir els punts en l'escala de l'avaluació de la neteja a través de llindars apresos. Després, validem el nostre mètode en un entorn clínic en 30 vídeos de CE obtinguts novament, comparant les puntuacions resultants amb les assignades de manera independent per especialistes humans. Vam obtindre la major precisió de classificació per al mètode proposat (95,23%), amb temps de predicció mitjanes significativament més baixos que per al segon millor mètode. En la validació, trobem un acord acceptable amb dos especialistes humans en comparació amb l'acord interhumà, mostrant la seua validesa com a mètode d'avaluació objectiu. Addicionalment, un altre objectiu d'aquest treball és detectar automàticament el túnel i situar el túnel en cada fotograma. Per a aquest objectiu, entrenem un model basat en R-CNN, concretament el detector lleuger YOLOv3, en un total de 1385 fotogrames, extrets de procediments de CE de 10 pacients diferents. De tal manera, aconseguim una precisió del 86,55% i una recuperació del 88,79% en el nostre conjunt de dades de test. Ampliant aquest objectiu, també pretenem visualitzar la motilitat intestinal d'una manera anàloga a una manometría intestinal tradicional, basada únicament en la tècnica mínimament invasiva de CE. Per a això, alineem els fotogrames amb similar orientació i derivem els paràmetres adequats per al nostre mètode de segmentació de les propietats del rectangle delimitador del túnel. Finalment, calculem la grandària relativa del túnel per a construir un equivalent d'una manometría intestinal a partir d'informació visual. Des que concloem el nostre treball, el nostre mètode per a l'avaluació automàtica de la neteja s'ha utilitzat en un estudi a gran escala encara en curs, en el qual participem activament. Mentre gran part de la investigació se centra en la detecció automàtica de patologies, com a tumors, pòlips i hemorràgies, esperem que el nostre treball puga fer una contribució significativa per a extraure més informació de la CE també en altres àrees sovint subestimades. / [EN] Capsule endoscopy (CE) is a widely used, minimally invasive alternative to traditional endoscopy that allows visualisation of the entire small intestine, whereas more invasive procedures cannot easily do this. However, those traditional methods are still commonly the first choice of treatment for gastroenterologists as there are still important challenges surrounding the field of CE. Among others, these include the time consuming video diagnosis following the procedure, the fact that the capsule cannot be actively controlled, lack of consensus on good patient preparation and the high cost. In this doctoral thesis, we aim to extract more information from capsule endoscopy procedures to aid in alleviating these issues from a perspective that appears to be under-represented in current research. First, and as the main objective in this thesis, we aim to develop an objective, automatic cleanliness evaluation method in CE procedures to aid medical research in patient preparation methods. Namely, even though adequate patient preparation can help to obtain a cleaner intestine and thus better visibility in the resulting videos, studies on the most effective preparation method are conflicting due to the absence of such a method. Therefore, we aim to provide such a method, capable of presenting results on an intuitive scale, with a relatively light-weight novel convolutional neural network architecture at its core. We trained this model on an extensive data set of over 50,000 image patches, collected from 35 different CE procedures, and compared it with state-of-the-art classification methods. From the patch classification results, we developed a method to automatically estimate pixel-level probabilities and deduce cleanliness evaluation scores through automatically learnt thresholds. We then validated our method in a clinical setting on 30 newly collected CE videos, comparing the resulting scores to those independently assigned by human specialists. We obtained the highest classification accuracy for the proposed method (95.23%), with significantly lower average prediction times than for the second-best method. In the validation of our method, we found acceptable agreement with two human specialists compared to interhuman agreement, showing its validity as an objective evaluation method. Additionally, we aim to automatically detect and localise the tunnel in each frame, in order to help determine the capsule orientation at any given time. For this purpose, we trained an R-CNN based model, namely the light-weight YOLOv3 detector, on a total of 1385 frames, extracted from CE procedures of 10 different patients, achieving a precision of 86.55% combined with a recall of 88.79% on our test set. Extending on this, we additionally aim to visualise intestinal motility in a manner analogous to a traditional intestinal manometry, solely based on the minimally invasive technique of CE, through aligning the frames with similar orientation and using the bounding box parameters to derive adequate parameters for our tunnel segmentation method. Finally, we calculate the relative tunnel size to construct an equivalent of an intestinal manometry from visual information. Since we concluded our work, our method for automatic cleanliness evaluation has been used in a still on-going, large-scale study, with in which we actively participate. While much research focuses on automatic detection of pathologies, such as tumors, polyps and bleedings, we hope our work can make a significant contribution to extract more information from CE also in other areas that are often overlooked. / Noorda, RA. (2022). Clearing the Way in Capsule Endoscopy with Deep Learning and Computer Vision [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/183752 / TESIS

Page generated in 0.0477 seconds