• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 54
  • 23
  • 18
  • 16
  • 8
  • 7
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 154
  • 38
  • 31
  • 28
  • 28
  • 28
  • 26
  • 24
  • 23
  • 23
  • 18
  • 17
  • 16
  • 15
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Inclusion of Gabor textural transformations and hierarchical structures within an object based analysis of a riparian landscape

Kutz, Kain Markus 01 May 2018 (has links)
Land cover mapping is an important part of resource management, planning, and economic predictions. Improvements in remote sensing, machine learning, image processing, and object based image analysis (OBIA) has made the process of identifying land cover types increasingly faster and reliable but these advances are unable to utilize the amount of information encompassed within ultra-high (sub-meter) resolution imagery. Previously, users have typically reduced the resolution of imagery in an attempt to more closely represent the interpretation or object scale in an image and rid the image of any extraneous information within the image that may cause the OBIA process to identify too small of objects when performing semi-automated delineation of objects based on an images’ properties (Mas et al., 2015; Eiesank et al., 2014; Hu et al., 2010). There have been few known attempts to try and maximize this detailed information in high resolution imagery using advanced textural components. In this study we try to circumnavigate the inherent problems associated with high resolution imagery by combining well researched data transformations that aid the OBIA process with a seldom used texture transformation in Geographic Object Based Image Analyses (GEOBIA) known as the Gabor Transform and the hierarchal organization of landscapes. We will observe the difference made in segmentation and classification accuracy of a random forest classifier when we fuse a Gabor transformed image to a Normalized Difference Vegetation Index (NDVI), high resolution multi-spectral imagery (RGB and NIR) and Light Detection and Ranging (LiDAR) derived canopy height model (CHM) within a riparian area in Southeast Iowa. Additionally, we will observe the effects on classification accuracy when adding multi-scale land cover data to objects. Both, the addition of hierarchical information and Gabor textural information, could aid the GEOBIA process in delineating and classifying the same objects that human experts would delineate within this riparian landscape.
82

Klasifikace audia hlubokým učením s limitovanými zdroji dat / Audio Classification with Deep Learning on Limited Data Sets

Harár, Pavol January 2019 (has links)
Standardní postupy diagnózy dysfonie klinickým logopedem mají své nevýhody, především tu, že je tento proces velmi subjektivní. Nicméně v poslední době získala popularitu automatická objektivní analýza stavu mluvčího. Vědci úspěšně založili své metody na různých algoritmech strojového učení a ručně vytvořených příznacích. Tyto metody nejsou bohužel přímo škálovatelné na jiné poruchy hlasu, samotný proces tvorby příznaků je pracný a také náročný z hlediska financí a talentu. Na základě předchozích úspěchů může přístup založený na hlubokém učení pomoci překlenout některé problémy se škálovatelností a generalizací, nicméně překážkou je omezené množství trénovacích dat. Jedná se o společný jmenovatel téměř ve všech systémech pro automatizovanou analýzu medicínských dat. Hlavním cílem této práce je výzkum nových přístupů prediktivního modelování založeného na hlubokém učení využívající omezené sady zvukových dat, se zaměřením zejména na hodnocení patologických hlasů. Tato práce je první, která experimentuje s hlubokým učením v této oblasti, a to na dosud největší kombinované databázi dysfonických hlasů, která byla v rámci této práce vytvořena. Předkládá důkladný průzkum veřejně dostupných zdrojů dat a identifikuje jejich limitace. Popisuje návrh nových časově-frekvenčních reprezentací založených na Gaborově transformaci a představuje novou třídu chybových funkcí, které přinášejí reprezentace výstupů prospěšné pro učení. V numerických experimentech demonstruje zlepšení výkonu konvolučních neuronových sítí trénovaných na omezených zvukových datových sadách pomocí tzv. "augmented target loss function" a navržených časově-frekvenčních reprezentací "Gabor" a "Mel scattering".
83

Terrain Classification to find Drivable Surfaces using Deep Neural Networks : Semantic segmentation for unstructured roads combined with the use of Gabor filters to determine drivable regions trained on a small dataset

Guin, Agneev January 2018 (has links)
Autonomous vehicles face various challenges under difficult terrain conditions such as marginally rural or back-country roads, due to the lack of lane information, road signs or traffic signals. In this thesis, we investigate a novel approach of using Deep Neural Networks (DNNs) to classify off-road surfaces into the types of terrains with the aim of supporting autonomous navigation in unstructured environments. For example, off-road surfaces can be classified as asphalt, gravel, grass, mud, snow, etc. Images from the camera mounted on a mining truck were used to perform semantic segmentation and to classify road surface types. Camera images were segmented manually for training into sets of 16 and 9 classes, for all relevant classes and the drivable classes respectively. A small but diverse dataset of 100 images was augmented and compiled along with nearby frames from the video clips to expand this dataset. Neural networks were used to test the performance for the classification under these off-road conditions. Pre-trained AlexNet was compared to the networks without pre-training. Gabor filters, known to distinguish textured surfaces, was further used to improve the results of the neural network. The experiments show that pre-trained networks perform well with small datasets and many classes. A combination of Gabor filters with pre-trained networks can establish a dependable navigation path under difficult terrain conditions. While the results seem positive for images similar to the training image scenes, the networks fail to perform well in other situations. Though the tests imply that larger datasets are required for dependable results, this is a step closer to making the autonomous vehicles drivable under off-road conditions. / Autonoma fordon står inför olika utmaningar under svåra terrängförhållanden som landsbygds- eller skogsvägar på grund av bristen av körfältinformation, vägskyltar och trafikljus. I denna avhandling undersöker vi ett nytt tillvägagångssätt att använda Djupa Neurala Nätverk (DNN) för att klassificera terrängytor utifrån deras körbarhet i syfte att stödja autonom navigering i ostrukturerade miljöer.Till exempel kan terrängytor klassificeras som asfalt, grus, gräs, lera, snö etc. Bilder från kameran monterad på en gruvbil användes för att utföra semantisk segmentering och klassificera vägytor. Bilderna delades manuellt upp i träningsset på 16 samt 9 klasser för alla relevanta klasser respektive körbara klasser. Ett litet men mångsidigt dataset med 100 bilder förstärktes med närliggande bilder från videoklippen för att expandera detta dataset. Neurala nätverk användes för att testa prestandan hos klassificeringen under dessa terrängförhållanden. Det förtränade nätverket AlexNet jämfördes med nätverken utan träning. Gaborfilter, kända för att särskilja texturerade ytor, användes vidare för att förbättra resultaten av det neurala nätverket. Experimenten visar att förtränade nätverk presterar bra med små dataset och många klasser. En kombination av Gaborfilter med förtränade nätverk kan skapa en pålitlig navigationsväg under svåra terrängförhållanden. Även om resultaten verkar positiva för bilder som liknar träningsbildscenen presterar nätverken inte bra i andra situationer. Även om testen tyder på att stora dataset krävs för tillförlitliga resultat, är detta ett steg närmare att göra de autonoma bilarna körbara i svåra terrängförhållanden.
84

Intelligent Road Control System Using Advanced Image Processing Techniques

Ouyang, Dingxin January 2012 (has links)
No description available.
85

Robust Unconstrained Face Detection and Lip Localization Using Gabor Filters

Hursig, Robert E 01 July 2009 (has links) (PDF)
Automatic speech recognition (ASR) is a well-researched field of study aimed at augmenting the man-machine interface through interpretation of the spoken word. From in-car voice recognition systems to automated telephone directories, automatic speech recognition technology is becoming increasingly abundant in today’s technological world. Nonetheless, traditional audio-only ASR system performance degrades when employed in noisy environments such as moving vehicles. To improve system performance under these conditions, visual speech information can be incorporated into the ASR system, yielding what is known as audio-video speech recognition (AVASR). A majority of AVASR research focuses on lip parameters extraction within controlled environments, but these scenarios fail to meet the demanding requirements of most real-world applications. Within the visual unconstrained environment, AVASR systems must compete with constantly changing lighting conditions and background clutter as well as subject movement in three dimensions. This work proposes a robust still image lip localization algorithm capable of operating in an unconstrained visual environment, serving as a visual front end to AVASR systems. A novel Bhattacharyya-based face detection algorithm is used to compare candidate regions of interest with a unique illumination-dependent face model probability distribution function approximation. Following face detection, a lip-specific Gabor filter-based feature space is utilized to extract facial features and localize lips within the frame. Results indicate a 75% lip localization overall success rate despite the demands of the visually noisy environment.
86

An Automated Human Organ Segmentation Technique for Abdominal Magnetic Resonance Images

Wu, Jie 03 1900 (has links)
<p> A new parameter-free texture feature-based seeded region growing algorithm is proposed in this dissertation for automated segmentation of organs in abdominal MR images. This algorithm requires that a user only mouse clicks twice to identify the upper left and lower right corners of a rectangular region of interest (ROI). With this given ROI, a seed point is automatically selected based on homogeneity criteria. Intensity as well as four texture features: 20 cooccurrence texture features, Gabor texture feature, and both 20 and 3D semivariogram texture features are extracted from the image and a seeded region growing algorithm is performed on these feature spaces. A threshold is then obtained by taking a lower value just before the one which results in an ' explosion '. An optional Snake post-processing tool is also provided to obtain better organ delineation. The comparative results of the texture features and intensity are reported using both normal digital images and abdominal MR images acquired from ten patients. Comparisons of Before and After Snake are also presented. Generally, Gabor texture feature is found to perform the best among all features . The experimental results of the proposed approach show that it is fast and accurate when combined with Gabor texture feature or intensity feature and should prove a boon to production radiological batch processing. </p> / Thesis / Doctor of Philosophy (PhD)
87

Alternate Duals of Gabor Subspace Frames

Akinlar, Mehmet Ali 08 1900 (has links)
<p> In this thesis we mainly give a characterization of dual frames of Gabor subspace frames. We give necessary and sufficient conditions for the existence and the uniqueness of a function h (called window) in the closed linear span of a Gabor subspace frame {EmbTnak}m,n∈Z such that the Bessel collection {EmbTnah}m,n∈Z serves as the dual frame of the original frame {EmbTnag}m,n∈Z. We solve the problem for three cases, first ab = 1, second ab = p ∈ N, and third ab = p/q, gcd(p, q) = 1. In each case, we first find the conditions for upper frame bound (known as Bessel collection). Secondly, we characterize the functions which are orthogonal to {EmbTnag}m,n∈Z in terms of the Zak transform, and then obtain necessary and sufficient conditions for lower frame bound. Here we state obtained conditions for normalized tight frame as a corollary. Finally, using all this information we solve the duality problem.</p> / Thesis / Master of Science (MSc)
88

Efectividad de la terapia visual basada en aprendizaje perceptual y terapia dicóptica para la rehabilitación de la ambliopía en pacientes resistentes al parche

Hernández Rodríguez, Carlos Javier 07 July 2023 (has links)
La ambliopía es una condición visual caracterizada por una disminución de agudeza visual, sensibilidad al contraste y estereoagudeza, entre otros déficits como la presencia del fenómeno del amontonamiento (crowding). El tratamiento tradicional de la ambliopía es la corrección óptica del defecto refractivo y la oclusión del ojo director. Sin embargo, la oclusión con parche tiene algunas limitaciones, como son los largos periodos de tratamiento, el mal cumplimiento, las recidivas y los pacientes que no responden adecuadamente, que se denominan resistentes al parche. Por ello, desde las distintas áreas de las ciencias de la visión se busca desarrollar una nueva vía terapéutica basada en la estimulación activa del ojo ambliope. El aprendizaje perceptual y la terapia dicóptica cuentan con numerosos estudios que analizan sus potenciales beneficios para la rehabilitación del a ambliopía. En esta tesis doctoral se presentan cuatro estudios que buscan profundizar desde una perspectiva teórica y experimental la rehabilitación de la ambliopía mediante programas informáticos de aprendizaje perceptual y terapia dicóptica. En el primer estudio se analiza la evidencia científica existente sobre la efectividad de la terapia visual basada en aprendizaje perceptual y terapia dicóptica para la rehabilitación de la ambliopía anisometrópica. Los resultados muestran que existen estudios de intervención y ensayos clínicos que sugieren que la terapia visual mejora la agudeza visual, el coeficiente dosis-respuesta y el cumplimiento del tratamiento. Sin embargo, la evidencia científica presenta limitaciones que deben solventarse en futuros estudios, como son la escasez de ensayos clínicos aleatorizados con seguimiento a largo plazo y doble ciego. En el segundo estudio se realizó una revisión de los aspectos psicofísicos que deben valorarse a la hora de desarrollar software de aprendizaje perceptual y terapia dicóptica. En primer lugar, hay que utilizar estímulos que hayan mostrado ser útiles en el estudio de la ambliopía, como son los parches de Gabor, los optotipos con letras, los estímulos de puntos aleatorios para la percepción estereoscópica y los estímulos de agudeza de Vernier. En segundo lugar, cada estímulo presenta una serie de atributos que pueden modificarse y adaptarse al paciente de forma individualizada para personalizar el tratamiento. Y, en tercer lugar, se recomienda que durante las tareas visuales de rehabilitación de la ambliopía se emplee un método de respuesta adaptativa, como el Best-PEST o el método de escalera. En el tercer estudio se analiza de forma retrospectiva el uso del aprendizaje perceptual monocular en combinación con la oclusión para la rehabilitación de la ambliopía en pacientes resistentes al parche. Los resultados sugieren que el tratamiento combinado puede ayudar a mejorar la agudeza visual y la sensibilidad al contraste de los pacientes que han mostrado no mejorar con el parche. Por último, en el cuarto estudio se evalúa la efectividad del aprendizaje perceptual en entorno dicóptico para mejorar la visión de pacientes resistentes al parche. Los resultados son coherentes con los del tercer estudio, ya que aquellos pacientes que no recuperaron su agudeza visual sólo con el parche consiguieron mejorarla al combinar la terapia visual con la oclusión. Además, el tratamiento tuvo un impacto positivo en la sensibilidad al contraste y la estereopsis. Según los resultados obtenidos durante la tesis doctoral, la terapia visual basada en aprendizaje perceptual y terapia dicóptica es una opción prometedora para la rehabilitación de los pacientes con ambliopía resistentes al parche, que debería seguir investigándose puesto que puede aportar importantes beneficios a los pacientes.
89

Εύρεση γεωμετρικών χαρακτηριστικών ερυθρών αιμοσφαιρίων από εικόνες σκεδασμένου φωτός

Τρικοίλης, Ιωάννης 20 September 2010 (has links)
Στην παρούσα διπλωματική εργασία θα γίνει μελέτη και εφαρμογή μεθόδων επίλυσης του προβλήματος αναγνώρισης γεωμετρικών χαρακτηριστικών ανθρώπινων ερυθρών αιμοσφαιρίων από προσομοιωμένες εικόνες σκέδασης ΗΜ ακτινοβολίας ενός He-Ne laser 632.8 μm. Στο πρώτο κεφάλαιο γίνεται μια εισαγωγή στις ιδιότητες και τα χαρακτηριστικά του ερυθροκυττάρου καθώς, επίσης, παρουσιάζονται διάφορες ανωμαλίες των ερυθροκυττάρων και οι μέχρι στιγμής χρησιμοποιούμενοι τρόποι ανίχνευσής των. Στο δεύτερο κεφάλαιο της εργασίας γίνεται μια εισαγωγή στις ιδιότητες της ΗΜ ακτινοβολίας, περιγράφεται το φαινόμενο της σκέδασης και παρουσιάζεται το ευθύ πρόβλημα σκέδασης ΗΜ ακτινοβολίας ανθρώπινων ερυθροκυττάρων. Το τρίτο κεφάλαιο αποτελείται από δύο μέρη. Στο πρώτο μέρος γίνεται εκτενής ανάλυση της θεωρίας των τεχνητών νευρωνικών δικτύων και περιγράφονται τα νευρωνικά δίκτυα ακτινικών συναρτήσεων RBF. Στη συνέχεια, αναφέρονται οι μέθοδοι εξαγωγής παραμέτρων και, πιο συγκεκριμένα, δίνεται το θεωρητικό και μαθηματικό υπόβαθρο των μεθόδων που χρησιμοποιήθηκαν οι οποίες είναι ο αλογόριθμος Singular Value Decomposition (SVD), o Angular Radial μετασχηματισμός (ART) και φίλτρα Gabor. Στο δεύτερο μέρος περιγράφεται η επίλυση του αντίστροφου προβλήματος σκέδασης. Παρουσιάζεται η μεθοδολογία της διαδικασίας επίλυσης όπου εφαρμόστηκαν ο αλογόριθμος συμπίεσης εικόνας SVD, o περιγραφέας σχήματος ART και ο περιγραφέας υφής με φίλτρα Gabor για την εύρεση των γεωμετρικών χαρακτηριστικών και νευρωνικό δίκτυο ακτινικών συναρτήσεων RBF για την ταξινόμηση των ερυθροκυττάρων. Στο τέταρτο και τελευταίο κεφάλαιο γίνεται δοκιμή και αξιολόγηση της μεθόδου και συνοψίζονται τα αποτελέσματα και τα συμπεράσματα που εξήχθησαν κατά τη διάρκεια της εκπόνησης αυτής της διπλωματικής. / In this thesis we study and implement methods of estimating the geometrical features of the human red blood cell from a set of simulated light scattering images produced by a He-Ne laser beam at 632.8 μm. Ιn first chapter an introduction to the properties and the characteristics of red blood cells are presented. Furthermore, we describe various abnormalities of erythrocytes and the until now used ways of detection. In second chapter the properties of electromagnetic radiation and the light scattering problem of EM radiation from human erythrocytes are presented. The third chapter consists of two parts. In first part we analyse the theory of neural networks and we describe the radial basis function neural network. Then, we describe the theoritical and mathematical background of the methods that we use for feature extraction which are Singular Value Decomposition (SVD), Angular Radial Transform and Gabor filters. In second part the solution of the inverse problem of light scattering is described. We present the methodology of the solution process in which we implement a Singular Value Decomposition approach, a shape descriptor with Angular Radial Transform and a homogenous texture descriptor which uses Gabor filters for the estimation of the geometrical characteristics and a RBF neural network for the classification of the erythrocytes. In the forth and last chapter the described methods are evaluated and we summarise the experimental results and conclusions that were extracted from this thesis.
90

Modèles d'image aléatoires et synthèse de texture

Galerne, Bruno 09 December 2010 (has links) (PDF)
Cette thèse est une étude de modèles d'image aléatoires avec des applications en synthèse de texture. La plupart des modèles de champs aléatoires étudiés sont des modèles germes-grains. Dans la première partie de la thèse, des algorithmes de synthèse de texture basés sur le modèle shot noise sont développés. Dans le cadre discret, deux processus aléatoires, à savoir le shot noise discret asymptotique et le bruit à phase aléatoire, sont étudiés. On élabore ensuite un algorithme rapide de synthèse de texture basé sur ces processus. De nombreuses expériences démontrent que cet algorithme permet de reproduire une certaine classe de textures naturelles que l'on nomme micro-textures. Dans le cadre continu, la convergence gaussienne des modèles shot noise est étudiée d'avantage et de nouvelles bornes pour la vitesse de cette convergence sont établies. Enfin, on présente un nouvel algorithme de synthèse de texture procédurale par l'exemple basé sur le récent modèle Gabor noise. Cet algorithme permet de calculer automatiquement un modèle procédural représentant des micro-textures naturelles. La deuxième partie de la thèse est consacrée à l'étude du processus feuilles mortes transparentes (FMT), un nouveau modèle germes-grains obtenu en superposant des objets semi-transparents. Le résultat principal de cette partie montre que, lorsque la transparence des objets varie, le processus FMT fournit une famille de modèles variant du modèle feuilles mortes à un champ gaussien. Dans la troisième partie de la thèse, les champs aléatoires à variation bornés sont étudiés et on établit des résultats généraux sur le calcul de la variation totale moyenne de ces champs. En particulier, ces résultats généraux permettent de calculer le périmètre moyen des ensembles aléatoires et de calculer explicitement la variation totale moyenne des modèles germes-grains classiques.

Page generated in 0.0703 seconds