341 |
Molekulární signatura jako optimální multi-objektivní funkce s aplikací v predikci v onkogenomice / Molecular Signature as Optima of Multi-Objective Function with Applications to Prediction in OncogenomicsAligerová, Zuzana January 2015 (has links)
Náplní této práce je teoretický úvod a následné praktické zpracování tématu Molekulární signatura jako optimální multi-objektivní funkce s aplikací v predikci v onkogenomice. Úvodní kapitoly jsou zaměřeny na téma rakovina, zejména pak rakovina prsu a její podtyp triple negativní rakovinu prsu. Následuje literární přehled z oblasti optimalizačních metod, zejména se zaměřením na metaheuristické metody a problematiku strojového učení. Část se odkazuje na onkogenomiku a principy microarray a také na statistiku a s důrazem na výpočet p-hodnoty a bimodálního indexu. Praktická část je pak zaměřena na konkrétní průběh výzkumu a nalezené závěry, vedoucí k dalším krokům výzkumu. Implementace vybraných metod byla provedena v programech Matlab a R, s využitím dalších programovacích jazyků a to konkrétně programů Java a Python.
|
342 |
Automatická klasifikace spánkových fází z polysomnografických dat / Automatic sleep scoring using polysomnographic dataVávrová, Eva January 2016 (has links)
The thesis is focused on analysis of polysomnographic signals based on extraction of chosen parameters in time, frequency and time-frequency domain. The parameters are acquired from 30 seconds long segments of EEG, EMG and EOG signals recorded during different sleep stages. The parameters used for automatic classification of sleep stages are selected according to statistical analysis. The classification is realized by artificial neural networks, k-NN classifier and linear discriminant analysis. The program with a graphical user interface was created using Matlab.
|
343 |
Rozšíření pro pravděpodobnostní lineární diskriminační analýzu v rozpoznávání mluvčího / Extensions to Probabilistic Linear Discriminant Analysis for Speaker RecognitionPlchot, Oldřich Unknown Date (has links)
Tato práce se zabývá pravděpodobnostními modely pro automatické rozpoznávání řečníka. Podrobně analyzuje zejména pravděpodobnostní lineární diskriminační analýzu (PLDA), která modeluje nízkodimenzionální reprezentace promluv ve formě \acronym{i--vektorů}. Práce navrhuje dvě rozšíření v současnosti požívaného PLDA modelu. Nově navržený PLDA model s plným posteriorním rozložením modeluje neurčitost při generování i--vektorů. Práce také navrhuje nový diskriminativní přístup k trénování systému pro verifikaci řečníka, který je založený na PLDA. Pokud srovnáváme původní PLDA s modelem rozšířeným o modelování neurčitosti i--vektorů, výsledky dosažené s rozšířeným modelem dosahují až 20% relativního zlepšení při testech s krátkými nahrávkami. Pro delší testovací segmenty (více než jedna minuta) je zisk v přesnosti menší, nicméně přesnost nového modelu není nikdy menší než přesnost výchozího systému. Trénovací data jsou ale obvykle dostupná ve formě dostatečně dlouhých segmentů, proto v těchto případech použití nového modelu neposkytuje žádné výhody při trénování. Při trénování může být použit původní PLDA model a jeho rozšířená verze může být využita pro získání skóre v případě, kdy se bude provádět testování na krátkých segmentech řeči. Diskriminativní model je založen na klasifikaci dvojic i--vektorů do dvou tříd představujících oprávněný a neoprávněný soud (target a non-target trial). Funkcionální forma pro získání skóre pro každý pár je odvozena z PLDA a trénování je založeno na logistické regresi, která minimalizuje vzájemnou entropii mezi správným označením všech soudů a pravděpodobnostním označením soudů, které navrhuje systém. Výsledky dosažené s diskriminativně trénovaným klasifikátorem jsou podobné výsledkům generativního PLDA, ale diskriminativní systém prokazuje schopnost produkovat lépe kalibrované skóre. Tato schopnost vede k lepší skutečné přesnosti na neviděné evaluační sadě, což je důležitá vlastnost pro reálné použití.
|
344 |
Modelování predikce bankrotu stavebních podniků / Bankruptcy Prediction Modelling in Construction BusinessSrbová, Pavla January 2017 (has links)
The diploma thesis is aimed at creating a bankruptcy model for companies of the construction industry in the Czech Republic by using discriminant analysis. In the theoretical part, the concept of bankruptcy model is defined; this part is focused on the inclusion of bankruptcy models in economics, a look into their history, a description of selected models and a brief characteristic of the construction industry. In the practical part, the reliability of selected bankruptcy models is counted and a new bankruptcy model is built.
|
345 |
Utilisation d'algorithmes génétiques pour l'identification systématique de réseaux de gènes co-régulés. / Using genetic algorithms to systematically identify co-regulated genes networksJanbain, Ali 16 July 2019 (has links)
L’objectif de ce travail est de mettre au point une nouvelle approche automatique pour identifier les réseaux de gènes concourant à une même fonction biologique. Ceci permet une meilleure compréhension des phénomènes biologiques et notamment des processus impliqués dans les maladies telles que les cancers. Différentes stratégies ont été développées pour essayer de regrouper les gènes d’un organisme selon leurs relations fonctionnelles : génétique classique et génétique moléculaire. Ici, nous utilisons une propriété connue des réseaux de gènes fonctionnellement liés à savoir que ces gènes sont généralement co-régulés et donc co-exprimés. Cette co-régulation peut être mise en évidence par des méta-analyses de données de puces à ADN (micro-arrays) telles que Gemma ou COXPRESdb. Dans un travail précédent [Al Adhami et al., 2015], la topologie d’un réseau de co-expression de gènes a été caractérisé en utilisant deux paramètres de description des réseaux qui discriminent des groupes de gènes sélectionnés aléatoirement (modules aléatoires, RM) de groupes de gènes avec des liens fonctionnels connus (modules fonctionnels, FM), c’est-à-dire des gènes appartenant au même processus biologique GO. Dans le présent travail, nous avons cherché à généraliser cette approche et à proposer une méthode, appelée TopoFunc, pour améliorer l’annotation existante de la fonction génique. Nous avons d’abord testé différents descripteurs topologiques du réseau de co-expression pour sélectionner ceux qui identifient le mieux des modules fonctionnels. Puis, nous avons constitué une base de données rassemblant des modules fonctionnels et aléatoires, pour lesquels, sur la base des descripteurs sélectionnés, nous avons construit un modèle de discrimination LDA [Friedman et al., 2001] permettant, pour un sous-ensemble de gènes donné, de prédire son type (fonctionnel ou non). Basée sur la méthode de similarité de gènes travaillée par Wang et ses collègues [Wang et al., 2007], nous avons calculé un score de similarité fonctionnelle entre les gènes d’un module. Nous avons combiné ce score avec celui du modèle LDA dans une fonction de fitness implémenté dans un algorithme génétique (GA). À partir du processus biologique d’ontologie de gènes donné (GO-BP), AG visait à éliminer les gènes faiblement co-exprimés avec la plus grande clique de GO-BP et à ajouter des gènes «améliorant» la topologie et la fonctionnalité du module. Nous avons testé TopoFunc sur 193 GO-BP murins comprenant 50-100 gènes et avons montré que TopoFunc avait agrégé un certain nombre de nouveaux gènes avec le GO-BP initial tout en améliorant la topologie des modules et la similarité fonctionnelle. Ces études peuvent être menées sur plusieurs espèces (homme, souris, rat, et possiblement poulet et poisson zèbre) afin d’identifier des modules fonctionnels conservés au cours de l’évolution. / The aim of this work is to develop a new automatic approach to identify networks of genes involved in the same biological function. This allows a better understanding of the biological phenomena and in particular of the processes involved in diseases such as cancers. Various strategies have been developed to try to cluster genes of an organism according to their functional relationships : classical genetics and molecular genetics. Here we use a well-known property of functionally related genes mainly that these genes are generally co-regulated and therefore co-expressed. This co-regulation can be detected by microarray meta-analyzes databases such as Gemma or COXPRESdb. In a previous work [Al Adhami et al., 2015], the topology of a gene coexpression network was characterized using two description parameters of networks that discriminate randomly selected groups of genes (random modules, RM) from groups of genes with known functional relationship (functional modules, FM), e.g. genes that belong to the same GO Biological Process. We first tested different topological descriptors of the co-expression network to select those that best identify functional modules. Then, we built a database of functional and random modules for which, based on the selected descriptors, we constructed a discrimination model (LDA)[Friedman et al., 2001] allowing, for a given subset of genes, predict its type (functional or not). Based on the similarity method of genes worked by Wang and co-workers [Wang et al., 2007], we calculated a functional similarity score between the genes of a module. We combined this score with that of the LDA model in a fitness function implemented in a genetic algorithm (GA). Starting from a given Gene Ontology Biological Process (GO-BP), AG aimed to eliminate genes that were weakly coexpressed with the largest clique of the GO-BP and to add genes that "improved" the topology and functionality of the module. We tested TopoFunc on the 193 murine GO-BPs comprising 50-100 genes and showed that TopoFunc aggregated a number of novel genes to the initial GO-BP while improving module topology and functional similarity. These studies can be conducted on several species (humans, mice, rats, and possibly chicken and zebrafish) to identify functional modules preserved during evolution.
|
346 |
Towards Development of Smart Nanosensor System To Detect Hypoglycemia From BreathSanskar S Thakur (8816885) 08 May 2020 (has links)
<div>The link between volatile organic compounds (VOCs) from breath and various diseases and specific conditions has been identified since long by the researchers. Canine studies and breath sample analysis on Gas chromatography/ Mass Spectroscopy has proven that there are VOCs in the breath that can detect and potentially predict hypoglycemia. This project aims at developing a smart nanosensor system to detect hypoglycemia from human breath. The sensor system comprises of 1-Mercapto-(triethylene glycol) methyl ether functionalized goldnanoparticle (EGNPs) sensors coated with polyetherimide (PEI) and poly(vinylidene fluoride -hexafluoropropylene) (PVDF-HFP) and polymer composite sensor made from PVDF-HFP-Carbon Black (PVDF-HFP/CB), an interface circuit that performs signal conditioning and amplification, and a microcontroller with Bluetooth Low Energy (BLE) to control the interface circuit and communicate with an external personal digital assistant. The sensors were fabricated and tested with 5 VOCs in dry air and simulated breath (mixture of air, small portion of acetone, ethanol at high humidity) to investigate sensitivity and selectivity. The name of the VOCs is not disclosed herein but these VOCs have been identified in breath and are identified as potential biomarkers for other diseases as well. </div><div> </div><div> The sensor hydrophobicity has been studied using contact angle measurement. The GNPs size was verified using Ultra-Violent-Visible (UV-VIS) Spectroscopy. Field Emission Scanning Electron Microscope (FESEM) image is used to show GNPs embedded in the polymer film. The sensors sensitivity increases by more than 400% in an environment with relative humidity (RH) of 93% and the sensors show selectivity towards VOCs of interest. The interface circuit was designed on Eagle PCB and was fabricated using a two-layer PCB. The fabricated interface circuit was simulated with variable resistance and was verified with experiments. The system is also tested at different power source voltages and it was found that the system performance is optimum at more than 5 volts. The sensor fabrication, testing methods, and results are presented and discussed along with interface circuit design, fabrication, and characterization.</div>
|
347 |
Mobilitätsverhalten potentieller Radfahrer in Dresden: Eine empirische AnalyseManteufel, Rico 15 September 2015 (has links)
Before the German reunification, Dresden was a city of motorized traffic and cyclist were rare. But in the 90's began a change of transport policy and cycling became more important. This Master Thesis wants to show the current standing of cycling in Dresden. Thats why the results of the "SrV"-study should be analysed with regard to potential cyclists and their journeys. As methods were used a descriptive analysis and the linear discriminant analysis, both used at a personal and journey-specific level of data. As a result, Dresden have to do much more to become a good "cycling-city", so the bike-level wasn't really high in the year 2013. Instead the car is still the mostly used transport vehicle and the proportion in the Modal-Split is only slowly sinking. But this study shows typical characteritics of cyclists and cycling journays of Dresden, so there is a basis to get more people involved to cycle and become a more eco-friendly city.:Abbildungsverzeichnis i
Abkürzungsverzeichnis iii
1. Einleitung 1.
2. Theoretischer Teil 4
2.1 Diskriminanzanalyse 4
2.1.1 Umsetzung im Zweigruppenfall 6
2.1.2 Umsetzung im Mehrgruppenfall 8
2.1.3 Güteprüfung 9
2.2 Datensatz 12
2.3 Literaturrecherche 15
3. Praktischer Teil 23
3.1 Deskriptive Analyse 24
3.1.1 Auswertung auf Personenebene 25
3.1.2 Auswertung auf Wegeebene 33
3.2 Diskriminanzanalyse 40
3.2.1 Anwendung auf Personenebene 40
3.2.2 Anwendung auf Wegeebene 48
4. Fazit 54
5. Kritische Würdigung 58
6. Ausblick 61
Literaturverzeichnis I
|
348 |
Classification of a Sensor Signal Attained By Exposure to a Complex Gas MixtureSher, Rabnawaz Jan January 2021 (has links)
This thesis is carried out in collaboration with a private company, DANSiC AB This study is an extension of a research work started by DANSiC AB in 2019 to classify a source. This study is about classifying a source into two classes with the sensitivity of one source higher than the other as one source has greater importance. The data provided for this thesis is based on sensor measurements on different temperature cycles. The data is high-dimensional and is expected to have a drift in measurements. Principal component analysis (PCA) is used for dimensionality reduction. “Differential”, “Relative” and “Fractional” drift compensation techniques are used for compensating the drift in data. A comparative study was performed using three different classification algorithms, which are “Linear Discriminant Analysis (LDA)”, “Naive Bayes classifier (NB)” and “Random forest (RF)”. The highest accuracy achieved is 59%,Random forest is observed to perform better than the other classifiers. / <p>This work is done with DANSiC AB in collaboration with Linkoping University.</p>
|
349 |
Použití hodnotové analýzy při financování inženýrských staveb v obci / Use of value Analysis in Financing Engireering Constructions in MunicipalityBidlo, Filip January 2012 (has links)
Thesis is focused on the use of value analysis in the financing of engineering structures in municipality. The work is divided into two parts. The first is focused on explaining the basic concepts of public contracts and value analysis and describes the methods of value analysis.The second part focuses on finding the best tender submitted for the tender of public contract.
|
350 |
Combining Multivariate Statistical Methods and Spatial Analysis to Characterize Water Quality Conditions in the White River Basin, Indiana, U.S.A.Gamble, Andrew Stephan 25 February 2011 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / This research performs a comparative study of techniques for combining spatial data and multivariate statistical methods for characterizing water quality conditions in a river basin. The study has been performed on the White River basin in central Indiana, and uses sixteen physical and chemical water quality parameters collected from 44 different monitoring sites, along with various spatial data related to land use – land cover, soil characteristics, terrain characteristics, eco-regions, etc. Various parameters related to the spatial data were analyzed using ArcHydro tools and were included in the multivariate analysis methods for the purpose of creating classification equations that relate spatial and spatio-temporal attributes of the watershed to water quality data at monitoring stations. The study compares the use of various statistical estimates (mean, geometric mean, trimmed mean, and median) of monitored water quality variables to represent annual and seasonal water quality conditions. The relationship between these estimates and the spatial data is then modeled via linear and non-linear multivariate methods. The linear statistical multivariate method uses a combination of principal component analysis, cluster analysis, and discriminant analysis, whereas the non-linear multivariate method uses a combination of Kohonen Self-Organizing Maps, Cluster Analysis, and Support Vector Machines. The final models were tested with recent and independent data collected from stations in the Eagle Creek watershed, within the White River basin. In 6 out of 20 models the Support Vector Machine more accurately classified the Eagle Creek stations, and in 2 out of 20 models the Linear Discriminant Analysis model achieved better results. Neither the linear or non-linear models had an apparent advantage for the remaining 12 models. This research provides an insight into the variability and uncertainty in the interpretation of the various statistical estimates and statistical models, when water quality monitoring data is combined with spatial data for characterizing general spatial and spatio-temporal trends.
|
Page generated in 0.1083 seconds