Spelling suggestions: "subject:"diffusion kernel"" "subject:"dediffusion kernel""
1 |
Biological and clinical data integration and its applications in healthcareHagen, Matthew 07 January 2016 (has links)
Answers to the most complex biological questions are rarely determined solely from the experimental evidence. It requires subsequent analysis of many data sources that are often heterogeneous. Most biological data repositories focus on providing only one particular type of data, such as sequences, molecular interactions, protein structure, or gene expression. In many cases, it is required for researchers to visit several different databases to answer one scientific question. It is essential to develop strategies to integrate disparate biological data sources that are efficient and seamless to facilitate the discovery of novel associations and validate existing hypotheses.
This thesis presents the design and development of different integration strategies of biological and clinical systems.
The BioSPIDA system is a data warehousing solution that integrates
many NCBI databases and other biological sources on protein sequences,
protein domains, and biological pathways. It utilizes a universal
parser facilitating integration without developing separate source
code for each data site. This enables users to execute fine-grained
queries that can filter genes by their protein interactions, gene
expressions, functional annotation, and protein domain
representation. Relational databases can powerfully return and
generate quickly filtered results to research questions, but they are not the most suitable solution in all cases. Clinical patients and genes are typically annotated by concepts in hierarchical ontologies and performance of relational databases are weakened considerably when traversing and representing graph structures. This thesis illustrates when relational databases are most suitable as well as comparing the performance benchmarks of semantic web technologies and graph databases when comparing ontological concepts.
Several approaches of analyzing integrated data will be discussed to demonstrate the advantages over dependencies on remote data centers. Intensive Care Patients are prioritized by their length of stay and their severity class is estimated by their diagnosis to help minimize wait time and preferentially treat patients by their condition. In a separate study, semantic clustering of patients is conducted by integrating a clinical database and a medical ontology to help identify multi-morbidity patterns.
In the biological area, gene pathways, protein interaction networks, and functional annotation are integrated to help predict and prioritize candidate disease genes. This thesis will present the results that were able to be generated from each project through utilizing a local repository of genes, functional annotations, protein interactions, clinical patients, and medical ontologies.
|
2 |
Adaptive methods for autonomous environmental modellingKemppainen, A. (Anssi) 26 March 2018 (has links)
Abstract
In this thesis, we consider autonomous environmental modelling, where robotic sensing platforms are utilized in environmental surveying. In order to allow a wide range of different environments, our models must be flexible to the data with some a prior assumptions. Respectively, in order to guide action planning, we need to have a unified sensing quality metric that depends on the prediction quality of our models. Finally, in order to be able to adapt to the observed information, at each iteration of the action planning algorithm, we must be able to provide solutions that aim at minimum travelling time needed to reach a certain level of sensing quality. These are the main topics in this thesis.
At the center of our approaches are stationary and non-stationary Gaussian processes based on the assumption that the observed phenomenon is due to the diffusion of white noise, where diffusion kernel anisotropy and scale may vary between locations. For these models, we propose adaptation of diffusion kernels based on a structure tensor approach. Proposed methods are demonstrated with experiments that show, assuming sensor noise is not dominating, our iterative approach is able to return diffusion kernel values close to correct ones.
In order to quantify how precise our models are, we propose a mutual information based sensing quality criterion, and prove that the optimal design using our sensing quality provides the best prediction quality for the model. To incorporate localization uncertainty in modelling, we also propose an approach where a posterior model is marginalized over sensing path distribution. The benefit is that this approach implicitly favors actions that result in previously visited or otherwise well-defined areas, meanwhile, maximizing the information gain. Experiments support our claims that our proposed approaches are best when considering predictive distribution quality.
In action planning, our approach is to use graph-based approximation algorithms to obtain a certain level of model quality in an efficient way. In order account for spatial dependency and active localization, we propose adaptation methods that map sensing quality to vertex prices in a graph. Experiments demonstrate the benefit of our adaptation methods compared to the action planning algorithms that do not consider these specific features. / Tiivistelmä
Tässä väitöskirjassa tarkastellaan autonomista ympäristön mallinnusta, missä ympäristön kartoitukseen hyödynnetään robottimittausalustoja. Erilaisia ympäristöjä varten, käytettävien mallien tulee olla joustavia datalle tietyillä a priori oletuksilla. Mittausalustojen ohjaus vaatii vastaavasti yhtenäisen, mallien ennustuslaadusta riippuvan, kartoituksen laatumetriikan. Mukautuakseen uuteen informaatioon, ohjausalgoritmin tulee lisäksi pyrkiä joka iteraatiolla minimoimaan tietyn kartoituksen laadun saavuttava kulkuaika. Nämä ovat tämän väitöskirjan pääaiheet.
Tämän väitöskirjan keskiössä ovat sellaiset stationaariset ja ei-stationaariset Gaussin prosessit, jotka perustuvat oletukseen että havaittu ilmiö johtuu valkoisen kohinan diffuusiosta. Diffuusiokernelin anisotrooppisuudelle ja skaalalle sallitaan paikkariippuvaisuus. Tässä väitöskirjassa esitetään näiden mallien mukauttamiseen rakennetensoripohjaisia menetelmiä. Suoritetut kokeet osoittavat, että esitetyt iteratiiviset mukauttamismenetelmät tuottavat lähes oikeita diffuusiokernelien arvoja, olettaen, että sensorikohina ei dominoi mittauksia.
Mallien ennustustarkkuuden määrittämiseen esitetään keskinäisinformaatioon perustuva kartoituksen laatumetriikka. Väitöskirjassa todistetaan, että optimaalinen ennustuslaatu saavutetaan käyttämällä esitettyä laatumetriikkaa. Väitöskirjassa esitetään lisäksi laatumetriikka, jossa posteriori malli on marginalisoitu kartoituspolkujen jakauman yli. Tämän avulla voidaan huomioida paikannusepävarmuuden vaikutukset mallinnuksessa. Tällöin etuna on se, että kyseinen laatumetriikka suosii implisiittisesti sellaisia mittausalustojen ohjauksia, jotka johtavat aeimmin kartoitetuille tai helposti ennustettaville alueille samalla maksimoiden informaatiohyödyn. Suoritetut kokeet tukevat väittämiä, että väitöskirjassa esitetyt menetelmät tuottavat parhaan ennustusjakauman laadun.
Mittausalustojen ohjaus vaatii vastaavasti yhtenäisen, mallien ennustuslaadusta riippuvan, kartoituksen laatumetriikan. Väitöskirjassa esitetään mukautusmenetelmiä kartoituksen laadun kuvaukseksi graafin solmujen kustannuksiksi. Tämän avulla sallitaan sekä spatiaalinen riippuvuus että aktiivinen paikannus. Mittausalustojen ohjaus vaatii vastaavasti yhtenäisen, mallien ennustuslaadusta riippuvan, kartoituksen laatumetriikan.
|
Page generated in 0.0714 seconds