Spelling suggestions: "subject:"multiomics"" "subject:"multiomic""
31 |
Unraveling the Multi-omic Network and Pathway Alterations in Alzheimer's DiseaseLinhui Xie (19175077) 03 September 2024 (has links)
<p dir="ltr">Multi-omic studies ranging from genomics, transcriptomics (e.g., gene expression) to proteomics data exploration have been widely applied to interpret findings from genome wide association studies (GWAS) of Alzheimer's disease (AD). However, previous studies examine each -omics data type individually and the functional interactions between genetic variations, genes and proteins are only used after discovery to interpret the findings, but not beforehand. In this case, multi-omic findings are likely not functionally related and therefore it is challenging for result interpretation. To handle this challenge, we present new modularity constrained least absolute shrinkage and selection operator (M-LASSO), new modularity constrained logistic regression (M-Logistic), new interpretable multi-omic graph fusion neural network model (MoFNet) and new transfer learning framework integrated graph fusion neural network model (TransFuse) to integrate prior biological knowledge to model the functional interactions of multi-omic data. These approaches aim to identify functional connected sub-networks predictive of AD. In this thesis, the intrepretable model MoFNet and TransFuse incorporate prior biological connected multi-omics network, and for the first time model the dynamic information flow from deoxyribonucleic acid (DNA) to ribonucleic acid (RNA) and proteins. While applying the proposed models on multi-omic data from the religious orders study/memory and aging project (ROS/MAP) cohort, MoFNet and TransFuse outperformed all other state-of-art classifiers. Instead of targeting individual markers, the proposed methods identified multi-omic sub-networks associated with AD. MoFNet and TransFuse, produced sub-network and pathway findings that were robustly validated in another independent cohort. These identified gene/protein networks highlight potential pathways involved in AD pathogenesis and could offer systematic overview for understanding the molecular mechanisms of the disease. Investigating these identified pathways in more detail could help uncover the mechanisms causing synaptic dysfunction in AD and guide future research into potential therapeutic targets.</p>
|
32 |
Integrative analysis of data from multiple experimentsRonen, Jonathan 22 July 2020 (has links)
Auf die Entwicklung der Hochdurchsatz-Sequenzierung (HTS) folgte eine Reihe
von speziellen Erweiterungen, die erlauben verschiedene zellbiologischer Aspekte wie Genexpression, DNA-Methylierung, etc. zu messen. Die Analyse dieser Daten erfordert die Entwicklung von Algorithmen, die einzelne Experimenteberücksichtigen oder mehrere Datenquellen gleichzeitig in betracht nehmen. Der letztere Ansatz bietet besondere Vorteile bei Analyse von einzelligen RNA-Sequenzierung (scRNA-seq) Experimenten welche von besonders hohem technischen Rauschen, etwa durch den Verlust an Molekülen durch die Behandlung geringer Ausgangsmengen, gekennzeichnet sind. Um diese experimentellen Defizite auszugleichen, habe ich eine Methode namens netSmooth entwickelt, welche die scRNA-seq-Daten entrascht und fehlende Werte mittels Netzwerkdiffusion über ein Gennetzwerk imputiert. Das Gennetzwerk reflektiert dabei erwartete Koexpressionsmuster von Genen. Unter Verwendung eines Gennetzwerks, das aus Protein-Protein-Interaktionen aufgebaut ist, zeige ich, dass netSmooth anderen hochmodernen scRNA-Seq-Imputationsmethoden bei der Identifizierung von Blutzelltypen in der Hämatopoese, zur Aufklärung von Zeitreihendaten unter Verwendung eines embryonalen Entwicklungsdatensatzes und für die Identifizierung von Tumoren der Herkunft für scRNA-Seq von Glioblastomen überlegen ist. netSmooth hat einen freien Parameter, die Diffusionsdistanz, welche durch datengesteuerte Metriken optimiert werden kann. So kann netSmooth auch dann eingesetzt werden, wenn der optimale Diffusionsabstand nicht explizit mit Hilfe von externen Referenzdaten optimiert werden kann. Eine integrierte Analyse ist auch relevant wenn multi-omics Daten von mehrerer Omics-Protokolle auf den gleichen biologischen Proben erhoben wurden. Hierbei erklärt jeder einzelne dieser Datensätze nur einen Teil des zellulären Systems, während die gemeinsame Analyse ein vollständigeres Bild ergibt. Ich entwickelte eine Methode namens maui, um eine latente Faktordarstellungen von multiomics Daten zu finden. / The development of high throughput sequencing (HTS) was followed by a swarm of protocols utilizing HTS to measure different molecular aspects such as gene expression (transcriptome), DNA methylation (methylome) and more. This opened opportunities for developments of data analysis algorithms and procedures that consider data produced by different experiments. Considering data from seemingly unrelated experiments is particularly beneficial for Single cell RNA sequencing (scRNA-seq). scRNA-seq produces particularly noisy data, due to loss of nucleic acids when handling the small amounts in single cells, and various technical biases. To address these challenges, I developed a method called netSmooth, which de-noises and imputes scRNA-seq data by applying network diffusion over a gene network which encodes expectations of co-expression patterns. The gene network is constructed from other experimental data. Using a gene network constructed from protein-protein interactions, I show that netSmooth outperforms other state-of-the-art scRNA-seq imputation methods at the identification of blood cell types in hematopoiesis, as well as elucidation of time series data in an embryonic development dataset, and identification of tumor of origin for scRNA-seq of glioblastomas. netSmooth has a free parameter, the diffusion distance, which I show can be selected using data-driven metrics. Thus, netSmooth may be used even in cases when the diffusion distance cannot be optimized explicitly using ground-truth labels. Another task which requires in-tandem analysis of data from different experiments arises when different omics protocols are applied to the same biological samples. Analyzing such multiomics data in an integrated fashion, rather than each data type (RNA-seq, DNA-seq, etc.) on its own, is benefitial, as each omics experiment only elucidates part of an integrated cellular system. The simultaneous analysis may reveal a comprehensive view.
|
33 |
New insights for enhancing feed efficiencyMora Fenoll, Mónica 27 September 2025 (has links)
[ES] La tesis abarca una serie de estudios destinados a mejorar los programas de selección genética para aumentar la eficiencia alimentaria en dos etapas de la vida productiva de los cerdos: lactación y crecimiento. En los capítulos 2 al 5 se exploraron diversas metodologías y fuentes de información (genética, genómica y fenómica) para lograr este objetivo.
La eficiencia alimentaria durante la lactación es un sistema complejo de rasgos fenotípicos interrelacionados. En el Capítulo 2 se usaron modelos de ecuaciones estructurales para inferir las asociaciones causales entre la ingesta diaria de alimento, el balance de peso de la cerda, la ganancia de peso de la camada, el balance de espesor de grasa dorsal y el peso metabólico de la cerda. Se analizaron datos de 1.100 cerdas de un experimento de selección divergente para la eficiencia en cerdos en crecimiento. Se utilizó el algoritmo de causación inductiva para definir el modelo de ecuaciones estructurales. Los resultados indicaron que la ingesta diaria de alimento y la ganancia diaria de peso de la camada influenciaban el balance diario de peso de la cerda, con coeficientes estructurales medios de 0.12 y -0.03, respectivamente. Posteriormente, el balance diario de peso de la cerda impactó en el balance diario del grosor de la grasa dorsal y en el peso metabólico de la cerda, con coeficientes estructurales de 0,70 y -1,22, respectivamente. Se evaluaron diferentes estrategias de selección. Las estrategias de selección que no dependían de registros de ingesta alimentaria resultaron igualmente efectivas, aunque aumentar la ganancia de peso de la camada reduciendo o manteniendo constante la ingesta alimentaria sin deteriorar la condición corporal de la cerda parece difícil.
En el Capítulo 3 se exploraron los beneficios de métodos de multi-output y stacking para mejorar la precisión de la predicción de la eficiencia alimentaria a partir del genotipo de cerdos en crecimiento. Se analizaron datos de 5.828 cerdos y 45.610 SNPs, implementando cuatro estrategias diferentes. Modelos de random forest y support vector regression fueron entrenados con diferentes subconjuntos de variables predictoras (de 200 a 3000 SNPs más informativos). La estrategia estándar, que utilizaba solo los genotipos como predictores, mostró el mejor rendimiento. Con el algoritmo random forest y los 1.000 SNPs más informativos, la correlación de Spearman promedio fue 0.23 (0.04).
En cuanto a la fenotipado de alto rendimiento, se propuso el uso de los acelerómetros y las cámaras para obtener información sobre el comportamiento animal. En el Capítulo 4, 16 conejos fueron equipados con acelerómetros y grabados durante 2 semanas. Se segmentaron las series temporales en ventanas de tiempo de diferentes tamaños (1, 3, 5, 7 y 9 segundos) y se calcularon 41 características por ventana. Modelos de random forest, support vector machine y gradient boosting fueron entrenados para clasificar estados activos/inactivos. El modelo de random forest, con una ventana de 9 segundos y las 5 características más importantes, alcanzó una precisión mediana de 1 y una recall mediana de 0.93.
Finalmente, en el Capítulo 5 se combinó un algoritmo de seguimiento por detección con un sistema de identificación por radiofrecuencia para rastrear doce cerdos de un corral de los cuales tres cerdos tenían marcas de pelaje únicas que facilitaban su distinción visual. Se implementaron el algoritmo You Only Look Once (v8) para detección y el algoritmo BoT-SORT para seguimiento. Los cerdos con pelajes similares se rastrearon durante un promedio de 49 minutos, mientras que los cerdos con marcas únicas se rastrearon 152 minutos, con una coincidencia del 90% o más con la verdad absoluta. Esta combinación de dispositivos representa un avance significativo en la identificación, seguimiento y trazabilidad de animales en grupo. / [CA] La tesi comprén una sèrie d'estudis destinats a millorar els programes de selecció genètica per a augmentar l'eficiència alimentària en dos etapes de la vida productiva dels porcs: lactació i creixement. En els capítols 2 al 5 es van explorar diverses metodologies i fonts d'informació (genètica, genòmica i fenómica) per a aconseguir este objectiu.
L'eficiència alimentària durant la lactació és un sistema complex de trets fenotípics interrelacionats. En el Capítol 2 es van usar models d'equacions estructurals per a inferir les associacions causals entre la ingesta diària d'aliment, el balanç de pes de la truja, l'augment de pes de la ventrada, el balanç del gruix del greix dorsal i el pes metabòlic de la truja. Es van analitzar dades de 1.100 truges d'un experiment de selecció divergent per a l'eficiència en porcs en creixement. Es va utilitzar l'algorisme de causación inductiva per a definir el model d'equacions estructurals. Els resultats van indicar que la ingesta diària d'aliment i l'augment diari de pes de la ventrada van influir en el balanç diari de pes de la truja, amb coeficients estructurals mitjans posteriors de 0,12 i -0.03, respectivament. Posteriorment, el balanç diari de pes de la truja va impactar en el balanç diari del gruix del greix dorsal i en el pes metabòlic de la truja, amb coeficients estructurals de 0,70 i -1,22, respectivament. Es van avaluar diferents estratègies de selecció. Les estratègies de selecció que no depenien de registres d'ingesta alimentària van resultar igualment efectives, encara que augmentar el pes de la ventrada reduint o mantenint constant la ingesta alimentària sense deteriorar la condició corporal de la truja sembla difícil.
En el Capítol 3 es van explorar els beneficis de mètodes de multi-output i stacking per a millorar la precisió de la predicció de l'eficiència alimentària a partir del genotip de porcs en creixement. Es van analitzar dades de 5.828 porcs i 45.610 SNPs, implementant quatre estratègies diferents. Models de random forest i support vector regression van ser entrenats amb diferents subconjunts de variables predictores (de 200 a 3000 SNPs més informatius). L'estratègia estàndard, que utilitzava només els genotips com a predictors, va mostrar el millor rendiment. Amb l'algorisme random forest i els 1.000 SNPs més informatius, la correlació de Spearman mitjana va ser 0.23 (0.04).
Quant a la fenotipat d'alt rendiment, es va proposar l'ús dels acceleròmetres i càmeres per a obtindre informació sobre el comportament animal. En el Capítol 4, 16 conills van ser equipats amb acceleròmetres i gravats durant 2 setmanes. Es van segmentar les sèries temporals en finestres de temps de diferents grandàries (1, 3, 5, 7 i 9 segons) i es van calcular 41 característiques per finestra. Models de random forest, support vector machine i gradient boosting van ser entrenats per a classificar estats actius/inactius. El model de random forest, amb una finestra de 9 segons i les 5 característiques més importants, va aconseguir una precisió mitjana d'1 i una recall mitjana de 0.93.
Finalment, en el Capítol 5 es va combinar un algorisme de seguiment per detecció amb un sistema d'identificació per radiofreqüència per a rastrejar dotze porcs d'un corral dels quals tres tenien marques de pelatge úniques que facilitaven la seua distinció visual. Es van implementar l'algorisme You Only Look Onze (v8) per a detecció i l'algorisme Bot-SORT per a seguiment. Els porcs amb pelatges similars es van rastrejar durant una mitjana de 49 minuts, mentres que els porcs amb marques úniques es van rastrejar 152 minuts, amb una coincidència del 90% o més amb la veritat absoluta. Esta combinació de dispositius representa un avanç significatiu en la identificació, seguiment i traçabilitat d'animals en grup. / [EN] The thesis comprises a series of studies aimed at improving genetic selection programs to increase feed efficiency at two stages of the productive life of pigs: lactation and growth. In Chapters 2 to 5, various methodologies and sources of information (genetics, genomics, and phenomics) were explored to achieve this goal.
Feed efficiency during lactation is a complex system of interrelated phenotypic traits. In Chapter 2, structural equation models were used to infer the causal associations between daily feed intake, sow weight balance, litter weight gain, backfat thickness balance, and sow metabolic body weight. Data from 1,100 sows from a divergent selection experiment for efficiency in growing pigs were analysed. The inductive causation algorithm was used to define the structural equation model. Results indicated that daily feed intake and daily litter weight gain influenced daily sow weight balance, with average structural coefficients of 0.12 and -0.03, respectively. Subsequently, daily sow weight balance impacted daily backfat thickness balance and sow metabolic body weight, with structural coefficients of 0.70 and -1.22, respectively. Different selection strategies were evaluated. Selection strategies that did not rely on feed intake records proved equally effective, although increasing litter weight gain while reducing or maintaining constant feed intake without deteriorating the sow's body condition seems challenging.
In Chapter 3, the benefits of multi-output and stacking methods to improve the accuracy of predicting feed efficiency from the genotype of growing pigs were explored. Data from 5,828 pigs and 45,610 SNPs were analysed, implementing four different strategies. Random forest and support vector regression models were trained with different subsets of predictor variables (from 200 to 3,000 of the most informative SNPs). The standard strategy, which used only genotypes as predictors, showed the best performance. With the random forest algorithm and the top 1,000 SNPs, the average Spearman correlation was 0.23 (0.04).
Regarding high-throughput phenotyping, the use of accelerometers and cameras to obtain information on animal behaviour was proposed. In Chapter 4, 16 rabbits were equipped with accelerometers and filmed for 2 weeks. The time series were segmented into time windows of different sizes (1, 3, 5, 7, and 9 seconds), and 41 features were calculated per window. Random forest, support vector machine, and gradient boosting models were trained to classify active/inactive states. The random forest model, with a 9-second window and the 5 most important features, achieved a median precision of 1 and a median recall of 0.93.
Finally, in Chapter 5, a tracking-by-detection algorithm was combined with a radio frequency identification system to track twelve pigs in a pen, three of which had unique coat markings that facilitated visual distinction. The You Only Look Once (v8) algorithm was implemented for detection and the BoT-SORT algorithm for tracking. Pigs with similar coat markings were tracked for an average of 49 minutes, while pigs with unique markings were tracked for 152 minutes, with a 90% or higher match with the ground truth. This combination of devices represents a significant advancement in the identification, tracking, and traceability of animals in groups. / Mora Fenoll, M. (2024). New insights for enhancing feed efficiency [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/211262
|
34 |
Beyond hairballs: depicting complexity of a kinase-phosphatase network in the budding yeastAbd-Rabbo, Diala 01 1900 (has links)
No description available.
|
35 |
Intelligent Energy-Savings and Process Improvement Strategies in Energy-Intensive Industries / Intelligent Energy-Savings and Process Improvement Strategies in Energy-Intensive IndustriesTeng, Sin Yong January 2020 (has links)
S tím, jak se neustále vyvíjejí nové technologie pro energeticky náročná průmyslová odvětví, stávající zařízení postupně zaostávají v efektivitě a produktivitě. Tvrdá konkurence na trhu a legislativa v oblasti životního prostředí nutí tato tradiční zařízení k ukončení provozu a k odstavení. Zlepšování procesu a projekty modernizace jsou zásadní v udržování provozních výkonů těchto zařízení. Současné přístupy pro zlepšování procesů jsou hlavně: integrace procesů, optimalizace procesů a intenzifikace procesů. Obecně se v těchto oblastech využívá matematické optimalizace, zkušeností řešitele a provozní heuristiky. Tyto přístupy slouží jako základ pro zlepšování procesů. Avšak, jejich výkon lze dále zlepšit pomocí moderní výpočtové inteligence. Účelem této práce je tudíž aplikace pokročilých technik umělé inteligence a strojového učení za účelem zlepšování procesů v energeticky náročných průmyslových procesech. V této práci je využit přístup, který řeší tento problém simulací průmyslových systémů a přispívá následujícím: (i)Aplikace techniky strojového učení, která zahrnuje jednorázové učení a neuro-evoluci pro modelování a optimalizaci jednotlivých jednotek na základě dat. (ii) Aplikace redukce dimenze (např. Analýza hlavních komponent, autoendkodér) pro vícekriteriální optimalizaci procesu s více jednotkami. (iii) Návrh nového nástroje pro analýzu problematických částí systému za účelem jejich odstranění (bottleneck tree analysis – BOTA). Bylo také navrženo rozšíření nástroje, které umožňuje řešit vícerozměrné problémy pomocí přístupu založeného na datech. (iv) Prokázání účinnosti simulací Monte-Carlo, neuronové sítě a rozhodovacích stromů pro rozhodování při integraci nové technologie procesu do stávajících procesů. (v) Porovnání techniky HTM (Hierarchical Temporal Memory) a duální optimalizace s několika prediktivními nástroji pro podporu managementu provozu v reálném čase. (vi) Implementace umělé neuronové sítě v rámci rozhraní pro konvenční procesní graf (P-graf). (vii) Zdůraznění budoucnosti umělé inteligence a procesního inženýrství v biosystémech prostřednictvím komerčně založeného paradigmatu multi-omics.
|
Page generated in 0.0417 seconds