Spelling suggestions: "subject:"omics data"" "subject:"lmics data""
11 |
Deep Learning Strategies for Overcoming Diagnosis Challenges with Limited AnnotationsAmor del Amor, María Rocío del 27 November 2023 (has links)
Tesis por compendio / [ES] En los últimos años, el aprendizaje profundo (DL) se ha convertido en una de
las principales áreas de la inteligencia artificial (IA), impulsado principalmente
por el avance en la capacidad de procesamiento. Los algoritmos basados en
DL han logrado resultados asombrosos en la comprensión y manipulación de
diversos tipos de datos, incluyendo imágenes, señales de habla y texto.
La revolución digital del sector sanitario ha permitido la generación de nuevas
bases de datos, lo que ha facilitado la implementación de modelos de DL bajo
el paradigma de aprendizaje supervisado. La incorporación de estos métodos
promete mejorar y automatizar la detección y el diagnóstico de enfermedades,
permitiendo pronosticar su evolución y facilitar la aplicación de intervenciones
clínicas de manera más efectiva.
Una de las principales limitaciones de la aplicación de algoritmos de DL
supervisados es la necesidad de grandes bases de datos anotadas por expertos,
lo que supone una barrera importante en el ámbito médico. Para superar este
problema, se está abriendo un nuevo campo de desarrollo de estrategias de
aprendizaje no supervisado o débilmente supervisado que utilizan los datos
disponibles no anotados o débilmente anotados. Estos enfoques permiten
aprovechar al máximo los datos existentes y superar las limitaciones de la
dependencia de anotaciones precisas.
Para poner de manifiesto que el aprendizaje débilmente supervisado puede
ofrecer soluciones óptimas, esta tesis se ha enfocado en el desarrollado de
diferentes paradigmas que permiten entrenar modelos con bases de datos
débilmente anotadas o anotadas por médicos no expertos. En este sentido, se
han utilizado dos modalidades de datos ampliamente empleadas en la literatura
para estudiar diversos tipos de cáncer y enfermedades inflamatorias: datos
ómicos e imágenes histológicas. En el estudio sobre datos ómicos, se han
desarrollado métodos basados en deep clustering que permiten lidiar con las
altas dimensiones inherentes a este tipo de datos, desarrollando un modelo predictivo sin la necesidad de anotaciones. Al comparar el método propuesto
con otros métodos de clustering presentes en la literatura, se ha observado una
mejora en los resultados obtenidos.
En cuanto a los estudios con imagen histológica, en esta tesis se ha abordado
la detección de diferentes enfermedades, incluyendo cáncer de piel (melanoma
spitzoide y neoplasias de células fusocelulares) y colitis ulcerosa. En este
contexto, se ha empleado el paradigma de multiple instance learning (MIL)
como línea base en todos los marcos desarrollados para hacer frente al
gran tamaño de las imágenes histológicas. Además, se han implementado
diversas metodologías de aprendizaje, adaptadas a los problemas específicos
que se abordan. Para la detección de melanoma spitzoide, se ha utilizado
un enfoque de aprendizaje inductivo que requiere un menor volumen de
anotaciones. Para abordar el diagnóstico de colitis ulcerosa, que implica la
identificación de neutrófilos como biomarcadores, se ha utilizado un enfoque de
aprendizaje restrictivo. Con este método, el coste de anotación se ha reducido
significativamente al tiempo que se han conseguido mejoras sustanciales en los
resultados obtenidos. Finalmente, considerando el limitado número de expertos
en el campo de las neoplasias de células fusiformes, se ha diseñado y validado
un novedoso protocolo de anotación para anotaciones no expertas. En este
contexto, se han desarrollado modelos de aprendizaje profundo que trabajan
con la incertidumbre asociada a dichas anotaciones.
En conclusión, esta tesis ha desarrollado técnicas de vanguardia para abordar
el reto de la necesidad de anotaciones precisas que requiere el sector médico.
A partir de datos débilmente anotados o anotados por no expertos, se han
propuesto novedosos paradigmas y metodologías basados en deep learning para
abordar la detección y diagnóstico de enfermedades utilizando datos ómicos
e imágenes histológicas. / [CA] En els últims anys, l'aprenentatge profund (DL) s'ha convertit en una de les
principals àrees de la intel·ligència artificial (IA), impulsat principalment per
l'avanç en la capacitat de processament. Els algorismes basats en DL han
aconseguit resultats sorprenents en la comprensió i manipulació de diversos
tipus de dades, incloent-hi imatges, senyals de parla i text.
La revolució digital del sector sanitari ha permés la generació de noves
bases de dades, la qual cosa ha facilitat la implementació de models de
DL sota el paradigma d'aprenentatge supervisat. La incorporació d'aquests
mètodes promet millorar i automatitzar la detecció i el diagnòstic de malalties,
permetent pronosticar la seua evolució i facilitar l'aplicació d'intervencions
clíniques de manera més efectiva.
Una de les principals limitacions de l'aplicació d'algorismes de DL supervisats
és la necessitat de grans bases de dades anotades per experts, la qual cosa
suposa una barrera important en l'àmbit mèdic. Per a superar aquest
problema, s'està obrint un nou camp de desenvolupament d'estratègies
d'aprenentatge no supervisat o feblement supervisat que utilitzen les dades
disponibles no anotades o feblement anotats. Aquests enfocaments permeten
aprofitar al màxim les dades existents i superar les limitacions de la
dependència d'anotacions precises.
Per a posar de manifest que l'aprenentatge feblement supervisat pot oferir
solucions òptimes, aquesta tesi s'ha enfocat en el desenvolupat de diferents
paradigmes que permeten entrenar models amb bases de dades feblement
anotades o anotades per metges no experts. En aquest sentit, s'han utilitzat
dues modalitats de dades àmpliament emprades en la literatura per a estudiar
diversos tipus de càncer i malalties inflamatòries: dades ómicos i imatges
histològiques. En l'estudi sobre dades ómicos, s'han desenvolupat mètodes
basats en deep clustering que permeten bregar amb les altes dimensions
inherents a aquesta mena de dades, desenvolupant un model predictiu sense la
necessitat d'anotacions. En comparar el mètode proposat amb altres mètodes
de clustering presents en la literatura, s'ha observat una millora en els resultats
obtinguts.
Quant als estudis amb imatge histològica, en aquesta tesi s'ha abordat la
detecció de diferents malalties, incloent-hi càncer de pell (melanoma spitzoide
i neoplàsies de cèl·lules fusocelulares) i colitis ulcerosa. En aquest context,
s'ha emprat el paradigma de multiple instance learning (MIL) com a línia
base en tots els marcs desenvolupats per a fer front a la gran grandària de
les imatges histològiques. A més, s'han implementat diverses metodologies
d'aprenentatge, adaptades als problemes específics que s'aborden. Per a la
detecció de melanoma spitzoide, s'ha utilitzat un enfocament d'aprenentatge
inductiu que requereix un menor volum d'anotacions. Per a abordar el
diagnòstic de colitis ulcerosa, que implica la identificació de neutròfils com
biomarcadores, s'ha utilitzat un enfocament d'aprenentatge restrictiu. Amb
aquest mètode, el cost d'anotació s'ha reduït significativament al mateix
temps que s'han aconseguit millores substancials en els resultats obtinguts.
Finalment, considerant el limitat nombre d'experts en el camp de les neoplàsies
de cèl·lules fusiformes, s'ha dissenyat i validat un nou protocol d'anotació
per a anotacions no expertes. En aquest context, s'han desenvolupat models
d'aprenentatge profund que treballen amb la incertesa associada a aquestes
anotacions.
En conclusió, aquesta tesi ha desenvolupat tècniques d'avantguarda per a
abordar el repte de la necessitat d'anotacions precises que requereix el sector
mèdic. A partir de dades feblement anotades o anotats per no experts,
s'han proposat nous paradigmes i metodologies basats en deep learning per a
abordar la detecció i diagnòstic de malalties utilitzant dades *ómicos i imatges
histològiques. Aquestes innovacions poden millorar l'eficàcia i l'automatització
en la detecció precoç i el seguiment de malalties. / [EN] In recent years, deep learning (DL) has become one of the main areas of
artificial intelligence (AI), driven mainly by the advancement in processing
power. DL-based algorithms have achieved amazing results in understanding
and manipulating various types of data, including images, speech signals and
text.
The digital revolution in the healthcare sector has enabled the generation
of new databases, facilitating the implementation of DL models under the
supervised learning paradigm. Incorporating these methods promises to
improve and automate the detection and diagnosis of diseases, allowing
the prediction of their evolution and facilitating the application of clinical
interventions with higher efficacy.
One of the main limitations in the application of supervised DL algorithms is
the need for large databases annotated by experts, which is a major barrier
in the medical field. To overcome this problem, a new field of developing
unsupervised or weakly supervised learning strategies using the available
unannotated or weakly annotated data is opening up. These approaches make
the best use of existing data and overcome the limitations of reliance on precise
annotations.
To demonstrate that weakly supervised learning can offer optimal solutions,
this thesis has focused on developing different paradigms that allow training
models with weakly annotated or non-expert annotated databases. In this
regard, two data modalities widely used in the literature to study various
types of cancer and inflammatory diseases have been used: omics data and
histological images. In the study on omics data, methods based on deep
clustering have been developed to deal with the high dimensions inherent to
this type of data, developing a predictive model without requiring annotations.
In comparison, the results of the proposed method outperform other existing
clustering methods.
Regarding histological imaging studies, the detection of different diseases has
been addressed in this thesis, including skin cancer (spitzoid melanoma and
spindle cell neoplasms) and ulcerative colitis. In this context, the multiple
instance learning (MIL) paradigm has been employed as the baseline in
all developed frameworks to deal with the large size of histological images.
Furthermore, diverse learning methodologies have been implemented, tailored
to the specific problems being addressed. For the detection of spitzoid
melanoma, an inductive learning approach has been used, which requires a
smaller volume of annotations. To address the diagnosis of ulcerative colitis,
which involves the identification of neutrophils as biomarkers, a constraint
learning approach has been utilized. With this method, the annotation cost
has been significantly reduced while achieving substantial improvements in the
obtained results. Finally, considering the limited number of experts in the field
of spindle cell neoplasms, a novel annotation protocol for non-experts has been
designed and validated. In this context, deep learning models that work with
the uncertainty associated with such annotations have been developed.
In conclusion, this thesis has developed cutting-edge techniques to address
the medical sector's challenge of precise data annotation. Using weakly
annotated or non-expert annotated data, novel paradigms and methodologies
based on deep learning have been proposed to tackle disease detection and
diagnosis in omics data and histological images. These innovations can improve
effectiveness and automation in early disease detection and monitoring. / The work of Rocío del Amor to carry out this research and to elaborate this
dissertation has been supported by the Spanish Ministry of Universities under
the FPU grant FPU20/05263. / Amor Del Amor, MRD. (2023). Deep Learning Strategies for Overcoming Diagnosis Challenges with Limited Annotations [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/200227 / Compendio
|
12 |
Computational Methods to Characterize the Etiology of Complex Diseases at Multiple LevelsElmansy, Dalia F. 29 May 2020 (has links)
No description available.
|
13 |
Projection of High-Dimensional Genome-Wide Expression on SOM Transcriptome LandscapesNikoghosyan, Maria, Loeffler-Wirth, Henry, Davidavyan, Suren, Binder, Hans, Arakelyan, Arsen 23 January 2024 (has links)
The self-organizing maps portraying has been proven to be a powerful approach for
analysis of transcriptomic, genomic, epigenetic, single-cell, and pathway-level data as well as for
“multi-omic” integrative analyses. However, the SOM method has a major disadvantage: it requires
the retraining of the entire dataset once a new sample is added, which can be resource- and timedemanding.
It also shifts the gene landscape, thus complicating the interpretation and comparison
of results. To overcome this issue, we have developed two approaches of transfer learning that
allow for extending SOM space with new samples, meanwhile preserving its intrinsic structure. The
extension SOM (exSOM) approach is based on adding secondary data to the existing SOM space by
“meta-gene adaptation”, while supervised SOM portrayal (supSOM) adds support vector machine
regression model on top of the original SOM algorithm to “predict” the portrait of a new sample.
Both methods have been shown to accurately combine existing and new data. With simulated data,
exSOM outperforms supSOM for accuracy, while supSOM significantly reduces the computing time
and outperforms exSOM for this parameter. Analysis of real datasets demonstrated the validity of
the projection methods with independent datasets mapped on existing SOM space. Moreover, both
methods well handle the projection of samples with new characteristics that were not present in
training datasets.
|
14 |
Identifying markers of cell identity from single-cell omics dataVlot, Hendrika Cornelia 12 September 2023 (has links)
Einzelzell-Omics-Daten stehen derzeit im Fokus der Entwicklung computergestützter Methoden in der Molekularbiologie und Genetik. Einzelzellexperimenten lieferen dünnbesetzte, hochdimensionale Daten über zehntausende Gene oder hunderttausende regulatorische Regionen in zehntausenden Zellen. Diese Daten bieten den Forschenden die Möglichkeit, Gene und regulatorische Regionen zu identifizieren, welche die Bestimmung und Aufrechterhaltung der Zellidentität koordinieren. Die gängigste Strategie zur Identifizierung von Zellidentitätsmarkern besteht darin, die Zellen zu clustern und dann Merkmale zu finden, welche die Cluster unterscheiden, wobei davon ausgegangen wird, dass die Zellen innerhalb eines Clusters die gleiche Identität haben. Diese Annahme ist jedoch nicht immer zutreffend, insbesondere nicht für Entwicklungsdaten bei denen sich die Zellen in einem Kontinuum befinden und die Definition von Clustergrenzen biologisch gesehen potenziell willkürlich ist. Daher befasst sich diese Dissertation mit Clustering-unabhängigen Strategien zur Identifizierung von Markern aus Einzelzell-Omics-Daten. Der wichtigste Beitrag dieser Dissertation ist SEMITONES, eine auf linearer Regression basierende Methode zur Identifizierung von Markern. SEMITONES identifiziert (Gruppen von) Markern aus verschiedenen Arten von Einzelzell-Omics-Daten, identifiziert neue Marker und übertrifft bestehende Marker-Identifizierungsansätze. Außerdem ermöglicht die Identifizierung von regulatorischen Markerregionen durch SEMITONES neue Hypothesen über die Regulierung der Genexpression während dem Erwerb der Zellidentität. Schließlich beschreibt die Dissertation einen Ansatz zur Identifizierung neuer Markergene für sehr ähnliche, dennoch underschiedliche neurale Vorlauferzellen im zentralen Nervensystem von Drosphila melanogaster. Ingesamt zeigt die Dissertation, wie Cluster-unabhängige Ansätze zur Aufklärung bisher uncharakterisierter biologischer Phänome aus Einzelzell-Omics-Daten beitragen. / Single-cell omics approaches are the current frontier of computational method development in molecular biology and genetics. A single single-cell experiment provides sparse, high-dimensional data on tens of thousands of genes or hundreds of thousands of regulatory regions (i.e. features) in tens of thousands of cells (i.e. samples). This data provides researchers with an unprecedented opportunity to identify those genes and regulatory regions that determine and coordinate cell identity acquisition and maintenance. The most common strategy for identifying cell identity markers consists of clustering the cells and then identifying differential features between these clusters, assuming that cells within a cluster share the same identity. This assumption is, however, not guaranteed to hold, particularly for developmental data where cells lie along a continuum and inferring cluster boundaries becomes non-trivial and potentially biologically arbitrary. In response, this thesis presents clustering-independent strategies for marker feature identification from single-cell omics data. The primary contribution of this thesis is a linear regression-based method for marker feature identification from single-cell omics data called SEMITONES. SEMITONES can identify markers or marker sets from diverse single-cell omics data types, identifies novel markers, outperforms existing marker identification approaches. The thesis also describes how the identification of marker regulatory regions by SEMITONES enables the generation of novel hypotheses regarding gene regulation during cell identity acquisition. Lastly, the thesis describes the clustering-independent identification of novel marker genes for highly similar yet distinct neural progenitor cells in the Drosophila melanogaster central nervous system. Altogether, the thesis demonstrates how clustering-independent approaches aid the elucidation of yet uncharacterised biological patterns from single cell-omics data.
|
15 |
Beyond hairballs: depicting complexity of a kinase-phosphatase network in the budding yeastAbd-Rabbo, Diala 01 1900 (has links)
No description available.
|
Page generated in 0.049 seconds