Spelling suggestions: "subject:"coputational profile"" "subject:"comutational profile""
1 |
Multi-dimensional probing for RNA secondary structure(s) prediction / Analyse différentielle de données de sondage pour la prédiction des structures d'acides ribonucléiquesSaaidi, Afaf 01 October 2018 (has links)
En bioinformatique structurale, la prédiction de la (des) structure(s) secondaire(s) des acides ribonucléiques (ARNs) constitue une direction de recherche majeure pour comprendre les mécanismes cellulaires. Une approche classique pour la prédiction de la structure postule qu'à l'équilibre thermodynamique, l'ARN adopte plusieurs conformations, caractérisées par leur énergie libre, dans l’ensemble de Boltzmann. Les approches modernes privilégient donc une considération des conformations dominantes. Ces approches voient leur précision limitées par l'imprécision des modèles d'énergie et les restrictions topologiques pesant sur les espaces de conformations.Les données expérimentales peuvent être utilisées pour pallier aux lacunes des méthodes de prédiction. Différents protocoles permettent ainsi la révélation d'informations structurales partielles via une exposition à un réactif chimique/enzymatique, dont l'effet dépend, et est donc révélateur, de la (les) structure(s) adoptée(s). Les données de sondage mono-réactif sont utilisées pour valider et complémenter les modèles d’énergie libre, permettant ainsi d’améliorer la précision des prédictions. En pratique, cependant, les praticiens basent leur modélisation sur des données de sondage produites dans diverses conditions expérimentales, utilisant différents réactifs ou associées à une collection de séquences mutées. Une telle approche intégrative est répandue mais reste manuelle, onéreuse et subjective. Au cours de cette thèse, nous avons développé des méthodes in silico pour une modélisation automatisée de la structure à partir de plusieurs sources de données de sondage.En premier lieu, nous avons établi des pipelines d’analyse automatisés pour l'acquisition de profils de réactivité à partir de données brutes produites à travers une série de protocoles. Nous avons ensuite conçu et implémenté une nouvelle méthode qui permet l'intégration simultanée de plusieurs profils de sondage. Basée sur une combinaison d'échantillonnage de l'ensemble de Boltzmann et de clustering structurel, notre méthode produit des conformations dominantes, stables et compatible avec les données de sondage. En favorisant les structures récurrentes, notre méthode permet d’exploiter la complémentarité entre plusieurs données de sondage. Ses performances dans le cas mono-sondage sont comparables ou meilleures que celles des méthodes prédictives de pointe.Cette méthode a permis de proposer des modèles pour les régions structurées des virus. En collaboration avec des expérimentalistes, nous avons suggéré une structure raffinée de l'IRES du VIH-1 Gag, compatible avec les données de sondage chimiques et enzymatiques, qui nous a permis d’identifier des sites d'interactions putatifs avec le ribosome. Nous avons également modélisé la structure des régions non traduites d'Ebola. Cohérents avec les données de sondage SHAPE et les données de covariation, nos modèles montrent l’existence d'une tige-boucle conservée et stable à l'extrémité 5', une structure typiquement présente dans les génomes viraux pour protéger l'ARN de la dégradation par les nucléases.L’extension de notre méthode pour l’analyse simultanée de variants, appliquée dans un premier temps sur des mutants produits par le protocole Mutate-and-Map et sondés par le DMS, a permis d'enregistrer une amélioration en précision de prédiction. Pour éviter la production systématique de mutants ponctuels et exploiter le protocole récent SHAPEMap, nous avons conçu un protocole expérimental basé sur une mutagenèse non dirigé et le séquençage, où plusieurs ARN mutés sont produits et simultanément sondés. Nous avons traité l’affectation des reads aux mutants de références à l'aide d'une instance de l'algorithme "Expectation-Maximization" dont les résultats préliminaires, sur un échantillon de reads réduit/simulé, ont montré un faible taux d’erreurs d'assignation par rapport à une affectation classique des reads aux séquences d'ARN de référence. / In structural bioinformatics, predicting the secondary structure(s) of ribonucleic acids (RNAs) represents a major direction of research to understand cellular mechanisms. A classic approach for structure postulates that, at the thermodynamic equilibrium, RNA adopts its various conformations according to a Boltzmann distribution based on its free energy. Modern approaches, therefore, favor the consideration of the dominant conformations. Such approaches are limited in accuracy due to the imprecision of the energy model and the structure topology restrictions.Experimental data can be used to circumvent the shortcomings of predictive computational methods. RNA probing encompasses a wide array of experimental protocols dedicated to revealing partial structural information through exposure to a chemical or enzymatic reagent, whose effect depends on, and thus reveals, features of its adopted structure(s). Accordingly, single-reagent probing data is used to supplement free-energy models within computational methods, leading to significant gains in prediction accuracy. In practice, however, structural biologists integrate probing data produced in various experimental conditions, using different reagents or over a collection of mutated sequences, to model RNA structure(s). This integrative approach remains manual, time-consuming and arguably subjective in its modeling principles. In this Ph.D., we contributed in silico methods for an automated modeling of RNA structure(s) from multiple sources of probing data.We have first established automated pipelines for the acquisition of reactivity profiles from primary data produced through a variety of protocols (SHAPE, DMS using Capillary Electrophoresis, SHAPE-Map/Ion Torrent). We have designed and implemented a new, versatile, method that simultaneously integrates multiple probing profiles. Based on a combination of Boltzmann sampling and structural clustering, it produces alternative stable conformations jointly supported by a set of probing experiments. As it favors recurrent structures, our method allows exploiting the complementarity of several probing assays. The quality of predictions produced using our method compared favorably against state-of-the-art computational predictive methods on single-probing assays.Our method was used to identify models for structured regions in RNA viruses. In collaboration with experimental partners, we suggested a refined structure of the HIV-1 Gag IRES, showing a good compatibility with chemical and enzymatic probing data. The predicted structure allowed us to build hypotheses on binding sites that are functionally relevant to the translation. We also proposed conserved structures in Ebola Untranslated regions, showing a high consistency with both SHAPE probing and evolutionary data. Our modeling allows us to detect conserved and stable stem-loop at the 5’end of each UTR, a typical structure found in viral genomes to protect the RNA from being degraded by nucleases.Our method was extended to the analysis of sequence variants. We analyzed a collection of DMS probed mutants, produced by the Mutate-and-Map protocol, leading to better structural models for the GIR1 lariat-capping ribozyme than from the sole wild-type sequence. To avoid systematic production of point-wise mutants, and exploit the recent SHAPEMap protocol, we designed an experimental protocol based on undirected mutagenesis and sequencing, where several mutated RNAs are produced and simultaneously probed. Produced reads must then be re-assigned to mutants to establish their reactivity profiles used later for structure modeling. The assignment problem was modeled as a likelihood maximization joint inference of mutational profiles and assignments, and solved using an instance of the "Expectation-Maximization" algorithm. Preliminary results on a reduced/simulated sample of reads showed a remarkable decrease of the reads assignment errors compared to a classic algorithm.
|
2 |
Next-Generation Sequencing in the Identification of Biomarkers in Cutaneous Melanoma According to the Etiopathogenic Development Pathway and their Potential Clinical RelevanceMillán Esteban, David 12 May 2022 (has links)
Tesis por compendio / [ES] El melanoma es el tipo de cáncer de piel más mortífero y peligroso, ya que tumores de pequeño tamaño pueden generar metástasis. Hasta la fecha, se ha tratado de clasificar desde el punto de vista clínico, epidemiológico y molecular, empleándose actualmente el nivel de exposición solar y la localización del tumor como criterios principales para dividir en distintos grupos a los pacientes de melanoma.
En 1998, David Whiteman y colaboradores propusieron un "modelo de vías divergentes" para el desarrollo del melanoma. Este presentaba dos vías: una vinculada a la proliferación melanocítica (nevogénica) y otra relacionada con la exposición solar crónica (CSD). Corroborado desde el punto de vista clínico y epidemiológico, todavía no se ha aportado una caracterización molecular en profundidad.
A nivel general se habían identificado genes cuyas mutaciones eran relevantes para el desarrollo del melanoma, como por ejemplo KIT. Sin embargo, todavía se había de estudiar con más detalle la distribución de estas mutaciones entre los distintos subgrupos de melanoma, así como su posible valor pronóstico.
En esta tesis se han empleado técnicas de secuenciación - masiva y tradicional - para caracterizar los perfiles mutacionales de las poblaciones del modelo de vías divergentes. Encontramos diferencias tanto en el número de mutaciones como en los genes afectados. También hemos visto cómo los melanomas con mutaciones en KIT parecen desarrollarse por una vía independiente de la etiopatogenia conocida, careciendo el estatus mutacional de este gen de valor pronóstico para la supervivencia de los pacientes. / [CA] El melanoma és el tipus de càncer de pell més mortífer i perillós, ja que fins els tumors de menor mida poden acabar generant metàstasi. Al llarg dels anys, s'ha tractat de classificar des del punt de vista clínic, epidemiològic i molecular. Les classificacions actuals utilitzen el nivell d'exposició solar i la localització tumoral per dividir en diferents grups als pacients de melanoma.
Al 1998, David Whiteman i col·laboradors proposaren un model de desenvolupament del melanoma que anomenaren "model de vies divergents". Aquest presentava dos vies per la melanomagènesi: una vinculada a la proliferació melanocítica (nevogènica) i l'altra relacionada amb l'exposició solar crònica (CSD). Malgrat aquest model fou corroborat des del punt de vista clínic i epidemiològic, encara no s'ha aportat una caracterització molecular en profunditat.
A nivell general s'havien identificat gens les mutacions dels quals eren rellevants per al desenvolupament del melanoma, com el gen KIT. Però, encara s'havia d'estudiar amb més cura la distribució d'estes mutacions entre els distints subgrups de melanoma, així com el seu possible valor pronòstic.
En aquesta tesi s'han emprat tècniques de seqüenciació -massiva i tradicional- per caracteritzar els perfils mutacionals de les dues poblacions proposades pel model de vies divergents, trobant diferències tant al nombre de mutacions com als gens afectats. També hem vist com els melanomes mutats en KIT semblen desenvolupar-se per una via independent de l'etiopatogènia coneguda, mancant l'estatus mutacional d'aquest gen de valor pronòstic per la supervivència dels pacients. / [EN] Melanoma is the deadliest and most dangerous type of skin cancer, given that a small tumor can spread and result in metastasis. Over the years, classifications have been made either from a clinical, epidemiological or molecular point of view. Current classifications use the degree of solar exposure and tumoral location to divide into different melanoma groups.
In 1998, David Whiteman and collaborators proposed the divergent pathway model for melanoma development. This presented two pathways to melanomagenesis: one related to melanocytic proliferation (nevogenic) and the other related to chronic sun exposure (CSD). Despite corroborations of this model from the clinic and epidemiology, it is yet to be molecularly characterized in depth.
At a general level, different genes had been identified with relevant mutations for the development of melanoma, as is the gene KIT. However, there was a lack of knowledge on how these mutations were distributed among different melanoma subgroups, as well as the potential prognostic value.
In this thesis we have implemented sequencing techniques - both massive and traditional - to characterize the mutational profile of the two populations proposed by the divergent pathways model. We found differences both in the number of mutations and in the genes carrying the mutations. We have also seen how melanomas harboring KIT mutations seem to develop in a way which is independent from the known etiology, and how the mutational status of this gene lacks prognostic value on the outcome of the patients. / Millán Esteban, D. (2022). Next-Generation Sequencing in the Identification of Biomarkers in Cutaneous Melanoma According to the Etiopathogenic Development Pathway and their Potential Clinical Relevance [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/182977 / Compendio
|
Page generated in 0.1021 seconds