Spelling suggestions: "subject:"codons"" "subject:"kodons""
11 |
(Ré)annotation de génomes procaryotes complets - Exploration de groupes de gènes chez les bactériesBocs, Stéphanie 19 May 2004 (has links) (PDF)
La stratégie experte semi-automatique de prédiction de Séquences CoDantes (CDS) d'un chromosome procaryote est fondée sur le modèle statistique des chaînes de Markov. Elle est constituée des stratégies AMIMat pour l'apprentissage de l'hétérogénéité de composition des CDS d'un chromosome et AMIGene pour la reconnaissance et le filtrage des CDS les plus probables. AMIMat permet de construire k matrices de transition à partir de k classes de gènes définies selon l'usage des codons synonymes. La précision d' AMIGene dépend de la qualité des matrices et d'autres paramètres validés automatiquement par rapport à des annotations de référence. Autour de ces stratégies, un processus de réannotation de génome complet a été développé, en interaction avec notre base multigénome PkGDB, qui facilite l'homogénéisation des annotations des banques. Ce processus de (ré)annotation est utilisé dans de nombreux projets : Bacillus, Neisseria, Acinetobacter, Entérobactéries.
|
12 |
Development and applications of a new reverse genetics method for the generation of single-stranded positive-sense RNA viruses / Développement et application d'une nouvelle méthode de génétique inverse pour la production de virus ARN simple brin de polarité positiveAubry, Fabien 12 December 2014 (has links)
La génétique inverse est devenue une méthode clé pour la production de virus à ARN génétiquement modifiés et pour comprendre les propriétés cellulaires et biologiques des virus. Cependant les méthodes les plus fréquemment utilisées, basées sur le clonage de génomes viraux complets dans des plasmides, sont laborieuses et imprévisibles. La première partie de cette thèse présente des études sur la mise au point d'un nouveau système de génétique inverse, appelé méthode ISA (Amplicons-Sous génomique-Infectieux), qui permet la génération, en quelques jours, de virus infectieux sauvages et génétiquement modifiés appartenant à trois familles différentes de virus à ARN simple brin de polarité positive, avec une grande maîtrise des séquences virales. Dans la deuxième partie de cette thèse, nous avons appliqué pour la première fois à un arbovirus (CHIKV), le ré-encodage des codons - une méthode développée récemment et très excitante pour le développement de vaccins vivants atténués. En utilisant une approche aléatoire de ré-encodage des codons qui attribue au hasard des codons sur la base de la séquence en acides aminés correspondante, nous avons mis en évidence des pertes importantes de fitness réplicatif sur des cellules de primates et d'arthropodes. La diminution du fitness réplicatif est en corrélation avec le degré de ré-encodage, une observation qui peut aider à la modulation de l'atténuation virale. En utilisant l'expérience acquise avec le CHIKV, nous avons transposé avec succès ce mécanisme d'atténuation au JEV et amélioré notre maîtrise du processus d'atténuation en utilisant une combinaison de la synthèse de novo et de la méthode ISA. / Reverse genetics has become a key methodology for producing genetically modified RNA viruses and deciphering cellular and viral biological properties, but the most commonly used methods, based on the preparation of plasmid-based complete viral genomes, are laborious and unpredictable. The first part of this thesis presents studies relating to the development of a new reverse genetics system, designated the ISA (Infectious-Subgenomic-Amplicons) method, which enabled the generation of both wild-type and genetically modified infectious viruses belonging to three different families of positive, single stranded RNA viruses within days with great control of the viral sequences. In the second part of this thesis, we applied for the first time to an arbovirus (CHIKV), codon re-encoding - a recently developed and very exciting method for the development of live attenuated vaccines. Using a random codon re-encoding approach which randomly attributed nucleotide codons based on their corresponding amino acid sequence, we identified major fitness losses of CHIKV in both primate and arthropod cells. The decrease of replicative fitness correlated with the extent of re-encoding, an observation that may assist in the modulation of viral attenuation. Detailed analysis of these observed replicative fitness losses indicated that they are the consequence of several independent re-encoding induced events. Using the experience acquired on the CHIKV, we successfully transposed this attenuation mechanism to JEV and improved our control of the attenuation process by using a combination of de novo synthesis and the ISA method.
|
13 |
Identification des ARNm liés par les protéines Staufen de mammifères et caractérisation des déterminants structuraux à la base de l'interactionFuric, Luc January 2006 (has links)
Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal.
|
14 |
Modélisation des biais mutationnels et rôle de la sélection sur l’usage des codonsLaurin-Lemay, Simon 10 1900 (has links)
L’acquisition de données génomiques ne cesse de croître, ainsi que l’appétit pour les interpréter. Mais déterminer les processus qui ont façonné l’évolution des séquences codantes (et leur importance relative) est un défi scientifique passant par le développement de modèles statistiques de l’évolution prenant en compte de plus en plus d’hétérogénéités au niveau des processus mutationnels et de sélection.
Identifier la sélection est une tâche qui nécessite typiquement de détecter un écart entre deux modèles : un modèle nulle ne permettant pas de régime évolutif adaptatif et un modèle alternatif qui lui en permet. Lorsqu’un test entre ces deux modèles rejette le modèle nulle, on considère avoir détecter la présence d’évolution adaptative. La tâche est d’autant plus difficile que le signal est faible et confondu avec diverses hétérogénéités négligées par les modèles.
La détection de la sélection sur l’usage des codons spécifiquement est controversée, particulièrement chez les Vertébrés. Plusieurs raisons peuvent expliquer cette controverse : (1) il y a un biais sociologique à voir la sélection comme moteur principal de l’évolution, à un tel point que les hétérogénéités relatives aux processus de mutation sont historiquement négligées ; (2) selon les principes de la génétique des populations, la petite taille efficace des populations des Vertébrés limite le pouvoir de la sélection sur les mutations synonymes conférant elles-mêmes un avantage minime ; (3) par contre, la sélection sur l’usage des codons pourrait être très localisée le long des séquences codantes, à des sites précis, relevant de contraintes de sélection relatives à des motifs utilisés par la machinerie d’épissage, par exemple.
Les modèles phylogénétiques de type mutation-sélection sont les outils de prédilection pour aborder ces questions, puisqu’ils modélisent explicitement les processus mutationnels ainsi que les contraintes de sélection. Toutes les hétérogénéités négligées par les modèles mutation-sélection de Yang and Nielsen [2008] peuvent engendrer de faux positifs allant de 20% (préférence site-spécifique en acides aminés) à 100% (hypermutabilité des transitions en contexte CpG) [Laurin-Lemay et al., 2018b]. En particulier, l’hypermutabilité des transitions du contexte CpG peut à elle seule expliquer la sélection détectée par Yang and Nielsen [2008] sur l’usage des codons.
Mais, modéliser des phénomènes qui prennent en compte des interdépendances dans les données (par exemple l’hypermutabilité du contexte CpG) augmente de beaucoup la complexité des fonctions de vraisemblance. D’autre part, aujourd’hui le niveau de sophistication des modèles fait en sorte que des vecteurs de paramètres de haute dimensionnalité sont nécessaires pour modéliser l’hétérogénéité des processus étudiés, dans notre cas de contraintes de sélection sur la protéine.
Le calcul bayésien approché (Approximate Bayesian Computation ou ABC) permet de contourner le calcul de la vraisemblance. Cette approche diffère de l’échantillonnage par Monte Carlo par chaîne de Markov (MCMC) communément utilisé pour faire l’approximation de la distribution a posteriori. Nous avons exploré l’idée de combiner ces approches pour une problématique spécifique impliquant des paramètres de haute dimensionnalité et de nouveaux paramètres prenant en compte des dépendances entre sites. Dans certaines conditions, lorsque les paramètres de haute dimensionnalité sont faiblement corrélés aux nouveaux paramètres d’intérêt, il est possible d’inférer ces mêmes paramètres de haute dimensionnalité avec la méthode MCMC, et puis les paramètres d’intérêt au moyen de l’ABC. Cette nouvelle approche se nomme CABC [Laurin-Lemay et al., 2018a], pour calcul bayésien approché conditionnel (Conditional Approximate Bayesian Computation : CABC).
Nous avons pu vérifier l’efficacité de la méthode CABC en étudiant un cas d’école, soit celui de l’hypermutabilité des transitions en contexte CpG chez les Eutheria [Laurin-Lemay et al., 2018a]. Nous trouvons que 100% des 137 gènes testés possèdent une hypermutabilité des transitions significative. Nous avons aussi montré que les modèles incorporant l’hypermutabilité des transitions en contexte CpG prédisent un usage des codons plus proche de celui des gènes étudiés. Ceci suggère qu’une partie importante de l’usage des codons peut être expliquée à elle seule par les processus mutationnels et non pas par la sélection.
Finalement nous explorons plusieurs pistes de recherche suivant nos développements méthodologiques : l’application de la détection de l’hypermutabilité des transitions en contexte CpG à l’échelle des Vertébrés ; l’expansion du modèle pour reconnaître des contextes autres que seul le CpG (e.g., hypermutabilité des transitions et transversions en contexte CpG et TpA) ; ainsi que des perspectives méthodologiques d’amélioration de la performance du CABC. / The acquisition of genomic data continues to grow, as does the appetite to interpret them. But determining the processes that shaped the evolution of coding sequences (and their relative importance) is a scientific challenge that requires the development of statistical models of evolution that increasingly take into account heterogeneities in mutation and selection processes.
Identifying selection is a task that typically requires comparing two models: a null model that does not allow for an adaptive evolutionary regime and an alternative model that allows it. When a test between these two models rejects the null, we consider to have detected the presence of adaptive evolution. The task is all the more difficult as the signal is weak and confounded with various heterogeneities neglected by the models.
The detection of selection on codon usage is controversial, particularly in Vertebrates. There are several reasons for this controversy: (1) there is a sociological bias in seeing selection as the main driver of evolution, to such an extent that heterogeneities relating to mutation processes are historically neglected; (2) according to the principles of population genetics, the small effective size of vertebrate populations limits the power of selection over synonymous mutations conferring a minimal advantage; (3) On the other hand, selection on the use of codons could be very localized along the coding sequences, at specific sites, subject to selective constraints related to DNA patterns used by the splicing machinery, for example.
Phylogenetic mutation-selection models are the preferred tools to address these issues, as they explicitly model mutation processes and selective constraints. All the heterogeneities neglected by the mutation-selection models of Yang and Nielsen [2008] can generate false positives, ranging from 20% (site-specific amino acid preference) to 100% (hypermutability of transitions in CpG context)[Laurin-Lemay et al., 2018b]. In particular, the hypermutability of transitions in the CpG context alone can explain the selection on codon usage detected by Yang and Nielsen [2008].
However, modelling phenomena that take into account data interdependencies (e.g., hypermutability of the CpG context) greatly increases the complexity of the likelihood function. On the other hand, today’s sophisticated models require high-dimensional parameter vectors to model the heterogeneity of the processes studied, in our case selective constraints on the protein.
Approximate Bayesian Computation (ABC) is used to bypass the calculation of the likelihood function. This approach differs from the Markov Chain Monte Carlo (MCMC) sampling commonly used to approximate the posterior distribution. We explored the idea of combining these approaches for a specific problem involving high-dimensional parameters and new parameters taking into account dependencies between sites. Under certain conditions, when the high dimensionality parameters are weakly correlated to the new parameters of interest, it is possible to infer the high dimensionality parameters with the MCMC method, and then the parameters of interest using the ABC. This new approach is called Conditional Approximate Bayesian Computation (CABC) [Laurin-Lemay et al., 2018a]. We were able to verify the effectiveness of the CABC method in a case study, namely the hypermutability of transitions in the CpG context within Eutheria [Laurin-Lemay et al.,2018a]. We find that 100% of the 137 genes tested have significant hypermutability of transitions. We have also shown that models incorporating hypermutability of transitions in CpG contexts predict a codon usage closer to that of the genes studied. This suggests that a significant part of codon usage can be explained by mutational processes alone.
Finally, we explore several avenues of research emanating from our methodological developments: the application of hypermutability detection of transitions in CpG contexts to the Vertebrate scale; the expansion of the model to recognize contexts other than only CpG (e.g., hypermutability of transitions and transversions in CpG and TpA context); and methodological perspectives to improve the performance of the CABC approach.
|
15 |
L’usage des codons régule la présentation des peptides associés aux molécules du CMH-IDaouda, Tariq 01 1900 (has links)
No description available.
|
16 |
Assessing the robustness of genetic codes and genomesSautié Castellanos, Miguel 06 1900 (has links)
Deux approches principales existent pour évaluer la robustesse des codes génétiques et des séquences de codage. L'approche statistique est basée sur des estimations empiriques de probabilité calculées à partir d'échantillons aléatoires de permutations représentant les affectations d'acides aminés aux codons, alors que l'approche basée sur l'optimisation repose sur le pourcentage d’optimisation, généralement calculé en utilisant des métaheuristiques. Nous proposons une méthode basée sur les deux premiers moments de la distribution des valeurs de robustesse pour tous les codes génétiques possibles. En se basant sur une instance polynomiale du Problème d'Affectation Quadratique, nous proposons un algorithme vorace exact pour trouver la valeur minimale de la robustesse génomique. Pour réduire le nombre d'opérations de calcul des scores et de la borne supérieure de Cantelli, nous avons développé des méthodes basées sur la structure de voisinage du code génétique et sur la comparaison par paires des codes génétiques, entre autres. Pour calculer la robustesse des codes génétiques naturels et des génomes procaryotes, nous avons choisi 23 codes génétiques naturels, 235 propriétés d'acides aminés, ainsi que 324 procaryotes thermophiles et 418 procaryotes non thermophiles. Parmi nos résultats, nous avons constaté que bien que le code génétique standard soit plus robuste que la plupart des codes génétiques, certains codes génétiques mitochondriaux et nucléaires sont plus robustes que le code standard aux troisièmes et premières positions des codons, respectivement. Nous avons observé que l'utilisation des codons synonymes tend à être fortement optimisée pour amortir l'impact des changements d'une seule base, principalement chez les procaryotes thermophiles. / There are two main approaches to assess the robustness of genetic codes and coding sequences. The statistical approach is based on empirical estimates of probabilities computed from random samples of permutations representing assignments of amino acids to codons, whereas, the optimization-based approach relies on the optimization percentage frequently computed by using metaheuristics. We propose a method based on the first two moments of the distribution of robustness values for all possible genetic codes. Based on a polynomially solvable instance of the Quadratic Assignment Problem, we propose also an exact greedy algorithm to find the minimum value of the genome robustness. To reduce the number of operations for computing the scores and Cantelli’s upper bound, we developed methods based on the genetic code neighborhood structure and pairwise comparisons between genetic codes, among others. For assessing the robustness of natural genetic codes and genomes, we have chosen 23 natural genetic codes, 235 amino acid properties, as well as 324 thermophilic and 418 non-thermophilic prokaryotes. Among our results, we found that although the standard genetic code is more robust than most genetic codes, some mitochondrial and nuclear genetic codes are more robust than the standard code at the third and first codon positions, respectively. We also observed that the synonymous codon usage tends to be highly optimized to buffer the impact of single-base changes, mainly, in thermophilic prokaryotes.
|
17 |
Novel bioinformatics programs for taxonomical classification and functional analysis of the whole genome sequencing data of arbuscular mycorrhizal fungiKang, Jee Eun 10 1900 (has links)
No description available.
|
Page generated in 0.0473 seconds