Global ETD Search

311	Évolution moléculaire : un modèle Markov-modulé pour les processus de substitution Fournier, Eric 01 1900 (has links) Les processus Markoviens continus en temps sont largement utilisés pour tenter d’expliquer l’évolution des séquences protéiques et nucléotidiques le long des phylogénies. Des modèles probabilistes reposant sur de telles hypothèses sont conçus pour satisfaire la non-homogénéité spatiale des contraintes fonctionnelles et environnementales agissant sur celles-ci. Récemment, des modèles Markov-modulés ont été introduits pour décrire les changements temporels dans les taux d’évolution site-spécifiques (hétérotachie). Des études ont d’autre part démontré que non seulement la force mais également la nature de la contrainte sélective agissant sur un site peut varier à travers le temps. Ici nous proposons de prendre en charge cette réalité évolutive avec un modèle Markov-modulé pour les protéines sous lequel les sites sont autorisés à modifier leurs préférences en acides aminés au cours du temps. L’estimation a posteriori des différents paramètres modulants du noyau stochastique avec les méthodes de Monte Carlo est un défi de taille que nous avons su relever partiellement grâce à la programmation parallèle. Des réglages computationnels sont par ailleurs envisagés pour accélérer la convergence vers l’optimum global de ce paysage multidimensionnel relativement complexe. Qualitativement, notre modèle semble être capable de saisir des signaux d’hétérogénéité temporelle à partir d’un jeu de données dont l’histoire évolutive est reconnue pour être riche en changements de régimes substitutionnels. Des tests de performance suggèrent de plus qu’il serait mieux ajusté aux données qu’un modèle équivalent homogène en temps. Néanmoins, les histoires substitutionnelles tirées de la distribution postérieure sont bruitées et restent difficilement interprétables du point de vue biologique. / Time-continuous Markovian process are widely used to understand the mechanism of nucleotidic acids and proteins evolution along phylogeny. Already existing probabilistic models based on such hypothesis are designed to satisfy the non-homogeneity of functional and environmental constraints acting across those biological sequences. Recently, Markov-modulated models have been introduced to describe site-specific temporal rate variation (heterotachy). Moreover, studies have demonstrated that not only strength but also the nature of the constraint acting on a specific site can vary over time. Here we propose to accommodate this evolutionary reality with a Markov-modulated model for proteins under which sites are authorized to change their amino acids propensities across time. Posterior estimation of the stochastic kernel hidden parameters with Monte Carlo methods is a challenging approach that we partially overcome with parallel computing. Fine-tuning are otherwise planned to accelerate convergence toward the target posterior stationnary distribution. Qualitatively, our model seems to be able to capture temporal heterogeneity from real sequences data sets whose evolutionary history is assumed to be rich in substitutional switch events. Furthermore, evaluation of the model performance suggest that he provides a better fit to the data set than the time-homogeneous equivalent model. Nonetheless, substitutional histories sampled from the posterior distribution are quite noisy and remain difficult to interpret biologically. Évolution moléculaire Inférence Bayésienne Processus de substitution Modèle Markov-modulé Molecular evolution Bayesian inference substitution process Markov-modulated model
312	An approach to improved microbial eukaryotic genome annotation Sarrasin, Matthew 12 1900 (has links) No description available. Génome Nucléaire Annotation Structurale Eucaryote Microbien Protistes Champignons Saccharomyces Neurospora Ustilago Plasmodium Nuclear Genome Structural Annotation Microbial Eukaryote Protists Fungi
313	Étude des signatures géniques dans un contexte d’expériences de RNA- Seq Trofimov, Assya 08 1900 (has links) No description available. Apprentissage machine Réduction de dimensionnalité Transcriptome RNA-Seq Machine learning Artificial neural networks Dimensionnality reduction
314	Investigation génétique de NAFLD dans le diabète de type 2 via construction d’un modèle de prédiction de la maladie et par criblage du locus PNPLA3-SAMM50 Attaoua, Redha 07 1900 (has links) La stéatose hépatique non-alcoolique (NAFLD) est une altération hépatique fréquente dans le diabète de type 2 (DT2) et est associée à diverses complications telles que la mortalité. L’établissement d’outils de prédiction non-invasifs de NAFLD est primordial. Mon projet de maîtrise avait pour objectif d’établir des marqueurs génétiques de NAFLD dans le DT2 via deux stratégies : 1) une sélection non-ciblée des marqueurs génétiques (SNPs) via la méthode LASSO et 2) une sélection ciblée de SNPs rapportés comme liés à la maladie ou à des altérations associées. Une population de 4098 patients avec DT2 d’origine caucasienne (ADVANCE) a été utilisée. Des données statistiques sommaires d’études pangénomiques ont été exploitées pour sélectionner, via LASSO, les marqueurs génétiques (SNPs) à inclure dans le score de risque polygénique (PRS). J’ai également développé un modèle de 3210 SNPs ajusté par des covariables capable de prédire les taux élevés de ALT (AUC=0,69) et la mortalité non-cardiovasculaire (AUC=0,66). Le criblage du locus candidat PNPLA3-SAMM50 a mis en avant une diversité des associations génétiques aux différentes altérations métaboliques comme les taux de ALT (substitut du diagnostic de NAFLD) (rs2294915, P = 1,83x10-7), à la mortalité non-cardiovasculaire (rs2294917, P = 3,9x10-4) et à l’efficacité de la thérapie intensive antidiabétique chez certains patients de la population (porteurs GG de rs16991236, P=0,007). Mes travaux ont permis de mieux comprendre le fond génétique de NAFLD dans le DT2 et laissent envisager l’établissement d’outils de diagnostic et de suivi de la maladie plus adéquats. / Non-alcoholic fatty liver disease (NAFLD) is a liver disorder more frequent in type 2 diabetes (T2D) and is associated with complications such as mortality. For this reason, establishing non-invasive tools for predicting NAFLD is crucial. My master’s project aimed to establish genetic markers for NAFLD in T2D using two strategies: 1) a non-targeted selection of genetic markers (SNPs) by the LASSO method and 2) a targeted selection of SNPs reported as associated with the disease or its related abnormalities. A population involving 4098 patients with T2D and Caucasian ancestry was used. Summary statistics data of pangenomic studies were exploited for the selection of SNPs to be involved in the polygenic risk score (PRS). I also designed a model of 3210 SNPs adjusted by covariates and able to predict the high rates of ALT (AUC=0.69) and non-cardiovascular death (AUC=0.66). Mapping of the candidate locus PNPLA3-SAMM50 allowed the observation of diversity in terms of genetic association with the metabolic abnormalities such as ALT (surrogate of NAFLD) (rs2294915, P = 1.83x10-7), non-cardiovascular death (rs2294917, P = 3.9x10-4) and the efficiency of the intensive antidiabetic therapy within a subgroup in the population (individuals with GG of rs16991236, P = 0.007). My studies allowed for a better understanding of the genetic background of NAFLD in T2D and open perspectives for establishing more adequate tools for diagnosis and follow-up of the disease. NAFLD Diabète de type 2 Mortalité non-cardiovasculaire SNP Score de risque polygénique PNPLA3-SAMM50 Type 2 diabetes Non-cardiovascular death Polygenic risk score
315	Évolution intra-hôte de Vibrio cholerae et interactions avec le microbiome intestinal Levade, Inès 08 1900 (has links) Le choléra est une infection diarrhéique aiguë qui représente encore aujourd’hui un grave problème de santé publique dans les pays où l’accès à l’eau potable et un système d’assainissement adéquat ne peut pas être garanti. Vibrio cholerae, le pathogène bactérien responsable de cette maladie, peut provoquer toute une série de symptômes chez les individus infectés, allant d’une diarrhée intense conduisant à une déshydratation sévère, au portage asymptomatique de la bactérie. Bien que notre compréhension du choléra à une échelle macro-épidémiologique a considérablement été améliorée par le développement des techniques de séquençage à haut débit et par les avancées dans le domaine de la génomique bactérienne, aucune étude n’a encore été menée pour caractériser son évolution à l’échelle des individus infectés. De plus, le rôle des porteurs asymptomatiques au sein d’une épidémie et la raison derrière l’absence de symptômes chez ces individus infectés sont encore méconnus. L’objectif principal de cette thèse est donc de (1) caractériser la diversité génomique de V. cholerae au niveau des individus et des cercles familiaux, mais aussi (2) d’évaluer le rôle potentiel du microbiome intestinal dans la susceptibilité de contracter cette maladie entérique aiguë et de présenter des symptômes sévères. Dans un premier temps, nous caractérisons la diversité génomique de colonies isolées à partir de patients symptomatiques. Le séquençage de génomes entiers de souches provenant de patients du Bangladesh et d’Haïti révèle que cette diversité sous la forme de mutations ponctuelles reste limitée, mais détectable au sein des hôtes. Une grande partie de la variation du contenu génétique semble être surtout due au gain et à la perte de phages et de plasmides au sein de la population de V. cholerae, avec des échanges occasionnels entre le pathogène et d’autres membres commensaux du microbiote intestinal. Cela contredit l’hypothèse couramment acceptée que les infections par V. cholerae sont majoritairement clonales, et confirme que le transfert horizontal de gènes est un facteur important dans l’évolution de V. cholerae. De plus, nos résultats montrent que certains de ces variants peuvent avoir un effet phénotypique, impactant par exemple la formation de biofilms, et peuvent être sélectionnés au sein des individus infectés. Par la suite, nous appliquons une association de méthodes de séquençage de génomes entiers et de méthodes métagénomiques afin d’améliorer la détection des variants intra-hôte, à la fois chez des patients symptomatiques, mais aussi chez des porteurs asymptomatiques. Notre étude montre que l’approche métagénomique offre une meilleure résolution dans la détection de la diversité dans la population microbienne, mais reste difficile à appliquer chez des patients asymptomatiques, en raison du faible nombre de cellules de V. cholerae chez ces patients. Dans l’ensemble, nous constatons que le niveau de diversité au sein de la population bactérienne intra-hôte est similaire entre les patients symptomatiques et asymptomatiques. Nous détectons aussi la présence de souches hypermutantes chez certains patients. De plus, alors que les mutations chez les patients porteurs de phénotypes d’hypermutations ne semblent pas sous l’effet de la sélection, des signes d'évolution parallèle sont détectés chez les patients présentant un plus faible nombre de mutations, suggérant des mécanismes d’adaptation au sein de l’hôte. Nos résultats soulignent la puissance de la métagénomique combinée au séquençage de génomes entiers pour caractériser la diversité intra-hôte dans le cas d’une infection aiguë du choléra, mais aussi dans le cas de portage asymptomatique, tout en identifiant pour la première fois le phénotype d’hypermutation chez des patients infectés. Finalement, nous nous intéressons aux facteurs liés à la susceptibilité à la maladie et à la sévérité des symptômes. Basée sur une étude récente utilisant le séquençage 16S pour montrer le lien potentiel entre le microbiome intestinal et la susceptibilité à l’infection par V. cholerae, nos analyses utilisent les méthodes de séquençage métagénomique sur les mêmes échantillons de cette précédente étude afin de caractériser les profils taxonomiques et fonctionnels du microbiome intestinal de contacts familiaux exposés à V. cholerae. Les échantillons sont prélevés avant l’infection de ces contacts familiaux et l’apparition ou non de symptômes, et sont analysés pour identifier des prédicteurs à la maladie symptomatique. Grâce à un algorithme d’apprentissage machine, nous pouvons identifier des espèces, des familles de gènes et des voies métaboliques du microbiome au moment de l'exposition à V. cholerae pour détecter des biomarqueurs potentiels corrélés avec les risques d'infection et la gravité des symptômes. Nos résultats montrent que l’utilisation du séquençage métagénomique améliore la précision et l’exactitude des prévisions par rapport au séquençage 16S. Nos analyses permettent aussi de prédire la gravité de la maladie, bien qu’avec une plus grande incertitude que la prédiction de l’infection. Des taxons bactériens des genres Prevotella et Bifidobacterium ont été identifiées comme des marqueurs potentiels de protection contre l’infection, tout comme gènes impliqués dans le métabolisme du fer. Nos résultats soulignent le pouvoir de la métagénomique pour prédire l’évolution des maladies et identifient des espèces et des gènes spécifiques pouvant être impliqués dans des tests expérimentaux afin d’étudier les mécanismes liés au microbiome intestinal expliquant la potentielle protection contre le choléra. / Cholera is an acute diarrhoeal disease that remains a global threat to public health in countries where access to safe water and adequate sanitation cannot be guaranteed. Vibrio cholerae, the bacterial pathogen responsible for this disease, can cause a range of symptoms in infected individuals, from intense diarrhea leading to severe dehydration, to asymptomatic carriage of the bacteria. Although our understanding of cholera on a macro-epidemiological scale has been considerably improved by the development of high-throughput sequencing techniques and by advances in bacterial genomics, no studies have yet been conducted to characterize its evolution at the scale of infected individuals. Furthermore, the role of asymptomatic carriers in an epidemic and the reason behind the absence of symptoms in these infected individuals remains unknown. The main objective of this thesis is therefore to characterize the genomic diversity of V. cholerae at the level of individuals and households, but also to evaluate the potential role of the gut microbiome in the susceptibility to contract this acute enteric disease and to present severe symptoms. First, we characterize the genomic diversity of colonies isolated from symptomatic patients. The whole genome sequencing of strains from patients in Bangladesh and Haiti reveals that this diversity is detectable in the form of point mutations within hosts, but remains limited. Much of the variation detected within patients appears to be due to the gain and loss of phages and plasmids within the V. cholerae population, with occasional exchanges between the pathogen and other commensal members of the gut microbiota. These results challenge the commonly accepted assumption that V. cholerae infections are predominantly clonal, and confirm that horizontal gene transfer is an important factor in the evolution of V. cholerae. In addition, our results show that some of these variants may also have a phenotypic effect, for example by impacting biofilm formation, and can be selected within infected individuals. Next, we apply a combination of whole genome sequencing and metagenomic approaches to improve the detection of intra-host variants, both in symptomatic patients and in asymptomatic carriers. Our study shows that the metagenomic approach offers a better resolution in the detection of the diversity in the microbial population, but remains difficult to apply in asymptomatic patients, due to the low number of V. cholerae cells in these individuals. Overall, we find that the level of diversity within the intra-host bacterial population is similar between symptomatic and asymptomatic patients. We also detect the presence of hypermutator strains in some patients. In addition, while mutations in patients with hypermutator phenotypes did not appear to be driven by selection, signs of parallel evolution are detected in patients with fewer mutations, suggesting adaptive mechanisms within the host. Our results underline the power of metagenomics combined with whole genome sequencing to characterize intra-host diversity in acute cholera infection, but also in asymptomatic carriers, while identifying for the first time an hypermutator phenotype in infected patients. Finally, we are interested in factors related to susceptibility to the disease and related to the severity of symptoms. Based on a recent study using 16S rRNA amplicon sequencing to show the potential link between the intestinal microbiome and susceptibility to V. cholerae infection, our study uses metagenomic sequencing methods on the same samples from this previous study to characterize the taxonomic and functional profiles of the gut microbiome of household contacts exposed to V. cholerae. Samples are collected prior to infection of these household contacts, and used to identify predictors of symptomatic disease. Using a machine learning algorithm, we can identify species, gene families and metabolic pathways in the microbiome at the time of exposure to V. cholerae to detect potential biomarkers correlated with risk of infection and symptom severity. Our results show that the use of metagenomic sequencing improves the precision and accuracy of predictions compared to 16S rRNA amplicon sequencing. Our analyses also predict disease severity, although with greater uncertainty than the prediction of infection. Bacterial taxa from the genera Prevotella and Bifidobacterium have been identified as potential markers of protection against infection, as well as genes involved in iron metabolism. Our results highlight the power of metagenomics to predict disease progression and identify specific species and genes that could be involved in experimental tests to study the mechanisms related to the microbiome explaining potential protection against cholera. Vibrio cholerae choléra évolution intra-hôte génomique métagénomique hypermutation microbiome apprentissage machine cholera within-host evolution genomics metagenomics machine learning
316	RNA recurrent motifs : identification and characterization Butorin, Yury 04 1900 (has links) No description available. Recurrent motif RNA structure G-ribo Ribosome In vivo selection Motif recurrent Structure d’ARN Selection in vivo
317	Insights on interspecies disease tolerance mechanisms through comparative and functional genomics Hawash, Mohamed 06 1900 (has links) La sensibilité des primates aux pathogènes et aux maladies inflammatoires chroniques varie considérablement. Par exemple, les singes (tels que les humains et les chimpanzés) sont très sensibles à de très petites doses de lipopolysaccharide (LPS), une molécule mimétique d'agent pathogène, qui cause de graves lésions tissulaires en raison de l'immunopathologie tandis que les singes africains et asiatiques clades soeurs AAM (tels que les macaques et les babouins) sont beaucoup plus tolérants à des doses beaucoup plus élevées de LPS. Cet écart entre l'homme et les autres primates est connu pour être, au moins partiellement, dû à la différence interspécifique de la réponse immunitaire. Dans cette thèse, j'ai effectué une analyse comparative de la réponse immunitaire à travers différentes lignées de primates pour obtenir des informations supplémentaires sur l'évolution de la réponse immunitaire. J'ai trouvé que les singes provoquent une réponse immunitaire beaucoup plus forte aux stimulants (bactériens ou viraux) par rapport aux AMM. Une telle réponse plus élevée s'est également avérée corrélée avec la phylogénie du primate, la plus élevée chez le primate supérieur (humain) et la plus faible chez le primate basal (lémurien). Une réponse aussi élevée peut être bénéfique pour la médiation d'une destruction efficace des agents pathogènes, mais elle est probablement accompagnée de lésions tissulaires plus élevées, ce qui pourrait expliquer pourquoi les humains sont plus sensibles aux maladies immunopathologiques telles que la septicémie. J'ai également caractérisé le paysage réglementaire de la réponse immunitaire chez ces primates. J'ai trouvé que l'activité des éléments régulateurs était significativement différente entre les différentes espèces de primates après une stimulation immunitaire mettant en évidence le rôle de l'épigénétique dans la conduite du changement de la réponse immunitaire chez les primates. De plus, j'ai trouvé une signature d'évolution adaptative sur les régions actives associées aux gènes qui ont la réponse la plus élevée chez l'homme par rapport aux AMM révélant le rôle de la sélection naturelle sur le façonnement de la réponse immunitaire chez les primates. / Primates vary remarkably in their disease susceptibility to pathogens and chronic inflammatory diseases. For instance, apes (such as humans and chimps) are highly sensitive to very small doses of lipopolysaccharide (LPS), a pathogen mimicry molecule, that causes severe tissue damage due to immunopathology while sister clade African and Asian monkeys AAMs (such as macaque and baboon) are far more tolerant to much higher doses of LPS. This discrepancy between humans and other primates is known to be, at least partially, due to interspecies differences of the immune response. In this dissertation, I performed comparative analyses of immune responses across different primate lineages to gain further insights on the evolution of immune response. I found that apes elicit a much stronger immune response to stimulants (bacterial or viral) relative to AMMs. Such a higher response was also found to be correlated with the primate phylogeny, highest in the higher primate (human) and lowest in the basal primate (lemur). Moreover, this high response may be beneficial in mediating effective pathogen killing but it is likely accompanied by higher tissue damage, which might explain why humans are more susceptible to immunopathological diseases such as sepsis. I also characterized the regulatory landscape of immune response across these primates. I found the regulatory elements activity to be significantly different between different primate species after immune stimulation highlighting the role of epigenetics in driving the immune response change across primates. In addition, I found a signature of adaptive evolution on active regions associated with genes that have the highest response in humans versus AMMs revealing the role of natural selection in shaping the immune response in primates. lipopolysaccharide Évolution de la réponse immunitaire Éléments régulateurs Évolution des primates Immune response evolution Regulatory elements Primate evolution
318	A computational docking and molecular dynamics simulations study to identify the putative phosphoinositide binding site(s) of HCN channels Khoualdi, Asma Feriel 04 1900 (has links) Les canaux nucléotidiques cycliques activés par hyperpolarization (HCN) sont un type de canaux ioniques voltage-dépendants qui contrôlent l'activité rythmique et la plasticité synaptique dans le cœur et le cerveau. Ces canaux permettent aux ions K+ et Na+ de passer, créant ainsi un courant entrant lors de l'hyperpolarization de la membrane. En raison de ses propriétés biophysiques inhabituelles, ce courant est appelé courant «If» ou courant d'hyperpolarization «Ih». Des anomalies du courant Ih sont associées à des arythmies et des troubles neurologiques, y compris l'épilepsie. On constate que différentes molécules modulent ce courant. Des résultats expérimentaux ont montré que les lipides jouent un rôle dans le déplacement de la dépendance en tension des canaux HCN vers des tensions plus positives ou dépolarisées. Le phosphatidylinositol 4,5-bisphosphate de phospholipide endogène et exogène, ou PI (4,5) P2, régule les canaux HCN en déplaçant l'ouverture du canal vers une tension plus dépolarisée. Cette modulation est supposée être par interaction directe de PI (4,5) P2 avec le canal HCN. Ici, nous utilisons la dynamique moléculaire et l'amarrage pour explorer et identifier le site de liaison grâce à l'analyse des contacts et de la stabilité des liaisons hydrogène impliquées dans les molécules de phsiphoinositide et l'interaction des canaux HCN. Nous proposons LYS et ARG du domaine HCN et S3 pour être des résidus clés dans le site de liaison à travers lequel les molécules de phosphoinositide peuvent potentiellement activer le canal. / Hyperpolarization-activated cyclic nucleotide-gated (HCN) channels are a type of voltage gated ion channels that control rhythmic activity and synaptic plasticity in the heart and brain. These channels allow K+ and Na+ ions to pass, thereby creating an inward current upon hyperpolarization of the membrane. Due to its unusual biophysical properties, this current is called funny « If» or hyperpolarization « Ih » current. Abnormalities in Ih current are associated with arrythmia and neurological disorders including epilepsy. Different molecules are found to modulate this current. Experimental results have shown that lipids play a role in shifting the voltage dependence of HCN channels to more positive, or depolarized voltages. Both endogenous and exogenous phospholipid phosphatidylinositol 4,5-bisphosphate, or PI(4,5)P2, regulates HCN channels by shifting the opening of the channel to a more depolarized voltage. This modulation is postulated to be through direct interaction of PI(4,5)P2 with the HCN channel. Here, we use molecular dynamics and docking to explore and identify the binding site through analysis of the contacts and stability of the hydrogen bonds involved in phosphoinositide molecules and HCN channel interaction. We propose LYS and ARG residues of the HCN domain and S3 to be key residues in the binding site through which phosphoinositide molecules can potentially activate the channel. HCN Channel Ih current Phosphoinositide Molecular Dynamics Docking Canal HCN Courant Ih Dynamique moléculaire
319	Caractérisation de deux familles de pharmacogènes, les gènes CYP3A et CYP4F Richard-St-Hilaire, Alex 04 1900 (has links) Les cytochromes P450 (CYP450) sont des hémoprotéines intervenant généralement dans la détoxication de l’organisme sous forme de biodégradation de molécules xénobiotiques et participent à la décomposition de certains médicaments. Cependant, les gènes codant pour les protéines CYP450 sont souvent sous-analysés dans les études génomiques à grande échelle en raison de leur difficulté d’analyse due à un haut taux de polymorphisme. Deux sous-familles seront étudiées plus en profondeur: les sous-familles CYP3A et CYP4F. La sous-famille CYP3A métabolise environ 50% des médicaments alors que les enzymes CYP4F, quant à eux, sont impliquées dans le métabolisme de composés endogènes, de nutriments et de médicaments. Les gènes de ces sous-familles sont fortement polymorphes et ce, à travers les populations humaines. Ainsi, la variabilité entre les différentes populations peut affecter la réponse aux médicaments et autres fonctions métaboliques. Dans ce projet, deux grands jeux de données, l’un en génétique des populations (le Projet des 1000 Génomes) et l’autre en transcriptomique (GTEx) seront utilisés afin d’identifier des signatures de sélection naturelle dans les gènes CYP3A et CYP4F, ainsi que leur impact sur l’expression génique de ces gènes. Nous avons détecté différentes forces de sélection (positive et balancée) dans les deux sous-familles. Certains polymorphismes identifiés comme étant sous pression sélective sont associés à une expression différentielle des gènes des deux sous-familles. Ce projet permet de mieux comprendre l’impact des mutations sous pression sélective se situant dans les gènes des sous-familles CYP3A et CYP4F. Cette caractérisation génétique permettra d’obtenir des prédictions plus fiables en pharmacogénomique et en génomique humaine, en raison de l’influence de ces gènes sur la réponse aux médicaments. / Cytochromes P450 (CYP450) are hemoproteins generally involved in the detoxification of the body of xenobiotic molecules and participate in the metabolism of many drugs. Genetic polymorphisms have been found to impact drugs responses and metabolic functions. However, genes encoding CYP450 proteins are often under-analyzed in large-scale genomic studies because the difficulty of analysis due to of their high rate of polymorphism. In this study, we investigate the genetic diversity for CYP450 genes. We found that two clusters, CYP3A and CYP4F, are notably differentiated across human populations with evidence for selective pressures acting on both clusters. The CYP3A subfamily metabolizes approximately 50\% of drugs while CYP4F enzymes are involved in the metabolism of endogenous compounds, nutrients and drugs. Indeed, we found signals of recent positive selection in CYP3A and CYP4F genes and signals of balancing selection in CYP4F genes. Futhermore, unusual linkage disequilibrium is detected in both cluster, suggesting co-evolution. eQTLs were also found in both clusters which indicate co-regulation and epistasis. Cytochromes P450 CYP3A CYP4F Génétique des populations Population genetics Bio-informatique Bioinformatics Génomique Genomics Transcriptomique Transcriptomics
320	Systematic prediction of feedback regulatory network motifs Sahoo, Amruta 04 1900 (has links) Comprendre le câblage complexe de la régulation cellulaire reste un défi des plus redoutables.Les connaissances fondamentales sur le câblage et le fonctionnement du réseau d’homéostasiedes protéines aideront à mieux comprendre comment l’homéostasie des protéines échouedans les maladies et comment les modèles de régulation du réseau d’homéostasie desprotéines peuvent être ciblés pour une intervention thérapeutique. L’étude vise à développeret à appliquer une nouvelle méthodologie de calcul pour l’identification systématique etla caractérisation des systèmes de rétroaction en homéostasie des protéines. La rechercheproposée combine des idées et des approches issues de la science des protéines, de la biologiedes systèmes de levure, de la biologie computationnelle et de la biologie des réseaux.La difficulté dans la tâche d’incorporer des données multi-plateformes multi-omiques estamplifiée par le vaste réseau de gènes, protéines et métabolites interconnectés qui seréunissent pour remplir une fonction spécifique. Pour ma thèse de maîtrise, j’ai développéun algorithme PBPF (Path-Based Pattern Finding), qui recherche et énumère les motifsde réseau de la topologie requise. Il s’agit d’un algorithme basé sur la théorie des graphesqui utilise la combinaison d’une méthode transversale de profondeur et d’une méthodede recherche par largeur ensuite pour identifier les topologies de sous-graphes de réseaurequises. En outre, le fonctionnement de l’algorithme a été démontré dans les domainesde l’homéostasie des protéines chezSaccharomyces cerevisiae. Une approche systématiqued’intégration des données de la biologie des systèmes a été orchestrée, qui montre l’iden-tification systématique de motifs de rétroaction régulatrice connus dans l’homéostasie desprotéines. Il revendique fortement la capacité d’identifier de nouveaux motifs de rétroactionréglementaire envahissants. L’application de l’algorithme peut être étendue à d’autressystèmes biologiques, par exemple, pour identifier des motifs de rétroaction spécifiques àl’état cellulaire dans le cas de cellules souches. / Understanding the intricate wiring of cellular regulation remains a most formidable chal-lenge. The fundamental insights into the wiring and functioning of the protein homeostasisnetwork will help to better understand how protein homeostasis fails in diseases and howthe regulatory patterns of protein homeostasis network can be targeted for therapeuticintervention. The study aims at developing and applying novel computational methodologyfor the systematic identification and characterization of feedback systems in proteinhomeostasis. The proposed research combines ideas and approaches from protein science,yeast systems biology, computational biology, as well as network biology. The difficultyin the task of incorporating multi-platform multi-omics data is amplified by the largenetwork of inter-connected genes, proteins and metabolites that come together to perform aspecific function. For my master’s thesis, I developed a path-based pattern finding (PBPF)algorithm, which searches and enumerates network motifs of required topology. It is a graphtheory based algorithm which utilizes the combination of depth-first transverse method andbreadth-first search method to identify the required network sub-graph topologies. Further,the functioning of the algorithm has been demonstrated in the realms of protein homeostasisinSaccharomyces cerevisiae. A systematic approach of integration of systems biologydata has been orchestrated, which shows the systematic identification of known regulatoryfeedback motifs in protein homeostasis. It claims the unique ability to identify novelpervasive regulatory feedback motifs. The application of the algorithm can be extended toother biological systems, for example, to identify cell-state specific feedback motifs in caseof stem-cells. homéostasie science des réseaux motif de réseau motif de rétroaction biologie des systèmes homeostasis network science network motif feedback motif systems biology

Search results