Global ETD Search

361	Modélisation des biais mutationnels et rôle de la sélection sur l’usage des codons Laurin-Lemay, Simon 10 1900 (has links) L’acquisition de données génomiques ne cesse de croître, ainsi que l’appétit pour les interpréter. Mais déterminer les processus qui ont façonné l’évolution des séquences codantes (et leur importance relative) est un défi scientifique passant par le développement de modèles statistiques de l’évolution prenant en compte de plus en plus d’hétérogénéités au niveau des processus mutationnels et de sélection. Identifier la sélection est une tâche qui nécessite typiquement de détecter un écart entre deux modèles : un modèle nulle ne permettant pas de régime évolutif adaptatif et un modèle alternatif qui lui en permet. Lorsqu’un test entre ces deux modèles rejette le modèle nulle, on considère avoir détecter la présence d’évolution adaptative. La tâche est d’autant plus difficile que le signal est faible et confondu avec diverses hétérogénéités négligées par les modèles. La détection de la sélection sur l’usage des codons spécifiquement est controversée, particulièrement chez les Vertébrés. Plusieurs raisons peuvent expliquer cette controverse : (1) il y a un biais sociologique à voir la sélection comme moteur principal de l’évolution, à un tel point que les hétérogénéités relatives aux processus de mutation sont historiquement négligées ; (2) selon les principes de la génétique des populations, la petite taille efficace des populations des Vertébrés limite le pouvoir de la sélection sur les mutations synonymes conférant elles-mêmes un avantage minime ; (3) par contre, la sélection sur l’usage des codons pourrait être très localisée le long des séquences codantes, à des sites précis, relevant de contraintes de sélection relatives à des motifs utilisés par la machinerie d’épissage, par exemple. Les modèles phylogénétiques de type mutation-sélection sont les outils de prédilection pour aborder ces questions, puisqu’ils modélisent explicitement les processus mutationnels ainsi que les contraintes de sélection. Toutes les hétérogénéités négligées par les modèles mutation-sélection de Yang and Nielsen [2008] peuvent engendrer de faux positifs allant de 20% (préférence site-spécifique en acides aminés) à 100% (hypermutabilité des transitions en contexte CpG) [Laurin-Lemay et al., 2018b]. En particulier, l’hypermutabilité des transitions du contexte CpG peut à elle seule expliquer la sélection détectée par Yang and Nielsen [2008] sur l’usage des codons. Mais, modéliser des phénomènes qui prennent en compte des interdépendances dans les données (par exemple l’hypermutabilité du contexte CpG) augmente de beaucoup la complexité des fonctions de vraisemblance. D’autre part, aujourd’hui le niveau de sophistication des modèles fait en sorte que des vecteurs de paramètres de haute dimensionnalité sont nécessaires pour modéliser l’hétérogénéité des processus étudiés, dans notre cas de contraintes de sélection sur la protéine. Le calcul bayésien approché (Approximate Bayesian Computation ou ABC) permet de contourner le calcul de la vraisemblance. Cette approche diffère de l’échantillonnage par Monte Carlo par chaîne de Markov (MCMC) communément utilisé pour faire l’approximation de la distribution a posteriori. Nous avons exploré l’idée de combiner ces approches pour une problématique spécifique impliquant des paramètres de haute dimensionnalité et de nouveaux paramètres prenant en compte des dépendances entre sites. Dans certaines conditions, lorsque les paramètres de haute dimensionnalité sont faiblement corrélés aux nouveaux paramètres d’intérêt, il est possible d’inférer ces mêmes paramètres de haute dimensionnalité avec la méthode MCMC, et puis les paramètres d’intérêt au moyen de l’ABC. Cette nouvelle approche se nomme CABC [Laurin-Lemay et al., 2018a], pour calcul bayésien approché conditionnel (Conditional Approximate Bayesian Computation : CABC). Nous avons pu vérifier l’efficacité de la méthode CABC en étudiant un cas d’école, soit celui de l’hypermutabilité des transitions en contexte CpG chez les Eutheria [Laurin-Lemay et al., 2018a]. Nous trouvons que 100% des 137 gènes testés possèdent une hypermutabilité des transitions significative. Nous avons aussi montré que les modèles incorporant l’hypermutabilité des transitions en contexte CpG prédisent un usage des codons plus proche de celui des gènes étudiés. Ceci suggère qu’une partie importante de l’usage des codons peut être expliquée à elle seule par les processus mutationnels et non pas par la sélection. Finalement nous explorons plusieurs pistes de recherche suivant nos développements méthodologiques : l’application de la détection de l’hypermutabilité des transitions en contexte CpG à l’échelle des Vertébrés ; l’expansion du modèle pour reconnaître des contextes autres que seul le CpG (e.g., hypermutabilité des transitions et transversions en contexte CpG et TpA) ; ainsi que des perspectives méthodologiques d’amélioration de la performance du CABC. / The acquisition of genomic data continues to grow, as does the appetite to interpret them. But determining the processes that shaped the evolution of coding sequences (and their relative importance) is a scientific challenge that requires the development of statistical models of evolution that increasingly take into account heterogeneities in mutation and selection processes. Identifying selection is a task that typically requires comparing two models: a null model that does not allow for an adaptive evolutionary regime and an alternative model that allows it. When a test between these two models rejects the null, we consider to have detected the presence of adaptive evolution. The task is all the more difficult as the signal is weak and confounded with various heterogeneities neglected by the models. The detection of selection on codon usage is controversial, particularly in Vertebrates. There are several reasons for this controversy: (1) there is a sociological bias in seeing selection as the main driver of evolution, to such an extent that heterogeneities relating to mutation processes are historically neglected; (2) according to the principles of population genetics, the small effective size of vertebrate populations limits the power of selection over synonymous mutations conferring a minimal advantage; (3) On the other hand, selection on the use of codons could be very localized along the coding sequences, at specific sites, subject to selective constraints related to DNA patterns used by the splicing machinery, for example. Phylogenetic mutation-selection models are the preferred tools to address these issues, as they explicitly model mutation processes and selective constraints. All the heterogeneities neglected by the mutation-selection models of Yang and Nielsen [2008] can generate false positives, ranging from 20% (site-specific amino acid preference) to 100% (hypermutability of transitions in CpG context)[Laurin-Lemay et al., 2018b]. In particular, the hypermutability of transitions in the CpG context alone can explain the selection on codon usage detected by Yang and Nielsen [2008]. However, modelling phenomena that take into account data interdependencies (e.g., hypermutability of the CpG context) greatly increases the complexity of the likelihood function. On the other hand, today’s sophisticated models require high-dimensional parameter vectors to model the heterogeneity of the processes studied, in our case selective constraints on the protein. Approximate Bayesian Computation (ABC) is used to bypass the calculation of the likelihood function. This approach differs from the Markov Chain Monte Carlo (MCMC) sampling commonly used to approximate the posterior distribution. We explored the idea of combining these approaches for a specific problem involving high-dimensional parameters and new parameters taking into account dependencies between sites. Under certain conditions, when the high dimensionality parameters are weakly correlated to the new parameters of interest, it is possible to infer the high dimensionality parameters with the MCMC method, and then the parameters of interest using the ABC. This new approach is called Conditional Approximate Bayesian Computation (CABC) [Laurin-Lemay et al., 2018a]. We were able to verify the effectiveness of the CABC method in a case study, namely the hypermutability of transitions in the CpG context within Eutheria [Laurin-Lemay et al.,2018a]. We find that 100% of the 137 genes tested have significant hypermutability of transitions. We have also shown that models incorporating hypermutability of transitions in CpG contexts predict a codon usage closer to that of the genes studied. This suggests that a significant part of codon usage can be explained by mutational processes alone. Finally, we explore several avenues of research emanating from our methodological developments: the application of hypermutability detection of transitions in CpG contexts to the Vertebrate scale; the expansion of the model to recognize contexts other than only CpG (e.g., hypermutability of transitions and transversions in CpG and TpA context); and methodological perspectives to improve the performance of the CABC approach. évolution moléculaire phylogénie calcul bayésien approché molecular evolution phylogeny approximate bayesian computation usage des codons codon usage évolution des Vertébrés vertebrates evolution évolution des séquences condantes coding sequence evolution
362	Genomic Island Discovery through Enrichment of Statistical Modeling with Biological Information Jani, Mehul 08 1900 (has links) Horizontal gene transfer enables acquisition and dissemination of novel traits including antibiotic resistance and virulence among bacteria. Frequently such traits are gained through the acquisition of clusters of functionally related genes, often referred to as genomic islands (GIs). Quantifying horizontal flow of GIs and assessing their contributions to the emergence and evolution of novel metabolic traits in bacterial organisms are central to understanding the evolution of bacteria in general and the evolution of pathogenicity and antibiotic resistance in particular, a focus of this dissertation study. Methods for GI detection have also evolved with advances in sequencing and bioinformatics, however, comprehensive assessment of these methods has been lacking. This motivated us to assess the performance of current methods for identifying islands on broad datasets of well-characterized bacterial genomes and synthetic genomes, and leverage this information to develop a novel approach that circumvents the limitations of the current state-of-the-art in GI detection. The main findings from our assessment studies were 1) the methods have complementary strengths, 2) a gene-clustering method utilizing codon usage bias as the discriminant criterion, namely, JS-CB, is most efficient in localizing genomic islands, specifically the well-studied SCCmec resistance island in methicillin resistant Staphylococcus aureus (MRSA) genomes, and 3) in general, the bottom up, gene by gene analysis methods, are inherently limited in their ability to decipher large structures such as GIs as single entities within bacterial genomes. We adapted a top-down approach based on recursive segmentation and agglomerative clustering and developed a GI prediction tool, GEMINI, which combined compositional features with segment context information to localize GIs in the Liverpool epidemic strain of Pseudomonas aeruginosa. Application of GEMINI to the genome of P. aeruginosa LESB58 demonstrated its ability to delineate experimentally verified GIs in the LESB58 genome. GEMINI identified several novel islands including pathogenicity islands and revealed the mosaic structure of several LESB58 harbored GIs. A new GI identification approach, CAFE, with broad applicability was developed. CAFE incorporates biological information encoded in a genome within the statistical framework of segmentation and clustering to more robustly localize GIs in the genome. CAFE identifies genomic islands lacking markers by virtue of their association with genomic islands with markers originating from the same source. This is made possible by performing marker enrichment and phyletic pattern analyses within the integrated framework of recursive segmentation and clustering. CAFE compared favorably with frequently used methods for genomic island detection on synthetic test datasets and on a test-set of known islands from 15 well-characterized bacterial species. These tools can be readily adapted for cataloging GIs in just sequenced, yet uncharacterized genomes. Evolution Genomic island antibiotic resistance pathogen virulence MRSA Pseudomonas aeruginosa Staphylococcus aureus genome segmentation clustering Biology, Bioinformatics Biology, Microbiology Biology, General Genetic transformation. Bacterial genetics. Pseudomonas aeruginosa. Staphylococcus aureus. Drug resistance in microorganisms.
363	Cellular basis of flower and leaf primordium initiation in Arabidopsis thaliana : how to make an organ in three dimensions Echevin, Eglantine Emilie Denise 10 1900 (has links) Le développement d’un organisme multicellulaire requière la coordination de la croissance, détermination tissulaire et différenciation cellulaire. Cependant, alors que les bases de la génétique de la morphogenèse ont été rigoureusement étudiées, le processus permettant la conversion de l’activité génétique en des structures biologiques complexes est bien moins compris. Chez Arabidopsis thaliana, les feuilles et fleurs initiés à partir du Méristème Apical Primaire (MAP) ont une expression génétique casi similaire. Toutefois, leur forme est considérablement différente dès les premières étapes de leur développement. Une compréhension de ce paradoxe requière avant tout de précisément quantifier la croissance dans toutes les dimensions de ces organes. Dans cet article, je présente une méthode de quantification spatio-temporelle complète de la croissance et de la prolifération des feuilles et des fleurs chez A. thaliana. En analysant des séries d’images confocales, j’en ai conclu que la différence morphologique observée entre feuilles et fleurs émerge principalement d’une asymétrie de la distribution de la croissance entre leurs côtés abaxial et adaxial, tôt dans leur développement. Je montre que le tissue contribuant principalement au développement des primordia est la couche 2 (L2) chez les feuilles et la couche 3 (L3) chez les fleurs. Mes résultats préliminaires démontrent que les premiers signes de l’initiation d’organes est un changement de distribution de la croissance, et non de la prolifération. Dans le futur, en appliquant, par exemple, cette méthodologie à l’étude de gènes de développement, il sera possible de finalement réconcilier la morphogenèse et la génétique de l’initiation des plantes. / The development of a multicellular organism requires the proper coordination of growth, pattern determination and cell differentiation. Still, while the genetic basis of morphogenesis has been extensively studied, the process converting gene activity into intricate biological shapes is less understood. In Arabidopsis thaliana, flowers and leaves, both initiated from the shoot apical meristem (SAM), have a very similar genetic expression profile. Yet, their shape differs considerably from early developmental stages. A full comprehension of this paradox requires an accurate quantification of cellular growth in those organs. In this paper, I am presenting a methodology for the complete spatio-temporal quantitative analysis of growth and proliferation of initiating leaves and flowers in wild type Arabidopsis thaliana. By analyzing time series of leaf and flower confocal images, I conclude that the morphological differences observed between flowers and leaves mainly arises from asymmetrical distributions of growth between their adaxial and abaxial sides during their initiation. I show that the tissue that mainly contributes to the development of early primordium is the layer 2 (L2) in leaves, and the layer 3 (L3) in flowers. My preliminary results also demonstrate that the first signs of organ initiation are a change in growth distribution, not cell proliferation. In the future, by applying this methodology, for example, to study morphogen reporter lines, it could finally bridge the gap between the morphogenesis and the genetics of plant initiation. Phyllotaxie Expansion cellulaire Division cellulaire Morphogenèse végétale Organogenèse Initiation d’organes Organes latéraux de l’apex Analyse d’images MorphoGraphX Phyllotaxis Cell expansion Cell division Morphogenesis Organogenesis Organ initiation Shoot lateral organs Image analysis
364	Étude du transcriptome des cellules non tumorales de l’épithélium de surface de l’ovaire des femmes porteuses d’une mutation des gènes BRCA1 et BRCA2 Abd-Rabbo, Diala 04 1900 (has links) Nous avons étudié le transcriptome de neuf échantillons d'ARN extraits de cultures primaires de cellules non tumorales de l’épithélium de surface de l’ovaire (NOSE) provenant de quatre donneuses non porteuses de mutation, deux mutées sur BRCA1 et trois sur BRCA2, ainsi que de quatre échantillons d’ARN extraits de cultures primaires de cellules tumorales de l’ovaire (TOV) provenant de trois donneuses porteuses de mutation sur BRCA1 et une sur BRCA2. Nous avons identifié, pour la première fois, les signatures moléculaires associées à la présence d’une mutation de BRCA1 et BRCA2 dans les cellules NOSEs ainsi que la signature associée à la transformation tumorale des cellules NOSEs en TOVs chez les porteuses de mutation de BRCA1. Nous avons également localisé les domaines chromosomiques comportant des gènes corégulés en association avec la présence d’une mutation de BRCA1 dans les cellules NOSEs. Les allèles sauvage et muté de BRCA2 étaient exprimés dans les cellules TOVs provenant des porteuses de la mutation 8765delAG sur BRCA2. Nous avons observé que le niveau d’expression des transcrits de BRCA2 était plus élevé dans les cellules provenant des tumeurs ovariennes les plus agressives chez les femmes porteuses de la mutation 8765delAG sur BRCA2, les transcrits correspondants à l’allèle muté contribuant avec un pourcentage élevé du niveau d’expression total du gène. Le phénotype tumoral observé chez les Canadiennes Françaises porteuses de cette mutation pourrait résulter d’un effet de dosage de l’allèle muté. / We analyzed the transcriptome of nine primary cultures of non-tumor ovarian surface epithelium cells (NOSE) from four non-carriers, two BRCA1 and three BRCA2 carriers, and four primary cultures of tumor ovarian cells (TOV) from three BRCA1 and one BRCA2 carriers. We identified the first molecular signatures associated with the presence of BRCA1 and BRCA2 mutations in NOSEs and the first molecular signature associated with the transformation from NOSEs to TOVs in French Canadian women carriers of BRCA1 mutation. Moreover, we localized some co-regulated chromosomal domains associated with the presence of a BRCA1 mutation in NOSE cells. Wild-type and mutated BRCA2 allelic transcripts were expressed in tumor cells from 8765delAG BRCA2 mutation carriers, with the highest level of BRCA2 transcript expression and the highest contribution of the mutated allele in cells originating from the most aggressive ovarian tumors. The observed phenotype in BRCA2-mutated cells as well as the aggressiveness of the tumor could result from a dosage effect of the BRCA2 mutated allele. Transcriptome Domaines chromosomiques de corégulation Cellules tumorales ovariennes BRCA1 BRCA2 8765delAG BRCA2 Transcriptome Co-regulated chromosomal domains Non-tumor ovarian surface epithelium Epithelial ovarian tumor
365	Une correction à l’échelle et progressive des données Hi-C révèlent des principes fondamentaux de l’organisation tridimensionnelle et fonctionnelle du génome Matala, Ilunga Benjamin 12 1900 (has links) Au cours des dernières années, de nouvelles évidences semblent indiquer que, tout autant que sa séquence, l’organisation d’un génome dans l’espace et le temps est importante pour comprendre la fonction de celui-ci. Une des avancées fonda- mentales sur le sujet a été de présenter à l’échelle du génome la carte des inter- actions ADN-ADN. Ces interactions sont essentiellement de 2 types, soit entre chromosomes ou entre régions du même chromosome. Par la suite, la modélisa- tion a permis de visualiser et appréhender la structure tridimensionnelle (3D) du génome à partir des données 3C, ou d’une modélisation purement théorique. Une question importante et centrale demeure, soit de résoudre les mécanismes res- ponsables de l’organisation spatiale et fonctionnelle du génome. Notamment, une question est de savoir comment des processus nucléaires tels que la transcription affectent la structure du génome. Cependant, l’idée selon laquelle les données de types 3C capturent cette information dans la levure est remise en question par le fait que les modèles théoriques du génome récapitulent les caractéristiques mar- quantes soulignées par 3C. Pour répondre à cette question, nous avons conçu une approche qui, pour évaluer l’importance d’une interaction, se base sur la distri- bution d’interactions entre les 2 régions d’ADN mises en contacts. Nos résultats supportent l’hypothèse selon laquelle les éléments fonctionnels et propres aux données expérimentales de la structure 3D du génome se forment d’une manière spécifique à l’échelle de l’interaction et au type d’interactions. Par ailleurs, nos résultats indiquent qu’un grand nombre de facteurs de transcription induisent la proximité spatiale des gènes dont ils régulent l’expression. / Over the last decade, accumulating empirical evidence suggest that, as much as its sequence, a genome spatiotemporal organization is essential to understand it’s biological function. One of the major breakthroughs has been chromosome conformation capture (3C) experiments presenting DNA-DNA contact for whole genomes at unprecedented resolution (5-10kb). Along with genome-wide maps of DNA contacts came genome 3D modelling from experimental 3C data, and even from purely theoretical and biophysical basis. However, the mechanisms underlying the regulation of the genome spatial functional organization are still not well understood. Among other questions, how the regulation and event of nuclear processes such as transcription modulate genome structure or how genome structure affect these in turn is still not fully resolved. Moreover, computational models of S.cerevisae genome have recapitulated the hallmarks at larger scale of its 3D features. In order to contrast genome structural features arising from the event of biochemical and molecular activity, we have develop a method assessing the significance of structural features. The underlying principle is to consider for a given interaction, the two DNA regions put in contact and the distribution of existing interactions between these before assigning significance to the selected interaction. Using this method, we demonstrate that structural features resulting from potential biochemically active processes occur at precise scale on the genome. Our results also highlight that exact nature of the interaction (between vs across chromosomes) is crucial to such events. Finally, we have also found that a large portion of transcription factors have their targeted genes in spatial proximity. Structure spatiale (3D) du génome Organisation fonctionnelle du génome Régulation de la transcription Données de type 3C (Hi-C) Correction de données 3C Genome spatial (3D) structure Genome functional organization Transcriptional regulation Chromosome conformation capture (3C) 3C data correction
366	Gene x gene interactions in genome wide association studies Bhattacharya, Kanishka January 2014 (has links) Genome wide association studies (GWAS) have revolutionized our approach to mapping genetic determinants of complex human diseases. However, even with success from recent studies, we have typically been able to explain only a fraction of the trait heritability. GWAS are typically analysed by testing for the marginal effects of single variants. Consequently, it has been suggested that gene-gene interactions might contribute to the missing heritability of complex diseases. GWAS incorporating interaction effects have not been routinely applied because of statistical and computational challenges relating to the number of tests performed, genome-wide. To overcome this issue, I have developed novel methodology to allow rapid testing of pairwise interactions in GWAS of complex traits, implemented in the IntRapid software. Simulations demonstrated that the power of this approach was equivalent to computationally demanding exhaustive searches of the genome, but required only a fraction of the computing time. Application of IntRapid to GWAS of a range of complex human traits undertaken by the Wellcome Trust Case Control Consortium (WTCCC) identified several interaction effects at nominal significance, which warrant further investigation in independent studies. In an attempt to fine-map the identified interacting loci, I undertook imputation of the WTCCC genotype data up to the 1000 Genomes Project reference panel (Phase 1 integrated release, March 2012) in the neighbourhood of the lead SNPs. I modified the IntRapid software to take account of imputed genotypes, and identified stronger signals of interaction after imputation at the majority of loci, where the lead SNP often had moved by hundreds of kilobases. The X-chromosome is often overlooked in GWAS of complex human traits, primarily because of the difference in the distribution of genotypes in males and females. I have extended IntRapid to allow for interactions with the X chromosome by considering males and females separately, and combining effect estimates across the sexes in a fixed-effects meta-analysis. Application to genotype data from the WTCCC failed to identify any strong signals of association with the X-chromosome, despite known epidemiological differences between the sexes for the traits considered. The novel methods developed as part of this doctoral work enable a user friendly, computationally efficient and powerful way of implementing genome-wide gene-gene interaction studies. Further work would be required to allow for more complex interaction modelling and deal with the associated computational burden, particularly when using next-generation sequencing (NGS) data which includes a much larger set of SNPs. However, IntRapid is demonstrably efficient in exhaustively searching for pairwise interactions in GWAS of complex traits, potentially leading to novel insights into the genetic architecture and biology of human disease. 572
367	Comparative neurotranscriptomics in mammals and birds Belgard, Tildon Grant January 2011 (has links) In this thesis I apply new sequencing technologies and analytical methods derived from genomics and computer science to the neuroanatomy of gene expression. The first project explores characteristics of gene expression across adult neocortical layers in a representative mammal – the mouse. Amongst the thousands of genes and transcripts differentially expressed across layers, I found common functional characteristics of genes that define certain layers, candidate cases of isoform switching, and over a thousand apparent long intergenic non-coding RNA transcripts. The second project compares patterns of gene expression in the structurally diverged adult derivatives of the pallium in mice and chickens. Overall, gene expression levels were moderately correlated between the two species. While expression patterns of ‘marker’ genes were only poorly conserved in these regions, there nevertheless was significant conservation of cross-species marker genes for homologous structures, cell types and functionally analogous regions. Many aspects of these data from both projects can now be easily browsed and searched from custom-built web interfaces. In addition to generating unprecedented genome-wide resources for the neuroscience community to explore the functional and structural dimensions of gene expression amongst different pallial regions in mammals and birds, this work also provides new insights into the widespread evolutionary shuffling of adult marker gene expression. 571.85
368	In silico analysis of mitochondrial proteins Shen, Yaoqing 10 1900 (has links) Le rôle important joué par la mitochondrie dans la cellule eucaryote est admis depuis longtemps. Cependant, la composition exacte des mitochondries, ainsi que les processus biologiques qui sy déroulent restent encore largement inconnus. Deux facteurs principaux permettent dexpliquer pourquoi létude des mitochondries progresse si lentement : le manque defficacité des méthodes didentification des protéines mitochondriales et le manque de précision dans lannotation de ces protéines. En conséquence, nous avons développé un nouvel outil informatique, YimLoc, qui permet de prédire avec succès les protéines mitochondriales à partir des séquences génomiques. Cet outil intègre plusieurs indicateurs existants, et sa performance est supérieure à celle des indicateurs considérés individuellement. Nous avons analysé environ 60 génomes fongiques avec YimLoc afin de lever la controverse concernant la localisation de la bêta-oxydation dans ces organismes. Contrairement à ce qui était généralement admis, nos résultats montrent que la plupart des groupes de Fungi possèdent une bêta-oxydation mitochondriale. Ce travail met également en évidence la diversité des processus de bêta-oxydation chez les champignons, en corrélation avec leur utilisation des acides gras comme source dénergie et de carbone. De plus, nous avons étudié le composant clef de la voie de bêta-oxydation mitochondriale, lacyl-CoA déshydrogénase (ACAD), dans 250 espèces, couvrant les 3 domaines de la vie, en combinant la prédiction de la localisation subcellulaire avec la classification en sous-familles et linférence phylogénétique. Notre étude suggère que les gènes ACAD font partie dune ancienne famille qui a adopté des stratégies évolutionnaires innovatrices afin de générer un large ensemble denzymes susceptibles dutiliser la plupart des acides gras et des acides aminés. Finalement, afin de permettre la prédiction de protéines mitochondriales à partir de données autres que les séquences génomiques, nous avons développé le logiciel TESTLoc qui utilise comme données des Expressed Sequence Tags (ESTs). La performance de TESTLoc est significativement supérieure à celle de tout autre outil de prédiction connu. En plus de fournir deux nouveaux outils de prédiction de la localisation subcellulaire utilisant différents types de données, nos travaux démontrent comment lassociation de la prédiction de la localisation subcellulaire à dautres méthodes danalyse in silico permet daméliorer la connaissance des protéines mitochondriales. De plus, ces travaux proposent des hypothèses claires et faciles à vérifier par des expériences, ce qui présente un grand potentiel pour faire progresser nos connaissances des métabolismes mitochondriaux. / The important role of mitochondria in the eukaryotic cell has long been appreciated, but their exact composition and the biological processes taking place in mitochondria are not yet fully understood. The two main factors that slow down the progress in this field are inefficient recognition and imprecise annotation of mitochondrial proteins. Therefore, we developed a new computational tool, YimLoc, which effectively predicts mitochondrial proteins from genomic sequences. This tool integrates the strengths of existing predictors and yields higher performance than any individual predictor. We applied YimLoc to ~60 fungal genomes in order to address the controversy about the localization of beta oxidation in these organisms. Our results show that in contrast to previous studies, most fungal groups do possess mitochondrial beta oxidation. This work also revealed the diversity of beta oxidation in fungi, which correlates with their utilization of fatty acids as energy and carbon sources. Further, we conducted an investigation of the key component of the mitochondrial beta oxidation pathway, the acyl-CoA dehydrogenase (ACAD). We combined subcellular localization prediction with subfamily classification and phylogenetic inference of ACAD enzymes from 250 species covering all three domains of life. Our study suggests that ACAD genes are an ancient family with innovative evolutionary strategies to generate a large enzyme toolset for utilizing most diverse fatty acids and amino acids. Finally, to enable the prediction of mitochondrial proteins from data beyond genome sequences, we designed the tool TESTLoc that uses expressed sequence tags (ESTs) as input. TESTLoc performs significantly better than known tools. In addition to providing two new tools for subcellular localization designed for different data, our studies demonstrate the power of combining subcellular localization prediction with other in silico analyses to gain insights into the function of mitochondrial proteins. Most importantly, this work proposes clear hypotheses that are easily testable, with great potential for advancing our knowledge of mitochondrial metabolism. Mitochondrie Mitochondria Subcellular localization prediction Apprentissage par la machine Machine learning Bêta-oxydation Beta oxidation Dégradation des acides gras Fatty acid degradation Dégradation des acides aminés Amino acid degradation Acyl-CoA déshydrogénase Acyl-CoA dehydrogenase Evolution Evolution Marqueurs de séquence exprimés Expressed sequence tags
369	Études de réseaux d’expression génique : utilité pour l’élucidation des déterminants génétiques des traits complexes Scott-Boyer, Marie Pier 04 1900 (has links) Les traits quantitatifs complexes sont des caractéristiques mesurables d’organismes vivants qui résultent de l’interaction entre plusieurs gènes et facteurs environnementaux. Les locus génétiques liés à un caractère complexe sont appelés «locus de traits quantitatifs » (QTL). Récemment, en considérant les niveaux d’expression tissulaire de milliers de gènes comme des traits quantitatifs, il est devenu possible de détecter des «QTLs d’expression» (eQTL). Alors que ces derniers ont été considérés comme des phénotypes intermédiaires permettant de mieux comprendre l’architecture biologique des traits complexes, la majorité des études visent encore à identifier une mutation causale dans un seul gène. Cette approche ne peut remporter du succès que dans les situations où le gène incriminé a un effet majeur sur le trait complexe, et ne permet donc pas d’élucider les situations où les traits complexes résultent d’interactions entre divers gènes. Cette thèse propose une approche plus globale pour : 1) tenir compte des multiples interactions possibles entre gènes pour la détection de eQTLs et 2) considérer comment des polymorphismes affectant l’expression de plusieurs gènes au sein de groupes de co-expression pourraient contribuer à des caractères quantitatifs complexes. Nos contributions sont les suivantes : Nous avons développé un outil informatique utilisant des méthodes d’analyse multivariées pour détecter des eQTLs et avons montré que cet outil augmente la sensibilité de détection d’une classe particulière de eQTLs. Sur la base d’analyses de données d’expression de gènes dans des tissus de souris recombinantes consanguines, nous avons montré que certains polymorphismes peuvent affecter l’expression de plusieurs gènes au sein de domaines géniques de co-expression. En combinant des études de détection de eQTLs avec des techniques d’analyse de réseaux de co-expression de gènes dans des souches de souris recombinantes consanguines, nous avons montré qu’un locus génétique pouvait être lié à la fois à l’expression de plusieurs gènes au niveau d’un domaine génique de co-expression et à un trait complexe particulier (c.-à-d. la masse du ventricule cardiaque gauche). Au total, nos études nous ont permis de détecter plusieurs mécanismes par lesquels des polymorphismes génétiques peuvent être liés à l’expression de plusieurs gènes, ces derniers pouvant eux-mêmes être liés à des traits quantitatifs complexes. / Complex quantitative traits are measurable characteristics of living organisms resulting from the interaction between multiple genes and environmental factors. Genetic loci associated with complex trait are called "quantitative trait loci" (QTL). Recently, considering the expression levels of thousands of genes as quantitative traits, it has become possible to detect "expression QTLs " (eQTL). These eQTL are considered intermediate phenotypes and are used to better understand the biological architecture of complex traits. However the majority of studies still try to identify a causal mutation in a single gene. This approach can only meet success in situations where the gene incriminate as a major effect on the complex trait, and therefore can not elucidate the situations where complex traits result from interactions between various genes. This thesis proposes a more comprehensive approach to: 1) take into account the possible interactions between multiple genes for the detection of eQTLs and 2) consider how polymorphisms affecting the expression of several genes in a module of co-expression may contribute to quantitative complex traits. Our contributions are as follows: We have developed a tool using multivariate analysis techniques to detect eQTLs, and have shown that this tool increases the sensitivity of detection of a particular class of eQTLs. Based on the data analysis of gene expression in recombinant inbred strains mice tissues, we have shown that some polymorphisms may affect the expression of several genes in domain of co-expression. Combining eQTLs detection studies with network of co-expression genes analysis in recombinant inbred strains mice, we showed that a genetic locus could be linked to both the expression of multiple genes at a domain of gene co-expression and a specific complex trait (i.e. left ventricular mass). Our studies have detected several mechanisms by which genetic polymorphisms may be associated with the expression of several genes, and may themselves be linked to quantitative complex traits. Quantitative trait locus Expression de gènes Réseau de co-expression Masse du ventricule gauche Trait quantitatif complexe Bio-informatique translationnelle Génétique quantitative Gene expression Co-expression network Left ventricular mass Complex quantitative traits Translational bioinformatics Quantitative genetics
370	Séquençage d’exomes d’une cohorte de familles caucasiennes simplex dont les patients sont atteints du syndrome d’interruption de la tige hypophysaire Jean-Louis, Martineau 04 1900 (has links) No description available. Tige hypophysaire PSIS WES CNV NGS GATK Bowtie2 Freebayes SAMtools BWA CoNIFER fishingCNV xHmm IRM GH, SNP, SNP Séquençage Exome Génomique Pipeline Syndrome Désordre Rare Pituitary stalk Disorder Endocrine MRI Magnetic Resonance Growth Hormone Genomic Mutation

Search results