Global ETD Search

11	Utilisation des EST dans la génération d'une nouvelle ressource bioinformatique spécifique à la tolérance du blé au froid Belcaid, Mahdi January 2006 (has links) (PDF) La bioinformatique constitue un outil de choix dans l'étude des plantes. Lorsqu'utilisées efficacement, la gestion ainsi que l'analyse informatique des données biologiques permettent de réduire considérablement la durée des expériences ainsi que les coûts liés à la recherche tout en élargissant le spectre d'analyses pouvant être effectuées. L'objectif de cette recherche est de définir un protocole efficace utilisant les outils actuels et mettant en oeuvre de nouvelles approches, dans le but de faire le prétraitement, le clustering et l'assemblage d'un ensemble d'EST. Ce mémoire traite des algorithmes et des techniques informatiques utilisés dans l'étude de l'expression différentielle à partir des EST. Les particularités du projet de FGAS sont présentées et une attention particulière est portée sur la manière dont les résultats ont été analysés. À travers la classification en sous-groupes fonctionnels et de l'analyse différentielle digitale, l'identification des gènes potentiellement impliqués dans le phénomène d'acclimatation du blé au froid est effectuée. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Bioinformatique, Clustering, Assemblage, Expressed Sequence Tags, Tolérance au froid. Résistance au gel Blé Séquence génomique exprimée Bio-informatique
12	Identification et caractérisation de microARNs dans les ESTs du blé par des méthodes bioinformatiques Leclercq, Mickaël 04 1900 (has links) (PDF) Les microARNs sont de petits ARNs qui participent à la régulation de l'expression génique dans les organismes vivants. Depuis l'apparition des nouvelles techniques de séquençage à haut débit, leur identification et caractérisation dans les espèces animales et végétales font partie des défis actuels de la bioinformatique. Dans ce mémoire nous abordons ce problème en recherchant les microARNs exprimés chez le blé sous une dizaine de conditions environnementales différentes. Contrairement aux études antérieures similaires dans d'autres organismes, des difficultés additionnelles se sont ajoutées, associées à la partialité du génome du blé disponible, la multitude de conditions expérimentales et le peu de microARNs connus retrouvés par prédiction. Une nouvelle approche, employant une double validation par deux algorithmes de prédiction, a permis d'identifier plus de 3862 microARNs potentiels chez le blé ainsi que leurs gènes cibles. Parmi eux, 206 sont différentiellement exprimés entre les conditions expérimentales. Ces microARNs ont été répartis en 1222 familles en fonction des paramètres de leur similarité intra et intergroupe déduite des microARNs connus de mirBase. Pour minimiser le nombre de faux positifs, nous avons développé une méthode d'apprentissage machine (miRdup) pour valider la position des microARNs séquencés sur son pré-microARN en estimant plusieurs caractéristiques associées à ces petits ARNs. Ce dernier nous a permis d'établir 1016 microARNs avec un haut score de prédiction (502 familles). Pour chacun des microARNs prédits, en exploitant les données de leurs niveaux d'expression et l'identification des gènes ciblés, nous avons décrypté leurs rôles dans les différentes conditions expérimentales imposées au blé. Plusieurs microARNs sont en cours de validation expérimentale. Par ailleurs, pour faciliter l'implémentation de cette plateforme, nous avons intégré le pipeline de recherche conçu au cours de ce mémoire dans le logiciel Armadillo. Ce dernier permettra à l'avenir de faciliter la reproduction d'une telle étude chez d'autres plantes. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : microARNS, prédiction, séquençage haut débit, blé, apprentissage machine. Apprentissage automatique Bio-informatique Blé Micro-ARN Séquence génomique exprimée
13	Environnement de développement bioinformatique pour la génomique et la protéomique Paladini, David. January 1900 (has links) (PDF) Thèse (M.Sc.)--Université Laval, 2006. / Titre de l'écran-titre (visionné le 14 mai 2007). Bibliogr.
14	Statistiques bayésiennes en génétique des populations : modèle à facteurs et processus gaussiens pour étudier la variation génétique neutre et adaptative / Bayesian statistics in population genetics : factor model and gaussian processes to study neutral and adaptive genetic variation Duforet-Frebourg, Nicolas 02 October 2014 (has links) Nous présentons dans cette thèse plusieurs travaux de statistiques bayésiennes appliquées à la génétique des populations. La génétique des populations a pour but d'expliquer les variations génétiques au sein d'une espèce, et d'inférer les processus ayant conduits à ces variations. Pour cela, des données génétiques massives sont utilisées et il y a un besoin grandissant de méthodes statistiques pour traiter ces données. Le travail de cette thèse s'inscrit dans cet effort de modélisation statistique pour répondre aux enjeux de la génétique des populations, et de la biologie de l'évolution. Nous nous intéressons tout particulièrement à la détection de traces d'adaptation locale dans les génomes, et à l'inférence des variations spatiales non stationnaires.Un modèle d'analyse factorielle bayésien est proposé pour détecter les traces d'adaptation locale. Nous comparons notre approche aux méthodes existantes, et démontrons qu'elle permet d'obtenir un plus faible taux de fausses découvertes. Nous présentons également un modèle bayésien basé sur des processus gaussiens pour caractériser les variations génétiques spatiales dans l'aire de répartition d'une espèce. Les performances de ces méthodes sont démontrées sur différents exemples issus de simulations ou de données. Plusieurs logiciels open source qui implémentent ces méthodes ont été développés pendant la thèse. / In this thesis we present several works related to Bayesian statistics in population genetics. Population genetics aims at explaining genetic variation within natural species, and infer the different processes that lead to current genetic variation. Large scale genomic datasets are produced, and there is an increasing need of statistical methods to extract information from these datasets. My thesis work is part of this statistical modeling effort to answer to evolutionary biology and population genetic questions. We are interested in detecting footprints of local adaptation without, and infering non-stationary patterns of spatial variation. A Bayesian factor model is used to detect genes involved in local adaptation. We compare our factor model to existing methods, and show that it can reduce the false discovery rate. We also present a Bayesian model based on Gaussian processes to caracterize spatial genetic variations within species. The performances of these methods are tested on simulations and real datasets. Several open source software are available online. Bio-informatique Statistiques Génétique Bioinformatics Computationnal statistics Genetics 570
15	Développement d'outils bioinformatiques et de méthodologies d'apprentissage machine pour une meilleure compréhension des éléments génétiques sous-jacents à la susceptibilité au cancer du sein Lemaçon, Audrey January 2019 (has links) Le cancer du sein est l'une des principales causes de décès par cancer chez les Canadiennes (1 sur 8 le développera au cours de sa vie et 1 sur 31 en décédera). Les études suggèrent que la majorité des cancers du sein se développent dans une faible portion de femmes ayant une susceptibilité génétique à la maladie. L'évaluation personnalisée de ce risque étant basée sur la conviction que la population peut se diviser en plusieurs groupes selon le risque génétique individuel inhérent, il est indispensable d'identier les acteurs responsables de cette susceptibilit é génétique pour pouvoir offrir, à ces femmes à risque, des mesures préventives adaptées à leur risque. Ainsi, depuis la découverte des gènes associés au cancer du sein, BRCA1 en 1994 et BRCA2 en 1995, d'énormes efforts ont été fournis an d'identier les éléments génétiques sous-jacents au risque du cancer du sein et de nombreuses autres mutations délétères ont été découvertes dans des gènes de susceptibilité tels que PTEN, PALB2 ou CHEK2. Malheureusement, malgr é les efforts engagés dans cette recherche, les gènes/loci de susceptibilité connus à ce jour n'expliquent qu'environ la moitié du risque génétique liée à cette maladie. Conscients des enjeux, de nombreux groupes d'études internationaux se sont associés en consortiums tels que le Breast Cancer Association Consortium (BCAC) ou le Consortium of Investigators of Modi ers of BRCA1/2 (CIMBA), an d'unir leur ressources pour l'identication de ce qu'on a appelé "l'héritabilité manquante" du cancer du sein. Plusieurs hypothèses ont été formulées quant aux sources de cette héritabilité manquante et, parmi ces hypothèses, nous en avons exploré deux. Dans un premier temps, nous avons testé l'hypothèse selon laquelle il resterait de nombreux variants génétiques communs de faible pénétrance à découvrir à travers une vaste étude d'association pangénomique réalisée dans le cadre de l'OncoArray Network. Dans un second temps, nous avons testé l'hypothèse selon laquelle des variants, plus rares mais de pénétrance plus forte, seraient à découvrir dans les régions codantes du génome, à travers l'évaluation du potentiel prédictif de ces variants via une approche innovante d'analyse de données d'exomes. Ainsi, nous avons pu démontrer la véracité de la première hypothèse par la découverte de 65 nouveaux locus associés à la susceptibilité au cancer du sein global. De plus, ces travaux ayant mis en lumière des besoins en terme d'assistance à l'analyse des signaux d'association, nous avons développé deux outils d'aide à la priorisation des variants génétiques humains. Enn, la seconde hypothèse a été testée à travers le développement d'une nouvelle méthodologie multi-étapes, combinant l'analyse de génotypes et d'haplotypes. Cette approche, mettant à prot la puissance de l'apprentissage machine, a permis d'identier des nouveaux marqueurs (variants individuels ou combinés dans des haplotypes) codants potentiellement associés au phénotype. Pour les locus de susceptibilité comme pour les gènes candidats identiés lors de l'analyse des données d'exomes, il sera indispensable de conrmer leur implication ainsi que l'ampleur de leurs effets sur des cohortes externes de grande taille et puis procéder à leur caractérisation fonctionnelle. Si ces derniers sont validés, ils pourront alors être intégrés aux outils actuels de prédiction du risque du cancer du sein et favoriser ainsi une prise en charge précoce et la prescription d'interventions thérapeutiques mieux adaptées pour les femmes à risque. / Breast cancer is one of the leading causes of death from cancer among Canadian women (about 1 in 8 Canadian women will develop breast cancer during her lifetime and 1 in 31 will die from the disease). Evidence suggests that most breast cancer cases develop in a small proportion of women with a genetic susceptibility to the disease. Since the personalized assessment of this risk is based on the certainty that women can be divided into several groups according to their inherent genetic risk, it is essential to identify the actors responsible for this genetic susceptibility to breast cancer in order to offer these at-risk women, personalized preventive measures. Thus, since the discovery of the associated genes BRCA1 in 1994 and BRCA2 in 1995, tremendous efforts have been made to identify the genetic components underlying breast cancer risk and many other deleterious mutations have been uncovered in susceptibility genes such as PTEN, PALB2 or CHEK2. Unfortunately, despite these efforts, the susceptibility genes/loci known to date only explain about half of the genetic risk associated with this disease. Acknowledging the challenges, many international groups have partnered in consortia such as the Breast Cancer Consortium (BCAC) or the Consortium of Investigators of Modiers of BRCA1/2 (CIMBA) to join their resources for the identication of what has been called breast cancer "missing heritability". Several hypotheses have been formulated as to the sources of this missing heritability and, among these hypotheses, we have explored two. First, we tested the hypothesis of many common low penetrance genetic variants still to be discovered through a large genome-wide association study conducted within the OncoArray Network. In a second step, we tested the hypothesis according to which rarer variants of higher penetrance, could be discovered in the coding regions of the genome, through the evaluation of the predictive power of these variants by an innovative approach of exomes data analysis. Thus, we were able to demonstrate the veracity of the rst hypothesis by the discovery of 65 new loci associated with overall breast cancer susceptibility. In addition, these studies having highlighted the need for assistance tools for prioritization analysis, we developed two softwares to help prioritize human genetic variants. Finally, we developed a new multi-step methodology, combining the analysis of genotypes and haplotypes in order to assess the predictive power of coding variants. This approach, taking advantage of the power of machine learning, enabled the identication of new credible coding markers (variants alone or combined into haplotypes), signicantly associated with the phenotype. For susceptibility loci as well as for candidate genes identied during the analysis of exome data, it will be essential to conrm their involvement and effect size on large external sample sets and then perform their functional characterization. If they are validated, their integration into current risk prediction tools could help promote early management and well-calibrated therapeutic interventions for at-risk women. Sein -- Cancer -- Aspect génétique Bio-informatique Apprentissage automatique
16	Élaboration d’une méthodologie d’analyses bio-informatiques pour des données de séquençage Illumina dans un contexte de metabarcoding Gagné, Patrick 07 December 2020 (has links) Le metabarcoding, un domaine alliant les technologies de séquençage à haut débit et l’identification d’organismes biologiques via l’ADN, a permis d’ouvrir les portes à un grand nombre de nouveaux projets scientifiques. Il existe une multitude de programmes capables d’effectuer les analyses, mais ces programmes ne sont souvent pas adaptés pour des projets particuliers comme la détection de pathogènes. ADAPTI a été développé afin de répondre à ce manque. ADAPTI est une méthodologie complète d’analyse adaptée pour la détection de pathogènes, mais capable de s’adapter à différents contextes de recherche grâce à son développement flexible et extensible. Toute la méthodologie a été mise à l’épreuve afin d’évaluer sa capacité, tant au niveau de l’efficacité en temps, mémoire vive et en espace disque, qu’au niveau de la validité et l’exactitude des résultats. Il a été démontré qu’ADAPTI est non seulement capable de fournir des résultats sur des jeux de données de grande taille, mais il le fait avec une grande sensibilité tout en conservant une efficacité multifilaire acceptable. ADAPTI a ensuite été comparé à des programmes open source en utilisant un jeu de données standardisé et il a été déterminé qu’il permet d’effectuer de meilleures analyses que les autres programmes testés. Il a été déterminé que la haute sensibilité fait la force d’ADAPTI, mais aussi l’une de ses faiblesses en permettant une plus grande quantité de séquences « bruits », lesquelles nécessitent des traitements supplémentaires. Certains programmes composant la suite d’ADAPTI nécessitent de l’optimisation au niveau de l’utilisation de la mémoire vive, ce qui est souvent un enjeu en bio-informatique. Il sera aussi nécessaire d’implémenter des capacités de calcul parallèle massif, car l’évolution rapide des technologies de séquençage rendra ADAPTI inefficace dans sa forme actuelle d’ici quelques années. Somme toute, ADAPTI est une méthodologie fonctionnelle capable de répondre à la demande en pathologie. Séquençage à haut débit. Bio-informatique.
17	Principes de l’évolution du réseau de l’homéostasie des protéines Draceni, Yasmine 12 1900 (has links) No description available. Evolution bio-informatique chaperons phylogénétique homéostasie homeostasis bioinformatics phylogenetics Évolution
18	Adaptation de la levure à la suite des perturbations du mécanisme de contrôle de qualité de l'ARN Gendron, Louis 09 1900 (has links) The life-cycle of RNA is determined by several processing steps, which allow the cell to export and translate a coding transcript. The cell has developed an astonishingly complex mechanism to ensure the integrity of RNA processing steps. The quality control mechanism of RNA balances the biosynthesis and degradation of various transcripts, adding another layer of gene regulation to the complex system of gene expression. The exosome is a central piece of the RNA quality control mechanism as it degrades many of the aberrant or non-functional RNAs in the nucleus and the cytoplasm. This project characterizes and highlight a response to mutation of components from the RNA quality control mechanism in Saccharomyces cerevisiae. These perturbations include functional components of the exosome (Csl4 and Dis3), a cofactor of the nuclear exosome (Rrp6), an essential protein for pre-rRNA processing (Enp1) and a component of RNA export machinery (Srm1). Here, I present bioinformatics approaches to characterize the cellular response at a level of transcript expression and polyadenylation size. The stress response embedded in the gene expression profile is highly similar between the mutants. This work suggests a generic response to a failure in different components of the RNA quality control machinery. / Le cycle de vie des ARN est déterminé par différentes étapes permettant à la cellule d’exporter et de traduire un transcrit codant. La cellule a développé un mécanisme incroyablement complexe pour s’assurer de l’intégrité des étapes de maturation de l’ARN. Le mécanisme de contrôle de qualité balance la biosynthèse et la dégradation de différents transcrits, ce qui ajout un niveau de régulation au système de l’expression génique. L’exosome est une pièce centrale du mécanisme de contrôle de qualité de l’ARN alors qu’elle dégrade une grande partie des transcrits aberrants ou non-fonctionnels dans le noyau et le cytoplasme. Ce projet caractérise et souligne la réponse cellulaire à la suite de la mutation de composantes du mécanisme de contrôle de qualité de l’ARN chez Saccharomyces cerevisiae. Ces perturbations comportent des composantes fonctionnelles du complexe de l’exosome (Csl4 et Dis3), un cofacteur de l’exosome nucléaire (Rrp6), une protéine essentielle pour la maturation des pré-ARNr (Enp1) et une composante de la machinerie d’export de l’ARN (Srm1). Ici, je présente des approches bio-informatiques pour caractériser la réponse cellulaire au niveau de l’expression des transcrits et de la taille des segments polyadénylés. La réponse au stress cellulaire intégré dans le profil d’expression du génome est très similaire entre les mutants. Ce travail suggère une réponse générique à la suite de la perturbation de différentes composantes du mécanisme de contrôle de qualité de l’ARN. bio-informatique bioinformatic transcriptomique transcriptomic contrôle de qualité de l'ARN RNA quality control exosome polyadenylation
19	Evolution Combinatoire, Algorithmique des Chromosomes Tannier, Eric 21 July 2011 (has links) (PDF) Ce mémoire est une présentation de certains de mes travaux de recherches effectués en bioinformatique au laboratoire de Biométrie et Biologie Evolutive de l'université de Lyon 1 depuis 2003, date de mon arrivée en post-doctorat à l'INRIA, suivie de la stabilisation de mon poste un an après. Evolution Moléculaire méthodologie
20	Décodage de l'expression de gènes cryptiques Moreira, Sandrine 08 1900 (has links) Pour certaines espèces, les nouvelles technologies de séquençage à haut débit et les pipelines automatiques d'annotation permettent actuellement de passer du tube Eppendorf au fichier genbank en un clic de souris, ou presque. D'autres organismes, en revanche, résistent farouchement au bio-informaticien le plus acharné en leur opposant une complexité génomique confondante. Les diplonémides en font partie. Ma thèse est centrée sur la découverte de nouvelles stratégies d'encryptage de l'information génétique chez ces eucaryotes, et l'identification des processus moléculaires de décodage. Les diplonémides sont des protistes marins qui prospèrent à travers tous les océans de la planète. Ils se distinguent par une diversité d'espèces riche et inattendue. Mais la caractéristique la plus fascinante de ce groupe est leur génome mitochondrial en morceaux dont les gènes sont encryptés. Ils sont décodés au niveau ARN par trois processus: (i) l'épissage en trans, (ii) l'édition par polyuridylation à la jonction des fragments de gènes, et (iii) l'édition par substitution de A-vers-I et C-vers-T; une diversité de processus posttranscriptionnels exceptionnelle dans les mitochondries. Par des méthodes bio-informatiques, j'ai reconstitué complètement le transcriptome mitochondrial à partir de données de séquences ARN à haut débit. Nous avons ainsi découvert six nouveaux gènes dont l'un présente des isoformes par épissage alternatif en trans, 216 positions éditées par polyuridylation sur 14 gènes (jusqu'à 29 uridines par position) et 114 positions éditées par déamination de A-vers-I et C-vers-T sur sept gènes (nad4, nad7, rns, y1, y2, y3, y5). Afin d'identifier les composants de la machinerie réalisant la maturation des ARNs mitochondriaux, le génome nucléaire a été séquencé, puis je l'ai assemblé et annoté. Cette machinerie est probablement singulière et complexe car aucun signal en cis ni acteur en trans caractéristiques des machineries d'épissage connues n'a été trouvé. J'ai identifié plusieurs candidats prometteurs qui devront être validés expérimentalement: des ARN ligases, un nombre important de protéines de la famille des PPR impliquées dans l'édition des ARNs dans les organites de plantes, ainsi que plusieurs déaminases. Durant ma thèse, nous avons mis en évidence de nouveaux types de maturation posttranscriptionnelle des ARNs dans la mitochondrie des diplonémides et identifié des candidats prometteurs de la machinerie. Ces composants, capables de lier précisément des fragments d'ARN et de les éditer pourraient trouver des applications biotechnologique. Au niveau évolutif, la caractérisation de nouvelles excentricités moléculaires de ce type nous donne une idée des processus de recrutement de gènes, de leur adaptation à de nouvelles fonctions, et de la mise en place de machineries moléculaires complexes. / Thanks to new high throughput sequencing technologies and automatic annotation pipelines, proceeding from an eppendorf tube to a genbank file can be achieved in a single mouse click or so, for some species. Others, however, fiercely resist bioinformaticians with their confounding genomic complexity. Diplonemids are one of them. My thesis is centered on the discovery of new strategies for encrypting genetic information in eukaryotes, and the identification of molecular decoding processes. Diplonemids are a group of poorly studied marine protists. Unexpectedly, metagenomic studies have recently ranked this group as one of the most diverse in the oceans. Yet, their most distinctive feature is their multipartite mitochondrial genome with genes in pieces, and encryption by nucleotide deletions and substitutions. Genes are decrypted at the RNA level through three processes: (i) trans-splicing, (ii) polyuridylation at the junction of gene pieces and (iii) substitutions of A-to-I and C-to-T. Such a diverse arsenal of mitochondrial post-transcriptional processes is highly exceptional. Using a bioinformatics approach, I have reconstructed the mitochondrial transcriptome from RNA-seq libraries. We have identified six new genes including one that presents alternative trans-splicing isoforms. In total, there are 216 uridines added in 14 genes with up to 29 U insertions, and 114 positions edited by deamination (A-to-I or C-to-T) among seven genes (nad4, nad7, rns, y1, y2, y3, y5). In order to identify the machinery that processes mitochondrial RNAs, the nuclear genome has been sequenced. I have then assembled and annotated the genome. This machinery is probably unique and complex because no cis signal or trans actor typical for known splicing machineries have been found. I have identified promising protein candidates that are worth to be tested experimentally, notably RNA ligases, numerous members of the PPR family involved in plants RNA editing and deaminases. During my thesis, we have identified new types of post-transcriptional RNA processing in diplonemid mitochondria and identified new promising candidates for the machinery. A system capable of joining precisely or editing RNAs could find biotechnological applications. From an evolutionary perspective, the discovery of new molecular systems gives insight into the process of gene recruitment, adaptation to new functions and establishment of complex molecular machineries. Bio-informatique Génomique Édition d'ARN Épissage en trans Assemblage de génome Annotation Bioinformatics Genomics RNA editing Trans-splicing Genome assembly Genome annotation

Search results