• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 108
  • 63
  • 34
  • 23
  • 7
  • Tagged with
  • 254
  • 168
  • 137
  • 137
  • 125
  • 123
  • 119
  • 45
  • 37
  • 31
  • 28
  • 25
  • 25
  • 24
  • 24
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
221

Approches bio-informatiques appliquées aux technologies émergentes en génomique

Lemieux Perreault, Louis-Philippe 02 1900 (has links)
Les études génétiques, telles que les études de liaison ou d’association, ont permis d’acquérir une plus grande connaissance sur l’étiologie de plusieurs maladies affectant les populations humaines. Même si une dizaine de milliers d’études génétiques ont été réalisées sur des centaines de maladies ou autres traits, une grande partie de leur héritabilité reste inexpliquée. Depuis une dizaine d’années, plusieurs percées dans le domaine de la génomique ont été réalisées. Par exemple, l’utilisation des micropuces d’hybridation génomique comparative à haute densité a permis de démontrer l’existence à grande échelle des variations et des polymorphismes en nombre de copies. Ces derniers sont maintenant détectables à l’aide de micropuce d’ADN ou du séquençage à haut débit. De plus, des études récentes utilisant le séquençage à haut débit ont permis de démontrer que la majorité des variations présentes dans l’exome d’un individu étaient rares ou même propres à cet individu. Ceci a permis la conception d’une nouvelle micropuce d’ADN permettant de déterminer rapidement et à faible coût le génotype de plusieurs milliers de variations rares pour un grand ensemble d’individus à la fois. Dans ce contexte, l’objectif général de cette thèse vise le développement de nouvelles méthodologies et de nouveaux outils bio-informatiques de haute performance permettant la détection, à de hauts critères de qualité, des variations en nombre de copies et des variations nucléotidiques rares dans le cadre d’études génétiques. Ces avancées permettront, à long terme, d’expliquer une plus grande partie de l’héritabilité manquante des traits complexes, poussant ainsi l’avancement des connaissances sur l’étiologie de ces derniers. Un algorithme permettant le partitionnement des polymorphismes en nombre de copies a donc été conçu, rendant possible l’utilisation de ces variations structurales dans le cadre d’étude de liaison génétique sur données familiales. Ensuite, une étude exploratoire a permis de caractériser les différents problèmes associés aux études génétiques utilisant des variations en nombre de copies rares sur des individus non reliés. Cette étude a été réalisée avec la collaboration du Wellcome Trust Centre for Human Genetics de l’University of Oxford. Par la suite, une comparaison de la performance des algorithmes de génotypage lors de leur utilisation avec une nouvelle micropuce d’ADN contenant une majorité de marqueurs rares a été réalisée. Finalement, un outil bio-informatique permettant de filtrer de façon efficace et rapide des données génétiques a été implémenté. Cet outil permet de générer des données de meilleure qualité, avec une meilleure reproductibilité des résultats, tout en diminuant les chances d’obtenir une fausse association. / Genetic studies, such as linkage and association studies, have contributed greatly to a better understanding of the etiology of several diseases. Nonetheless, despite the tens of thousands of genetic studies performed to date, a large part of the heritability of diseases and traits remains unexplained. The last decade experienced unprecedented progress in genomics. For example, the use of microarrays for high-density comparative genomic hybridization has demonstrated the existence of large-scale copy number variations and polymorphisms. These are now detectable using DNA microarray or high-throughput sequencing. In addition, high-throughput sequencing has shown that the majority of variations in the exome are rare or unique to the individual. This has led to the design of a new type of DNA microarray that is enriched for rare variants that can be quickly and inexpensively genotyped in high throughput capacity. In this context, the general objective of this thesis is the development of methodological approaches and bioinformatics tools for the detection at the highest quality standards of copy number polymorphisms and rare single nucleotide variations. It is expected that by doing so, more of the missing heritability of complex traits can then be accounted for, contributing to the advancement of knowledge of the etiology of diseases. We have developed an algorithm for the partition of copy number polymorphisms, making it feasible to use these structural changes in genetic linkage studies with family data. We have also conducted an extensive study in collaboration with the Wellcome Trust Centre for Human Genetics of the University of Oxford to characterize rare copy number definition metrics and their impact on study results with unrelated individuals. We have conducted a thorough comparison of the performance of genotyping algorithms when used with a new DNA microarray composed of a majority of very rare genetic variants. Finally, we have developed a bioinformatics tool for the fast and efficient processing of genetic data to increase quality, reproducibility of results and to reduce spurious associations.
222

The genetics of red blood cell density, a biomarker of clinical severity in sickle cell disease

Ilboudo, Yann 12 1900 (has links)
No description available.
223

Bayesian codon models for detecting convergent molecular adaptation

Parto, Sahar 11 1900 (has links)
No description available.
224

Edit distance metrics for measuring dissimilarity between labeled gene trees

Briand, Samuel 08 1900 (has links)
Les arbres phylogénétiques sont des instruments de biologie évolutive offrant de formidables moyens d'étude pour la génomique comparative. Ils fournissent des moyens de représenter des mécanismes permettant de modéliser les relations de parenté entre les espèces ou les membres de familles de gènes en fonction de la diversité taxonomique, ainsi que des observations et des renseignements sur l'histoire évolutive, la structure et la variation des processus biologiques. Cependant, les méthodes traditionnelles d'inférence phylogénétique ont la réputation d'être sensibles aux erreurs. Il est donc indispensable de comparer les arbres phylogénétiques et de les analyser pour obtenir la meilleure interprétation des données biologiques qu'ils peuvent fournir. Nous commençons par aborder les travaux connexes existants pour déduire, comparer et analyser les arbres phylogénétiques, en évaluant leurs bonnes caractéristiques ainsi que leurs défauts, et discuter des pistes d'améliorations futures. La deuxième partie de cette thèse se concentre sur le développement de mesures efficaces et précises pour analyser et comparer des paires d'arbres génétiques avec des nœuds internes étiquetés. Nous montrons que notre extension de la métrique bien connue de Robinson-Foulds donne lieu à une bonne métrique pour la comparaison d'arbres génétiques étiquetés sous divers modèles évolutifs, et qui peuvent impliquer divers événements évolutifs. / Phylogenetic trees are instruments of evolutionary biology offering great insight for comparative genomics. They provide mechanisms to model the kinship relations between species or members of gene families as a function of taxonomic diversity. They also provide evidence and insights into the evolutionary history, structure, and variation of biological processes. However, traditional phylogenetic inference methods have the reputation to be prone to errors. Therefore, comparing and analysing phylogenetic trees is indispensable for obtaining the best interpretation of the biological information they can provide. We start by assessing existing related work to infer, compare, and analyse phylogenetic trees, evaluating their advantageous traits and flaws, and discussing avenues for future improvements. The second part of this thesis focuses on the development of efficient and accurate metrics to analyse and compare pairs of gene trees with labeled internal nodes. We show that our attempt in extending the popular Robinson-Foulds metric is useful for the preliminary analysis and comparison of labeled gene trees under various evolutionary models that may involve various evolutionary events.
225

An analysis of translation heterogeneity in ribosome profiling data

do Couto Bordignon, Pedro 12 1900 (has links)
Les protéines sont responsables de pratiquement toutes les fonctions performées au sein du corps cellulaire et de ses alentours. Le contrôle de l’expression génique détermine l’abondance, la localisation et le moment de la production de protéines dans la cellule. Il s’agit de l’un des processus centraux à la régulation de la physiologie et du fonctionnement cellulaire. La moindre perte de balance dans ce complexe système engendre des conséquences majeures sur l’intégrité cellulaire, menant au développement de plusieurs maladies parfois incurables. La traduction de l’ARN messager en produit protéique constitue la dernière étape de l’expression génique. Elle est régulée de plusieurs façons, intrinsèques et extrinsèques à la séquence. Il s’agit également du processus cellulaire le plus coûteux en termes d’énergie. Le profilage des ribosomes (Ribo-Seq) figure parmi les récentes et prometteuses technologies ayant permis une meilleure étude des mécanismes de régulation de la traduction. Ces résultats contiennent toutefois la présence de variabilité et de bruits de nature infondée. Ce travail présente la mise en place d’une stratégie permettant la dissociation de signaux d’origine biologique de ceux ayant une origine technique. Ceci est effectué au travers de la mise en place de profiles consensus de densité ribosomale extrait d’une analyse comparative de plusieurs expériences de Ribo-Seq chez la levure (Saccharomyces cerevisiae). Les signaux biologiques dérivés par les profils consensus correspondent avec les signatures de pauses ribosomales connues, telles que les scores de repliements de l’ARNm et la charge des acides aminés. Épatamment, notre stratégie a également permis l’identification de séquences différentiellement transcrites (DT). Ces dernières jouent un rôle sur la cinétique de la phase d’élongation de la traduction, elles comportent notamment une surreprésentation de codons associés aux modifications des ARNs de transfert (tRNAs). Elles se retrouvent d’ailleurs impliquées dans le maintien de l’homéostase cellulaire, ayant une présence marquée chez des gènes prenants part aux mécanismes de biosynthèse de la macromolécule ribosomale ainsi que chez les ARNms aux sublocalisations cellulaires précises, notamment chez les mitochondries et le réticulum endoplasmique (ER). En plus de démontrer les possibilités de découvertes offertes par la technique du Ribo-Seq, cette étude présente une évidence de la nature dynamique et hétérogène du processus de traduction chez la cellule eucaryote. Elle démontre également le rôle de l’information directement encodée dans la séquence dans l’optimisation générale de l’homéostasie cellulaire. / Proteins are responsible for virtually all functions performed within and in the surroundings of a cell. The control of gene expression, which determines the amount, localisation and timing of protein production in the cell, is the central processes in the regulation of cellular physiology and function. Any disturbance in this complex system can generate important consequences on cellular integrity, sometimes leading to incurable diseases. The translation of messenger RNA into a protein product is the last step of the gene expression mechanism. It can be regulated in manifold ways, both intrinsically and extrinsically to the transcript sequence. It is also the costliest cellular process in terms of energy. Ribosome profiling (Ribo-Seq) is one of the recent and promising technologies making it possible to better study the mechanisms of translation regulation. Its results have however been shown to display variability in reproducibility and to contain noise of uncharted sources. This work presents the implementation of a strategy for dissociating signals of biological origin from those of technical origin. This is performed by the computation of a consensus profile of ribosomal density derived from a comparative analysis of several Ribo-Seq experiments in yeast (Saccharomyces cerevisiae). The biological signals derived by the consensus profiles correspond with signatures of known ribosomal pauses, such as mRNA folding strength and amino acid charges. Amazingly, our strategy also enabled the identification of differentially transcribed (DT) sequences. The latter have shown an over-representation of codons associated with modifications of transfer RNAs (tRNAs). They are also involved in the control of cellular homeostasis, exhibiting a marked presence in genes involved in ribosome biosynthesis as well as in mRNAs with precise translation sub-localization, particularly in mitochondria and the endoplasmic reticulum (ER). In addition to demonstrating the possibilities of discovery offered by the Ribo-Seq technique, this study also presents evidence of the dynamic and heterogeneous nature of the translation process in the eukaryotic cell. It also showcases its diverse regulatory mechanisms and the role of information directly encoded in the sequence in the general optimization of cellular homeostasis.
226

Modélisation des biais mutationnels et rôle de la sélection sur l’usage des codons

Laurin-Lemay, Simon 10 1900 (has links)
L’acquisition de données génomiques ne cesse de croître, ainsi que l’appétit pour les interpréter. Mais déterminer les processus qui ont façonné l’évolution des séquences codantes (et leur importance relative) est un défi scientifique passant par le développement de modèles statistiques de l’évolution prenant en compte de plus en plus d’hétérogénéités au niveau des processus mutationnels et de sélection. Identifier la sélection est une tâche qui nécessite typiquement de détecter un écart entre deux modèles : un modèle nulle ne permettant pas de régime évolutif adaptatif et un modèle alternatif qui lui en permet. Lorsqu’un test entre ces deux modèles rejette le modèle nulle, on considère avoir détecter la présence d’évolution adaptative. La tâche est d’autant plus difficile que le signal est faible et confondu avec diverses hétérogénéités négligées par les modèles. La détection de la sélection sur l’usage des codons spécifiquement est controversée, particulièrement chez les Vertébrés. Plusieurs raisons peuvent expliquer cette controverse : (1) il y a un biais sociologique à voir la sélection comme moteur principal de l’évolution, à un tel point que les hétérogénéités relatives aux processus de mutation sont historiquement négligées ; (2) selon les principes de la génétique des populations, la petite taille efficace des populations des Vertébrés limite le pouvoir de la sélection sur les mutations synonymes conférant elles-mêmes un avantage minime ; (3) par contre, la sélection sur l’usage des codons pourrait être très localisée le long des séquences codantes, à des sites précis, relevant de contraintes de sélection relatives à des motifs utilisés par la machinerie d’épissage, par exemple. Les modèles phylogénétiques de type mutation-sélection sont les outils de prédilection pour aborder ces questions, puisqu’ils modélisent explicitement les processus mutationnels ainsi que les contraintes de sélection. Toutes les hétérogénéités négligées par les modèles mutation-sélection de Yang and Nielsen [2008] peuvent engendrer de faux positifs allant de 20% (préférence site-spécifique en acides aminés) à 100% (hypermutabilité des transitions en contexte CpG) [Laurin-Lemay et al., 2018b]. En particulier, l’hypermutabilité des transitions du contexte CpG peut à elle seule expliquer la sélection détectée par Yang and Nielsen [2008] sur l’usage des codons. Mais, modéliser des phénomènes qui prennent en compte des interdépendances dans les données (par exemple l’hypermutabilité du contexte CpG) augmente de beaucoup la complexité des fonctions de vraisemblance. D’autre part, aujourd’hui le niveau de sophistication des modèles fait en sorte que des vecteurs de paramètres de haute dimensionnalité sont nécessaires pour modéliser l’hétérogénéité des processus étudiés, dans notre cas de contraintes de sélection sur la protéine. Le calcul bayésien approché (Approximate Bayesian Computation ou ABC) permet de contourner le calcul de la vraisemblance. Cette approche diffère de l’échantillonnage par Monte Carlo par chaîne de Markov (MCMC) communément utilisé pour faire l’approximation de la distribution a posteriori. Nous avons exploré l’idée de combiner ces approches pour une problématique spécifique impliquant des paramètres de haute dimensionnalité et de nouveaux paramètres prenant en compte des dépendances entre sites. Dans certaines conditions, lorsque les paramètres de haute dimensionnalité sont faiblement corrélés aux nouveaux paramètres d’intérêt, il est possible d’inférer ces mêmes paramètres de haute dimensionnalité avec la méthode MCMC, et puis les paramètres d’intérêt au moyen de l’ABC. Cette nouvelle approche se nomme CABC [Laurin-Lemay et al., 2018a], pour calcul bayésien approché conditionnel (Conditional Approximate Bayesian Computation : CABC). Nous avons pu vérifier l’efficacité de la méthode CABC en étudiant un cas d’école, soit celui de l’hypermutabilité des transitions en contexte CpG chez les Eutheria [Laurin-Lemay et al., 2018a]. Nous trouvons que 100% des 137 gènes testés possèdent une hypermutabilité des transitions significative. Nous avons aussi montré que les modèles incorporant l’hypermutabilité des transitions en contexte CpG prédisent un usage des codons plus proche de celui des gènes étudiés. Ceci suggère qu’une partie importante de l’usage des codons peut être expliquée à elle seule par les processus mutationnels et non pas par la sélection. Finalement nous explorons plusieurs pistes de recherche suivant nos développements méthodologiques : l’application de la détection de l’hypermutabilité des transitions en contexte CpG à l’échelle des Vertébrés ; l’expansion du modèle pour reconnaître des contextes autres que seul le CpG (e.g., hypermutabilité des transitions et transversions en contexte CpG et TpA) ; ainsi que des perspectives méthodologiques d’amélioration de la performance du CABC. / The acquisition of genomic data continues to grow, as does the appetite to interpret them. But determining the processes that shaped the evolution of coding sequences (and their relative importance) is a scientific challenge that requires the development of statistical models of evolution that increasingly take into account heterogeneities in mutation and selection processes. Identifying selection is a task that typically requires comparing two models: a null model that does not allow for an adaptive evolutionary regime and an alternative model that allows it. When a test between these two models rejects the null, we consider to have detected the presence of adaptive evolution. The task is all the more difficult as the signal is weak and confounded with various heterogeneities neglected by the models. The detection of selection on codon usage is controversial, particularly in Vertebrates. There are several reasons for this controversy: (1) there is a sociological bias in seeing selection as the main driver of evolution, to such an extent that heterogeneities relating to mutation processes are historically neglected; (2) according to the principles of population genetics, the small effective size of vertebrate populations limits the power of selection over synonymous mutations conferring a minimal advantage; (3) On the other hand, selection on the use of codons could be very localized along the coding sequences, at specific sites, subject to selective constraints related to DNA patterns used by the splicing machinery, for example. Phylogenetic mutation-selection models are the preferred tools to address these issues, as they explicitly model mutation processes and selective constraints. All the heterogeneities neglected by the mutation-selection models of Yang and Nielsen [2008] can generate false positives, ranging from 20% (site-specific amino acid preference) to 100% (hypermutability of transitions in CpG context)[Laurin-Lemay et al., 2018b]. In particular, the hypermutability of transitions in the CpG context alone can explain the selection on codon usage detected by Yang and Nielsen [2008]. However, modelling phenomena that take into account data interdependencies (e.g., hypermutability of the CpG context) greatly increases the complexity of the likelihood function. On the other hand, today’s sophisticated models require high-dimensional parameter vectors to model the heterogeneity of the processes studied, in our case selective constraints on the protein. Approximate Bayesian Computation (ABC) is used to bypass the calculation of the likelihood function. This approach differs from the Markov Chain Monte Carlo (MCMC) sampling commonly used to approximate the posterior distribution. We explored the idea of combining these approaches for a specific problem involving high-dimensional parameters and new parameters taking into account dependencies between sites. Under certain conditions, when the high dimensionality parameters are weakly correlated to the new parameters of interest, it is possible to infer the high dimensionality parameters with the MCMC method, and then the parameters of interest using the ABC. This new approach is called Conditional Approximate Bayesian Computation (CABC) [Laurin-Lemay et al., 2018a]. We were able to verify the effectiveness of the CABC method in a case study, namely the hypermutability of transitions in the CpG context within Eutheria [Laurin-Lemay et al.,2018a]. We find that 100% of the 137 genes tested have significant hypermutability of transitions. We have also shown that models incorporating hypermutability of transitions in CpG contexts predict a codon usage closer to that of the genes studied. This suggests that a significant part of codon usage can be explained by mutational processes alone. Finally, we explore several avenues of research emanating from our methodological developments: the application of hypermutability detection of transitions in CpG contexts to the Vertebrate scale; the expansion of the model to recognize contexts other than only CpG (e.g., hypermutability of transitions and transversions in CpG and TpA context); and methodological perspectives to improve the performance of the CABC approach.
227

Cellular basis of flower and leaf primordium initiation in Arabidopsis thaliana : how to make an organ in three dimensions

Echevin, Eglantine Emilie Denise 10 1900 (has links)
Le développement d’un organisme multicellulaire requière la coordination de la croissance, détermination tissulaire et différenciation cellulaire. Cependant, alors que les bases de la génétique de la morphogenèse ont été rigoureusement étudiées, le processus permettant la conversion de l’activité génétique en des structures biologiques complexes est bien moins compris. Chez Arabidopsis thaliana, les feuilles et fleurs initiés à partir du Méristème Apical Primaire (MAP) ont une expression génétique casi similaire. Toutefois, leur forme est considérablement différente dès les premières étapes de leur développement. Une compréhension de ce paradoxe requière avant tout de précisément quantifier la croissance dans toutes les dimensions de ces organes. Dans cet article, je présente une méthode de quantification spatio-temporelle complète de la croissance et de la prolifération des feuilles et des fleurs chez A. thaliana. En analysant des séries d’images confocales, j’en ai conclu que la différence morphologique observée entre feuilles et fleurs émerge principalement d’une asymétrie de la distribution de la croissance entre leurs côtés abaxial et adaxial, tôt dans leur développement. Je montre que le tissue contribuant principalement au développement des primordia est la couche 2 (L2) chez les feuilles et la couche 3 (L3) chez les fleurs. Mes résultats préliminaires démontrent que les premiers signes de l’initiation d’organes est un changement de distribution de la croissance, et non de la prolifération. Dans le futur, en appliquant, par exemple, cette méthodologie à l’étude de gènes de développement, il sera possible de finalement réconcilier la morphogenèse et la génétique de l’initiation des plantes. / The development of a multicellular organism requires the proper coordination of growth, pattern determination and cell differentiation. Still, while the genetic basis of morphogenesis has been extensively studied, the process converting gene activity into intricate biological shapes is less understood. In Arabidopsis thaliana, flowers and leaves, both initiated from the shoot apical meristem (SAM), have a very similar genetic expression profile. Yet, their shape differs considerably from early developmental stages. A full comprehension of this paradox requires an accurate quantification of cellular growth in those organs. In this paper, I am presenting a methodology for the complete spatio-temporal quantitative analysis of growth and proliferation of initiating leaves and flowers in wild type Arabidopsis thaliana. By analyzing time series of leaf and flower confocal images, I conclude that the morphological differences observed between flowers and leaves mainly arises from asymmetrical distributions of growth between their adaxial and abaxial sides during their initiation. I show that the tissue that mainly contributes to the development of early primordium is the layer 2 (L2) in leaves, and the layer 3 (L3) in flowers. My preliminary results also demonstrate that the first signs of organ initiation are a change in growth distribution, not cell proliferation. In the future, by applying this methodology, for example, to study morphogen reporter lines, it could finally bridge the gap between the morphogenesis and the genetics of plant initiation.
228

Classification de transcrits d’ARN à partir de données brutes générées par le séquençage par nanopores

Atanasova, Kristina 12 1900 (has links)
Le rythme impressionnant auquel les technologies de séquençage progressent est alimenté par leur promesse de révolutionner les soins de santé et la recherche biomédicale. Le séquençage par nanopores est devenu une technologie attrayante pour résoudre des lacunes des technologies précédentes, mais aussi pour élargir nos connaissances sur le transcriptome en générant des lectures longues qui simplifient l’assemblage et la détection de grandes variations structurelles. Au cours du processus de séquençage, les nanopores mesurent les signaux de courant électrique représentant les bases (A, C, G, T) qui se déplacent à travers chaque nanopore. Tous les nanopores produisent simultanément des signaux qui peuvent être analysés en temps réel et traduits en bases par le processus d’appel de bases. Malgré la réduction du coût de séquençage et la portabilité des séquenceurs, le taux d’erreur de l’appel de base entrave leur mise en oeuvre dans la recherche biomédicale. Le but de ce mémoire est de classifier des séquences d’ARNm individuelles en différents groupes d’isoformes via l’élucidation de motifs communs dans leur signal brut. Nous proposons d’utiliser l’algorithme de déformation temporelle dynamique (DTW) pour l’alignement de séquences combiné à la technologie nanopore afin de contourner directement le processus d’appel de base. Nous avons exploré de nouvelles stratégies pour démontrer l’impact de différents segments du signal sur la classification des signaux. Nous avons effectué des analyses comparatives pour suggérer des paramètres qui augmentent la performance de classification et orientent les analyses futures sur les données brutes du séquençage par nanopores. / The impressive rate at which sequencing technologies are progressing is fueled by their promise to revolutionize healthcare and biomedical research. Nanopore sequencing has become an attractive technology to address shortcomings of previous technologies, but also to expand our knowledge of the transcriptome by generating long reads that simplify assembly and detection of large structural variations. During the sequencing process, the nanopores measure electrical current signals representing the bases (A, C, G, T) moving through each nanopore. All nanopores simultaneously produce signals that can be analyzed in real time and translated into bases by the base calling process. Despite the reduction in sequencing cost and the portability of sequencers, the base call error rate hampers their implementation in biomedical research. The aim of this project is to classify individual mRNA sequences into different groups of isoforms through the elucidation of common motifs in their raw signal. We propose to use the dynamic time warping (DTW) algorithm for sequence alignment combined with nanopore technology to directly bypass the basic calling process. We explored new strategies to demonstrate the impact of different signal segments on signal classification. We performed comparative analyzes to suggest parameters that increase classification performance and guide future analyzes on raw nanopore sequencing data.
229

Caractérisation de l'étiologie génétique de patients atteints de différentes maladies neuromusculaires par l’intégration de données omiques

Triassi, Valérie 12 1900 (has links)
Les progrès des technologies de séquençage ont joué un rôle important dans le diagnostic moléculaire des maladies rares, telles que les myopathies et les dystrophies musculaires. Cependant, plusieurs patients atteints de maladies neuromusculaires restent sans diagnostic. Ceci est dû à la grande hétérogénéité clinique et génétique ainsi qu'au caractère hautement polymorphique des gènes associés à ces troubles. L'interprétation des données génétiques est un grand défi et les tests génétiques aboutissent souvent à l'identification de variants de signification inconnue (VUSs). Plusieurs de ces variants peuvent perturber l'épissage normal de l'ARN ou affecter l'expression des gènes. À cet égard, nous proposons une approche bio-informatique. Notre objectif est de mettre en place un pipeline identifiant et caractérisant des variants d'intérêt dans un contexte pathologique. Afin de déterminer si les variants ont un impact fonctionnel, notre pipeline se concentre sur l'épissage alternatif ainsi que sur l'intégration des données génomiques et transcriptomiques. Nous émettons l'hypothèse qu'une partie des patients sans diagnostic pour leur maladie neuromusculaire s'explique par des variants introniques jouant un rôle régulateur ou affectant l'épissage et l'abondance de l'ARNm. Cette approche multi-omique permet de déterminer si les variants ont un impact fonctionnel. Pour ce faire, nous avons réalisé un séquençage de l'ARN et de l'ADN à partir de biopsies musculaires de quatre patients. Les données ont été alignées et annotées avec différents scores de pathogénicité. Les événements d'épissage sont analysés par SpliceAI et rMATS. L'analyse des gènes différentiellement exprimés a été réalisée par l'outil LPEseq. Les CNVs et les expansions de répétitions ont été analysés avec CNVkit et ExpansionHunter. Plusieurs scripts maison filtrent et intègrent les données ARN et ADN. Pour l'instant, un total de huit variants pathogéniques sont proposés pour nos patients, mais des investigations supplémentaires sont nécessaires. Les variants recherchés sont rares et nécessitent donc un pipeline cohérent et efficace. Ce projet apportera un bénéfice significatif pour les patients en leur permettant d'obtenir un diagnostic et ainsi d'avoir accès à un meilleur suivi clinique. / Advances in sequencing technologies have played an important role in the molecular diagnosis of rare diseases, such as myopathies and muscular dystrophies. However, several patients with these neuromuscular diseases remain undiagnosed. This is due to the great clinical and genetic heterogeneity as well as the highly polymorphic nature of the genes associated with myopathies and muscular dystrophies. The interpretation of genetic data is a great challenge and genetic testing often results in the identification of variants of uncertain significances (VUSs). Many of these variants can disrupt normal RNA splicing or affect gene expression. In this regard, we propose a bioinformatics approach. Our aim is to put in place a pipeline identifying and characterizing variants of interest in a pathological context. To determine if the variants have a functional impact, our pipeline focuses on alternative splicing as well as the integration of genomic and transcriptomic data. We hypothesize that a portion of patients without a diagnosis for their neuromuscular disorder is explained by intronic variants having a regulatory role or affecting mRNA splicing and abundance. This multi-omics approach will make it possible to determine whether the variants have a functional impact. To do so, we performed RNA and DNA sequencing using muscle biopsies from four patients. Data was aligned and annotated with different pathogenicity scores. Splicing events are analyzed by SpliceAI and rMATS. The analysis of the differentially expressed genes was carried out by the LPEseq tool. CNVs and repeat expansion were analyzed with CNVkit and ExpansionHunter. Several in-house scripts filter and integrate RNA and DNA data. For now, a total of eight pathogenic variants are proposed for our patients, but further investigations are needed. The variants sought are rare and therefore require a coherent and efficient pipeline to facilitate their characterization. This project will have a significant benefit for patients by allowing them to obtain a diagnosis and thus have access to better clinical follow-up.
230

Dérégulations épigénétiques suivant une perte temporaire de l’enzyme DNMT1

Lemieux, Anthony 12 1900 (has links)
Au cours du développement précoce de l'embryon, une importante vague de reprogrammation épigénétique efface et rétablit les profils de méthylation d’ADN (metADN) à travers le génome. Cependant, des régions spécifiques telles que les gènes à empreinte doivent échapper à cette vague de reprogrammation et maintenir leurs profils de metADN précis par l’activité constante de l’enzyme DNMT1 (ADN méthyltransférase 1) pour assurer le bon développement embryonnaire. En utilisant un modèle de cellules souches embryonnaires (mES) de souris avec une répression inductible de Dnmt1 (Dnmt1tet/tet), nous avons précédemment montré que la perte temporaire de Dnmt1 déclenche la perte permanente des profils de metADN sur les régions à empreinte et régions similaires, ainsi que sur d'autres régions du génome. Nous ne comprenons toujours pas pourquoi certaines séquences génomiques sont incapables de rétablir leurs profils de metADN normaux après la ré-expression de Dnmt1, et comment d'autres marques épigénétiques (e.g. les modifications des histones) sont altérées. Notre hypothèse est qu’un réarrangement erroné des marques d’histones aux régions promotrices, suivant une perte temporaire du maintien de la méthylation d’ADN par DNMT1, empêchera l’expression normale dans les cellules souches embryonnaires de souris. Pour ce faire, nous avons collecté des cellules mES Dnmt1tet/tet avant l'inactivation de Dnmt1, après l'inactivation de Dnmt1, puis après la réactivation complète de l'expression de Dnmt1. Nous avons ensuite utilisé la technique ChIP-Seq pour les marques d'histones (H3K4me3, H3K27me3, H3K27ac, H3K9me3, H3K4me1), celle de RRBS pour la méthylation de l'ADN et la technique de RNA-Seq pour l'expression des gènes. En définissant une liste de 18 166 promoteurs uniques, nous les avons classés en quatre catégories (Actif, Bivalent, Déplété et Réprimé). Nous montrons que l'inactivation de Dnmt1 mène à une dérégulation drastique des marques d'histones à travers les types de promoteurs. Cependant, lors de la réactivation de Dnmt1, la plupart de ces défauts ont été corrigés. Pourtant, dans l’ensemble des catégories, nous observons des promoteurs avec des dysrégulations persistantes des marques d'histones ainsi qu'un nombre significatif de gènes avec une expression différentielle. Dans l'ensemble, nos résultats montrent qu'une absence temporaire de DNMT1 a un impact plus important sur la conservation des profils des marques d'histones et l'expression des gènes que sur le maintien des profils de metADN sur les régions promotrices, dans les cellules souches embryonnaires de souris. Cela suggère que l'absence temporaire de maintien de la méthylation d’ADN déclenche une série d'événements qui conduisent à des dérégulations permanentes de marques d'histones aux promoteurs, lesquelles ne sont pas directement associés aux altérations sous-jacentes de la méthylation d’ADN dans les régions promotrices. / During early embryo development, a major epigenetic reprogramming wave erases and re-establishes DNA methylation (DNAmet) profiles across the genome. However, specific regions such as imprinting loci must escape this reprogramming wave and maintain their precise DNAmet profiles by constant DNMT1 (DNA methyltransferase 1) activity to ensure the proper development. Using a mouse embryonic stem (mES) cell model with inducible Dnmt1 repression (Dnmt1tet/tet), we previously showed that the temporary loss of Dnmt1 triggers the permanent loss of DNAmet profiles on imprinted and imprinted-like regions, as well as on other regions across the genome. We still do not understand why particular genomic sequences are unable to re-establish their normal DNAmet profiles following Dnmt1 re-expression, and how other epigenetic marks (e.g., histone modifications) are altered. Our hypothesis is that an erroneous rearrangement of histone marks on promoter regions following a temporary lack of DNAmet maintenance by DNMT1 will prevent proper gene expression in mouse embryonic stem cells. To test this, we collected mESDnmt1tet/tet cells prior to Dnmt1 inactivation, after Dnmt1 inactivation, and following complete reactivation of Dnmt1 expression. We then performed ChIP-Seq for histone marks (H3K4me3, H3K27me3, H3K27ac, H3K9me3, H3K4me1), RRBS for DNA methylation and RNA-Seq for gene expression. By defining a list of 18 166 unique promoters we categorized them in four categories (Active, Bivalent, Depleted and Repressed). We show that inactivation of Dnmt1 lead to drastic dysregulation of histone marks across types of promoters. However, upon reactivation of Dnmt1, most of these defects were rescued. Still, across categories, we observe promoters with persistent histone mark dysregulations as well as a significant number of associated genes with differential expression. Overall, our results show that a temporary lack of DNMT1 has a greater impact on the conservation of histone mark profiles and gene expression than it has on the maintenance of DNAmet profiles on promoter regions in mouse embryonic stem cells. This suggests that the temporary lack of methylation maintenance triggers a series of events that leads to the permanent dysregulation of histone marks in promoter regions, which are not directly associated with underlying DNA methylation alterations in the promoter regions.

Page generated in 0.0555 seconds