• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 13
  • 7
  • 1
  • Tagged with
  • 18
  • 18
  • 14
  • 13
  • 4
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Intégration d'annotations fonctionnelles dans les tests d'agrégation de variants rares sous vraisemblance rétrospective dans le cadre de devis familiaux

Mangnier, Loïc 09 November 2022 (has links)
Depuis ces vingt dernières années et la démocratisation des technologies de séquençage haut débit de l'ADN, l'accessibilité des données génomiques a permis le développement de nouveaux outils analytiques, notamment dans l'étude des maladies complexes. Au-delà de la simple perspective descriptive, il y a un intérêt croissant des chercheurs à étudier les phénomènes biologiques menant à l'émergence ou au développement de maladies chez l'humain. En effet, la vaste majorité des troubles complexes sont la résultante de la combinaison de variations rares et communes situées dans des régions non codantes du génome, rendant l'interprétation des mécanismes biologiques en jeu difficile. Ce dernier point a été l'occasion pour les chercheurs de caractériser, à travers de nouvelles technologies, certaines régions du génome selon leur profil épigénétique et d'intégrer cette information dans de nouveaux outils statistiques dans une optique de détection de variants impliqués dans les maladies. Premièrement, à l'heure actuelle les modèles existant pour caractériser les régions non codantes et les lier à leur(s) gènes cibles n'intègrent pas la notion de réseaux d'interaction. Ainsi il devient critique de proposer un modèle computationnel, valide biologiquement, capable de capturer les contacts entre gènes et éléments de régulation à travers des réseaux, afin de mettre en lumière les mécanismes biologiques impliqués dans les maladies complexes. D'un autre côté, bien que des modèles permettant de tenir compte de la rareté des variants et de leur implication fonctionnelle dans les maladies ont déjà été proposés, ces derniers ne se limitent qu'aux devis cas-témoins d'individus non apparentés, pouvant nécessiter des tailles d'échantillon souvent élevées pour détecter des associations. Il y a alors un réel besoin méthodologique d'étendre ces approches aux études familiales, lorsque ces dernières sont plus performantes pour identifier des variants rares impliqués dans les maladies. Ainsi, dans cette perspective, nous proposons un nouveau modèle de réseaux intégrant l'information épigénétique au travers des contacts physiques entre gènes et enhancers, appelé pôles de régulation cis. Aussi, parce que cette information peut être exploiter afin de mettre en lumière de nouvelles régions associées avec des maladies, nous proposons un nouveau test d'association de variants rares, appelé RetroFun-RVS, exploitant la structure familiale et permettant l'intégration des annotations fonctionnelles sous forme de réseaux. Enfin, nous avons démontré que notre modèle de pôles de régulation cis en plus d'être biologiquement valide est capable de mieux cerner les mécanismes épigénétiques impliqués dans l'étiologie de maladies complexes. Par ailleurs, RetroFun-RVS en incorporant les pôles de régulation cis, en tant qu'annotations fonctionnelles et l'information familiale, a été démontré une approche puissante pour détecter de nouveaux variants causaux. Dans une perspective mécanistique, proposer des modèles unifiant approches familiales et information fonctionnelle ouvre alors de nouvelles voies dans l'étude des maladies complexes, notamment en permettant de cibler plus précisément les phénomènes de régulation impliqués. / Over the past few years, with the development of whole-genome sequencing technologies, improvements have been made in the understanding of complex diseases. Indeed, most phenotypes are characterized by a combination of common and rare variants, mainly located within noncoding regions, making the underlying biological mechanisms difficult to interpret. The increased availability of genomics data has provided opportunities for researchers to characterize noncoding regions and assess their roles in diseases, by incorporating this information in analytical tools to detect new causal variants involved in diseases. On the one side, to date, methods to detect enhancers and link to their target genes do not integrate complex networks of interactions. Indeed, no network-based model integrating physical contacts between genes and enhancers has been proposed. Thus, it remains crucial to provide a computational model which is biologically relevant and able to capture complex regulatory interactions, in order to gain insights in epigenetics mechanisms involved in the etiology of complex diseases. On the other side, although rare-variant association tests integrating functional information have already been proposed, models currently available suffer from two major limitations. Firstly, they are restricted to case-control designs of unrelated people, where tens or hundreds thousand of individuals are often required to reach sufficient power, limiting their applicability in practice. Secondly, these approaches have been mainly evaluated using continuous scores. Indeed, no functional annotations corresponding to regions with regulatory impacts have been assessed. To overcome these limitations, there is an important need to provide family-based rare-variant association tests, incorporating functional annotations through active noncoding regions. Hence, in this thesis, we are firstly proposing Cis-Regulatory Hubs (CRHs), a new 3D-based model integrating contacts between genes and enhancers within networks of complex interactions. Also, we argue that this information can be used to highlight new risk variants involved in complex diseases. Thus, we have developed a new family-based rare variant association test, called RetroFun-RVS, integrating 3D-based functional annotations, such as CRHs. We have demonstrated that CRHs represent biological relevant structures to gain insights into complex disease etiology, such as schizophrenia. Moreover, RetroFun-RVS incorporating CRHs as functional annotations has been shown to be powerful in detecting new risk variants. We argue that these aspects are crucial to highlighting epigenetics mechanisms involved in complex traits. Finally, by proposing an unified framework combining both family-based studies and functional annotations, progress is made in the understanding of the etiology of complex diseases.
2

Intégration d'annotations fonctionnelles dans les tests d'agrégation de variants rares sous vraisemblance rétrospective dans le cadre de devis familiaux

Mangnier, Loïc 09 November 2022 (has links)
Depuis ces vingt dernières années et la démocratisation des technologies de séquençage haut débit de l'ADN, l'accessibilité des données génomiques a permis le développement de nouveaux outils analytiques, notamment dans l'étude des maladies complexes. Au-delà de la simple perspective descriptive, il y a un intérêt croissant des chercheurs à étudier les phénomènes biologiques menant à l'émergence ou au développement de maladies chez l'humain. En effet, la vaste majorité des troubles complexes sont la résultante de la combinaison de variations rares et communes situées dans des régions non codantes du génome, rendant l'interprétation des mécanismes biologiques en jeu difficile. Ce dernier point a été l'occasion pour les chercheurs de caractériser, à travers de nouvelles technologies, certaines régions du génome selon leur profil épigénétique et d'intégrer cette information dans de nouveaux outils statistiques dans une optique de détection de variants impliqués dans les maladies. Premièrement, à l'heure actuelle les modèles existant pour caractériser les régions non codantes et les lier à leur(s) gènes cibles n'intègrent pas la notion de réseaux d'interaction. Ainsi il devient critique de proposer un modèle computationnel, valide biologiquement, capable de capturer les contacts entre gènes et éléments de régulation à travers des réseaux, afin de mettre en lumière les mécanismes biologiques impliqués dans les maladies complexes. D'un autre côté, bien que des modèles permettant de tenir compte de la rareté des variants et de leur implication fonctionnelle dans les maladies ont déjà été proposés, ces derniers ne se limitent qu'aux devis cas-témoins d'individus non apparentés, pouvant nécessiter des tailles d'échantillon souvent élevées pour détecter des associations. Il y a alors un réel besoin méthodologique d'étendre ces approches aux études familiales, lorsque ces dernières sont plus performantes pour identifier des variants rares impliqués dans les maladies. Ainsi, dans cette perspective, nous proposons un nouveau modèle de réseaux intégrant l'information épigénétique au travers des contacts physiques entre gènes et enhancers, appelé pôles de régulation cis. Aussi, parce que cette information peut être exploiter afin de mettre en lumière de nouvelles régions associées avec des maladies, nous proposons un nouveau test d'association de variants rares, appelé RetroFun-RVS, exploitant la structure familiale et permettant l'intégration des annotations fonctionnelles sous forme de réseaux. Enfin, nous avons démontré que notre modèle de pôles de régulation cis en plus d'être biologiquement valide est capable de mieux cerner les mécanismes épigénétiques impliqués dans l'étiologie de maladies complexes. Par ailleurs, RetroFun-RVS en incorporant les pôles de régulation cis, en tant qu'annotations fonctionnelles et l'information familiale, a été démontré une approche puissante pour détecter de nouveaux variants causaux. Dans une perspective mécanistique, proposer des modèles unifiant approches familiales et information fonctionnelle ouvre alors de nouvelles voies dans l'étude des maladies complexes, notamment en permettant de cibler plus précisément les phénomènes de régulation impliqués. / Over the past few years, with the development of whole-genome sequencing technologies, improvements have been made in the understanding of complex diseases. Indeed, most phenotypes are characterized by a combination of common and rare variants, mainly located within noncoding regions, making the underlying biological mechanisms difficult to interpret. The increased availability of genomics data has provided opportunities for researchers to characterize noncoding regions and assess their roles in diseases, by incorporating this information in analytical tools to detect new causal variants involved in diseases. On the one side, to date, methods to detect enhancers and link to their target genes do not integrate complex networks of interactions. Indeed, no network-based model integrating physical contacts between genes and enhancers has been proposed. Thus, it remains crucial to provide a computational model which is biologically relevant and able to capture complex regulatory interactions, in order to gain insights in epigenetics mechanisms involved in the etiology of complex diseases. On the other side, although rare-variant association tests integrating functional information have already been proposed, models currently available suffer from two major limitations. Firstly, they are restricted to case-control designs of unrelated people, where tens or hundreds thousand of individuals are often required to reach sufficient power, limiting their applicability in practice. Secondly, these approaches have been mainly evaluated using continuous scores. Indeed, no functional annotations corresponding to regions with regulatory impacts have been assessed. To overcome these limitations, there is an important need to provide family-based rare-variant association tests, incorporating functional annotations through active noncoding regions. Hence, in this thesis, we are firstly proposing Cis-Regulatory Hubs (CRHs), a new 3D-based model integrating contacts between genes and enhancers within networks of complex interactions. Also, we argue that this information can be used to highlight new risk variants involved in complex diseases. Thus, we have developed a new family-based rare variant association test, called RetroFun-RVS, integrating 3D-based functional annotations, such as CRHs. We have demonstrated that CRHs represent biological relevant structures to gain insights into complex disease etiology, such as schizophrenia. Moreover, RetroFun-RVS incorporating CRHs as functional annotations has been shown to be powerful in detecting new risk variants. We argue that these aspects are crucial to highlighting epigenetics mechanisms involved in complex traits. Finally, by proposing an unified framework combining both family-based studies and functional annotations, progress is made in the understanding of the etiology of complex diseases.
3

Evaluating health policy and legal responses : how to reduce barriers and improve access to orphan drugs for rare diseases in Canada / Évaluation des politiques et des mesures juridiques en santé : comment en arriver à réduire les obstacles afin d’améliorer l’accessibilité aux médicaments orphelins pour les maladies rares au Canada

Blais, Catherine-Marie January 2016 (has links)
Abstract : Rare diseases are debilitating conditions often leading to severe clinical manifestations for affected patients. Orphan drugs have been developed to treat these rare diseases affecting a small number of individuals. Incentives in the legal framework aimed to recoup the research and development cost of orphan drugs for pharmaceutical companies have been implemented in the United States and the European Union. At the present time, Canada is still lacking a legal and policy framework for orphan drugs. Several problems at the federal and provincial levels remain: lack of research funds for rare diseases, discrepancies on orphan drug policies between provinces, difficulties to access and reimburse these high price drugs. Recommendations and measures are proposed, such as a pan-Canadian (national) scientific committee to establish evidence-based guidelines for patients to access orphan drugs uniformly in all provinces with a disease specific registry, a formal agreement for a centralized Canadian public funding reimbursement procedure, and increasing the role of “guardian” for prices by the Patented Medicines Review Board in Canada. These recommendations and measures will be beneficial for the implementation of a policy framework for orphan drugs in Canada. / Résumé : Les maladies rares sont des maladies sérieuses pouvant causer des manifestations cliniques sévères chez les patients atteints. Les médicaments orphelins ont été développés pour le traitement de ces maladies rares qui touchent un petit nombre d’individus. Un cadre légal permettant des incitatifs pour les compagnies pharmaceutiques aux États-Unis et au niveau de l’Union Européenne a favorisé la recherche et le développement desdits médicaments. Présentement, il n’existe pas de cadre juridique et de politiques spécifiques au Canada entourant les médicaments orphelins. Ceci a mené à plusieurs problèmes tant au niveau fédéral que provincial dont: un manque de support financier consacré à la recherche pour les maladies rares, des disparités entre les provinces concernant les politiques pour les médicaments orphelins, des difficultés d’accès et de remboursement desdits médicaments dont les coûts sont élevés. Des recommandations et mesures sont proposées, telles l’implantation d’un comité scientifique pancanadien (national) afin d’établir des lignes directrices fondées sur des données probantes pour faciliter un accès uniforme aux médicaments orphelins pour les patients, y compris un registre spécifique élaboré pour chaque maladie, établir une entente formelle centralisée pour tout le Canada pour un financement public de remboursement des médicaments orphelins, augmenter le rôle de « gardien » des prix par le Conseil d’examen du prix des médicaments brevetés au Canada. Ces recommandations et mesures serviront à l’implantation d’un cadre de politiques pour les médicaments orphelins au Canada.
4

Analyses génétiques et génomiques de maladies neurologiques chez le chien comme modèle de maladies rares humaines / Genetic and genomic analyses of neurological diseases in dogs as a model of rare human diseases

Correard, Solenne 05 October 2018 (has links)
L’identification des mutations génétiques impliquées dans les maladies rares est un prérequis pour mieux les comprendre, les traiter et accompagner les patients. Pour se faire, des modèles animaux présentant des maladies spontanées homologues aux maladies humaines sont très prometteurs. Le chien développe spontanément des maladies génétiques, rares chez l’Homme, mais fréquentes dans certaines races de chiens, ce qui simplifie les analyses génétiques. Ma thèse a porté sur deux maladies neurologiques : l’épilepsie et la neuropathie. Pour l’épilepsie, l’objectif était d’identifier des variants génétiques à partir de données de génotypage et de séquençage de génomes complets de deux races canines prédisposées. Un locus lié à la maladie a été identifié dans une race et des variants ponctuels et structuraux candidats ont été identifiés dans les deux races et sont en cours de validation par séquençage ciblé. Pour la neuropathie, l’équipe avait identifié une mutation en amont du gène GDNF, responsable d’une neuropathie sensitive chez des chiens de chasse. J’ai participé à la validation fonctionnelle de cette mutation. De plus, GDNF étant un excellent gène candidat pour les neuropathies humaines, j’ai séquencé ce gène chez 111 patients et extrait les variants de GDNF d’une base de données d’exomes et de génomes de plus de 600 patients. J’ai ainsi identifié 21 variants rares ou inconnus et les ai priorisé selon leurs impacts prédits in silico. Ces deux projets, alliant analyses génétiques, génomiques et fonctionnelles, chez l’homme et le chien, montrent le potentiel du chien pour l’identification de gènes candidats dans des maladies rares et/ou complexes chez l’Homme. / The identification of genetic mutations involved in rare diseases is a prerequisite for a better understanding, therapies and care to patients. To this aim, animal models declaring spontaneous diseases, homologous to human diseases are very promising. Dogs spontaneously develop genetic diseases, rare in humans, but frequent in some dog breeds, which simplifies the genetic analyzes. My thesis focused on two neurological diseases: epilepsy and neuropathy. For epilepsy, the goal was to identify genetic variants from genotyping data and sequencing of whole genome of dogs from two predisposed breeds. A disease-related locus has been identified in one breed and candidate point mutations and structural variants were identified in the two breeds and are being validated by targeted sequencing. For neuropathy, the team previously identified a mutation upstream of the GDNF gene, responsible for sensory neuropathy in hunting dogs. I participated to the functional validation of this mutation. In addition, GDNF being an excellent candidate gene for human neuropathies, I sequenced this gene in 111 patients and extracted GDNF variants from a database of exomes and genomes from more than 600 patients. I identified 21 rare or unknown variants and prioritized them according to their in silico predicted impacts. These two projects, combining genetics, genomics and functional analyses, in humans and dogs, show the dog's potential for identifying candidate genes in rare and / or complex diseases in humans.
5

Conception et développement d’un système d’aide au diagnostic clinique et génétique des rétinopathies pigmentaires / Design and development of a support system for clinical diagnosis and genetic retinitis pigmentosa

Hebrard, Maxime 20 December 2012 (has links)
Le diagnostic des rétinopathies pigmentaires pose différents problèmes, au niveau clinique comme au niveau moléculaire. En premier lieu, il s'agit de maladies rares, la faible prévalence de chaque pathologie à l'échelle de la population mondiale rend difficile leur étude. En second lieu, la caractérisation phénotypique de ces maladies est délicate car les symptômes qui en découlent s'avèrent très similaires. De manière liée, l'œil et le processus de la vision s'avèrent complexes et impliquent les produits d'expression de nombreux gènes. Ainsi, bien que les rétinopathies soient majoritairement monogénique et respectent le modèle d'hérédité mendélienne, les causes génétiques des maladies sont variées. Sur la base de ce double constat, nous proposons deux approches méthodologiques complémentaires menant à une meilleure compréhension de ce groupe de pathologies. Une première approche a pour finalité l'acquisition du jeu exhaustif des gènes impliqués. Les travaux portent sur l'exploitation des puces de génotypage. Nous effectuons une étude de liaison génétique entre les variations ponctuelles et les pathologies. Une seconde approche porte sur la représentation des connaissances associées aux phénotypes cliniques. Un composant ontologique est construit afin d'expliciter les savoirs nécessaires au diagnostic. Les données collectées sur le long terme par les experts sont étiquetées au travers de termes organisés au sein d'un thésaurus dédié. Les profils cliniques des patients et des maladies sont manipulés sous forme de collections de caractéristiques et comparés au moyen d'une mesure de similarité adaptée. L'objectif est alors de proposer un système d'aide au diagnostic. / Diagnosis of retinitis pigmentosa could be difficult regarding both to clinics or molecular issues. Firstly, there are rare diseases, so the prevalence of each pathology in the world population is very low. Secondly, the symptoms of diseases are very similar, so their phenotypic characterization is hard. Moreover, the eye and the visual process are complex and numerous genes' products are implicated. Although retinopathies are mainly monogenic and mendelian inherited diseases, the polymorphisms involved in these diseases are very diverse.These both observations lead us to develop two complementary methodological approaches in a view to better understand the retinopathies.The first approach aims to identify all the genes involved in the diseases using genotyping chips. For this purpose, we studied genetic linkage between single nucleotide variations and pathologies. The second approach leads to the representation of clinical knowledge. An ontological compound was built to make explicit the knowledge involved in the process of diagnosis. The data previously collected by experts were labeled by terms that were organized in a specific thesaurus. The clinic profiles of the patients and diseases were handled as features collections and were compared by similarity calculations. The goal of this work is to build a knowledge-based system for diagnosis.
6

Méthodes d'aide à la décision thérapeutique dans les cas des maladies rares : intérêt des méthodes bayésiennes et application à la maladie de Horton / Methods to support clinical decision making in rare diseases : interest of Bayesian methods and application to Horton's disease

Hajj, Paméla El 29 September 2017 (has links)
Les maladies rares sont celles qui touchent un nombre restreint de personnes. Par conséquent, des problèmes spécifiques sont dus par cette rareté.Pour cette raison nous avons systématiquement recherché dans la littérature les publications concernant les caractéristiques des différentes méthodes mathématiques qui ont été utilisées pour l'étude des maladies rares. L'objectif est d'identifier des approches novatrices pour la recherche qui ont été, ou peuvent être, utilisées afin de surmonter les difficultés méthodologiques inhérentes à l'étude des maladies rares.Les méthodes bayésiennes sont recommandées par plusieurs auteurs et dans le cas de ces méthodes il faut introduire une loi informative a priori sur l'effet inconnu du traitement.La détermination de la loi a priori dans le modèle bayésien est difficile. Nous avons travaillé sur les méthodes qui permettent de déterminer de la loi a priori en incluant la possibilité de considérer des informations provenant des études historiques et/ou des données provenant d'autres études "voisines".D'une part, on décrit un modèle bayésien qui a pour but de vérifier l'hypothèse de non-infériorité de l'essai qui repose sur l'hypothèse que le méthotrexate est plus efficace que le corticostéroïde seul.D'autre part, notre travail de thèse se repose sur la méthode epsilon- contamination, qui se base sur le principe de contaminer une loi a priori pas entièrement satisfaisante par une série de lois provenant des informations d'autres études ayant même pathologie de maladie, même traitement ou même population.Enfin, toutes les informations a priori peuvent être résumées par la distribution a priori déterminer à partir des opinions d'experts, leur avis sont recueillis lors d'une réunion où ils ont répondu à un questionnaire qui montre leurs a priori sur les paramètres du modèle bayésien. / In recent years, scientists have difficulties to study rare diseases by conventional methods, because the sample size needed in such studies to meet a conventional frequentist power is not adapted to the number of available patients. After systemically searching in literature and characterizing different methods used in the contest of rare diseases, we remarked that most of the proposed methods are deterministic and are globally unsatisfactory because it is difficult to correct the insufficient statistical power.More attention has been placed on Bayesian models which through a prior distribution combined with a current study enable to draw decisionsfrom a posterior distribution. Determination of the prior distribution in a Bayesian model is challenging, we will describe the process of determining the prior including the possibility of considering information from some historical controlled trials and/or data coming from other studies sufficiently close to the subject of interest.First, we describe a Bayesian model that aims to test the hypothesis of the non-inferiority trial based on the hypothesis that methotrexate is more effective than corticosteroids alone.On the other hand, our work rests on the use of the epsilon-contamination method, which is based on contaminating an a priori not entirely satisfactory by a series of distributions drawn from information on other studies sharing close conditions,treatments or even populations. Contamination is a way to include the proximity of information provided bythese studies.
7

Apport du séquençage haut débit dans l'amélioration de la prise en charge des maladies monogéniques

Lacoste Deixonne, Caroline 12 December 2016 (has links)
La diffusion du séquençage haut débit (ou NGS pour Next Generation Sequencing) représente un tel changement d’échelle par rapport aux méthodes classiques de séquençage que les indications et l’organisation du diagnostic moléculaire s’en trouvent profondément modifiées. Le NGS permet à la fois de raccourcir le temps d’analyse et de rendu de résultat et d'élargir considérablement le nombre de gènes testés. Il promet donc d’augmenter la proportion de diagnostics posés et de faciliter l'identification de nouveaux variants et de nouveaux gènes impliqués en pathologie. Cependant dans tous les cas, il génère une quantité de données importante, données qui doivent être analysées et interprétées à l’aide d’outils bioinformatiques spécifiques.Dans la première partie de ce travail, les stratégies existantes ainsi que les difficultés et les enjeux du séquençage haut débit pour le diagnostic moléculaire des maladies génétiques sont discutés. Dans la deuxième partie, la mise en place et la validation technique de cette approche diagnostique sont décrites au sein du laboratoire de Génétique Moléculaire de la Timone à Marseille et illustrées par trois exemples concrets de diagnostics moléculaires posés grâce à la technique de séquençage à haut débit. Dans le domaine spécifique des maladies rares, ces nouvelles technologies sont porteuses d’un réel espoir pour les patients atteints de maladie génétique, permettant d'améliorer globalement leur prise en charge et d'accélérer les progrès dans le domaine de la recherche. / The diffusion of Next Generation Sequencing (NGS) technologies induces an important change that modifies molecular diagnostics indications and prompts laboratories to re-think their diagnostic strategies, up-to-now based on Sanger sequencing routine. Several high throughput approaches are available from the sequencing of a gene panel, to a whole exome, or even a whole genome. In all cases, a tremendous amount of data are generated, that have to be filtered, interpreted and analyzed by the use of powerful bioinformatics tools.In part 1, existing strategies and the difficulties and challenges of high-throughput sequencing for molecular diagnosis in genetic diseases are discussed. In part 2, the set up and the technical validation of this diagnostic approach in the Molecular Genetics’ Laboratory of the Timone Hospital in Marseille is presented and illustrated by 3 examples of complex diagnostics solved thanks to NGS. NGS promises to shorten significantly the time of analysis and results reporting, and to expand the number of tested genes. It also promises to increase the proportion of positive diagnoses. Finally, the NGS can identify new variants and new genes involved in human pathology, thus will globally improve patient clinical care.
8

Interopérabilité des données médicales dans le domaine des maladies rares dans un objectif de santé publique / Interoperability of medical data for the rare diseases field in a public health objective

Maaroufi, Meriem 07 November 2016 (has links)
La santé se digitalise et de multiples projets d’e-santé se développent. Dans le contexte des maladies rares (MR), un champ qui est devenu parmi les priorités de la stratégie de santé publique en France, l’e-santé pourrait constituer une solution pour améliorer les connaissances sur l’épidémiologie des MR. La Banque Nationale de Données Maladies Rares (BNDMR) propose de centraliser la conduite de ces études épidémiologiques pour toutes les MR et tous les patients, atteints de ces maladies, suivis dans le système de soin français. La BNDMR doit se développer au sein d’un paysage numérique dense et hétérogène. Développer l’interopérabilité de la BNDMR constitue l’objectif des travaux de cette thèse. Comment identifier les patients, incluant les fœtus ? Comment fédérer les identités des patients? Comment chainer des données pour permettre la conduite des études ? En réponse à ces questions, nous proposons une méthode universelle d’identification des patients qui respecte les contraintes de protection des données de santé. Quelles données recueillir dans la BNDMR ? Comment améliorer l’interopérabilité entre ces données et celles issues du large éventail des systèmes existants ? En réponse à ces questions, nous proposons de standardiser le recueil d’un set minimal de données pour toutes les MR. L’implémentation de standards internationaux assure un premier pas vers l’interopérabilité. Nous proposons aussi d’aller à la découverte de correspondances. Minimiser l’intervention humaine en adoptant des techniques d’alignement automatisé et rendre fiables et exploitables les résultats de ces alignements ont constitué les principales motivations de notre proposition. / The digitalization of healthcare is on and multiple e-health projects are unceasingly coming up. In the rare diseases context, a field that has become a public health policy priority in France, e-health could be a solution to improve rare diseases epidemiology and to propose a better care for patients. The national data bank for rare diseases (BNDMR) offers the centralization of these epidemiological studies conduction for all rare diseases and all affected patients followed in the French healthcare system. The BNDMR must grow in a dense and heterogeneous digital landscape. Developing the BNDMR interoperability is the objective of this thesis’ work. How to identify patients, including fetuses? How to federate patients’ identities to avoid duplicates creation? How to link patients’ data to allow studies’ conduction? In response to these questions, we propose a universal method for patients’ identification that meets the requirements of health data protection. Which data should be collected in the national data bank? How to improve and facilitate the development of interoperability between these data and those from the wide range of the existing systems? In response to these questions, we first propose the collection of a standardized minimum data set for all rare diseases. The implementation of international standards provides a first step toward interoperability. We then propose to move towards the discovery of mappings between heterogeneous data sources. Minimizing human intervention by adopting automated alignment techniques and making these alignments’ results reliable and exploitable were the main motivations of our proposal.
9

Problématique des entrepôts de données textuelles : dr Warehouse et la recherche translationnelle sur les maladies rares / Textual data Warehouse challenge : Dr. Warehouse and translational research on rare diseases

Garcelon, Nicolas 29 November 2017 (has links)
La réutilisation des données de soins pour la recherche s’est largement répandue avec le développement d’entrepôts de données cliniques. Ces entrepôts de données sont modélisés pour intégrer et explorer des données structurées liées à des thesaurus. Ces données proviennent principalement d’automates (biologie, génétique, cardiologie, etc) mais aussi de formulaires de données structurées saisies manuellement. La production de soins est aussi largement pourvoyeuse de données textuelles provenant des comptes rendus hospitaliers (hospitalisation, opératoire, imagerie, anatomopathologie etc.), des zones de texte libre dans les formulaires électroniques. Cette masse de données, peu ou pas utilisée par les entrepôts classiques, est une source d’information indispensable dans le contexte des maladies rares. En effet, le texte libre permet de décrire le tableau clinique d’un patient avec davantage de précisions et en exprimant l’absence de signes et l’incertitude. Particulièrement pour les patients encore non diagnostiqués, le médecin décrit l’histoire médicale du patient en dehors de tout cadre nosologique. Cette richesse d’information fait du texte clinique une source précieuse pour la recherche translationnelle. Cela nécessite toutefois des algorithmes et des outils adaptés pour en permettre une réutilisation optimisée par les médecins et les chercheurs. Nous présentons dans cette thèse l'entrepôt de données centré sur le document clinique, que nous avons modélisé, implémenté et évalué. À travers trois cas d’usage pour la recherche translationnelle dans le contexte des maladies rares, nous avons tenté d’adresser les problématiques inhérentes aux données textuelles: (i) le recrutement de patients à travers un moteur de recherche adapté aux données textuelles (traitement de la négation et des antécédents familiaux), (ii) le phénotypage automatisé à partir des données textuelles et (iii) l’aide au diagnostic par similarité entre patients basés sur le phénotypage. Nous avons pu évaluer ces méthodes sur l’entrepôt de données de Necker-Enfants Malades créé et alimenté pendant cette thèse, intégrant environ 490 000 patients et 4 millions de comptes rendus. Ces méthodes et algorithmes ont été intégrés dans le logiciel Dr Warehouse développé pendant la thèse et diffusé en Open source depuis septembre 2017. / The repurposing of clinical data for research has become widespread with the development of clinical data warehouses. These data warehouses are modeled to integrate and explore structured data related to thesauri. These data come mainly from machine (biology, genetics, cardiology, etc.) but also from manual data input forms. The production of care is also largely providing textual data from hospital reports (hospitalization, surgery, imaging, anatomopathologic etc.), free text areas in electronic forms. This mass of data, little used by conventional warehouses, is an indispensable source of information in the context of rare diseases. Indeed, the free text makes it possible to describe the clinical picture of a patient with more precision and expressing the absence of signs and uncertainty. Particularly for patients still undiagnosed, the doctor describes the patient's medical history outside any nosological framework. This wealth of information makes clinical text a valuable source for translational research. However, this requires appropriate algorithms and tools to enable optimized re-use by doctors and researchers. We present in this thesis the data warehouse centered on the clinical document, which we have modeled, implemented and evaluated. In three cases of use for translational research in the context of rare diseases, we attempted to address the problems inherent in textual data: (i) recruitment of patients through a search engine adapted to textual (data negation and family history detection), (ii) automated phenotyping from textual data, and (iii) diagnosis by similarity between patients based on phenotyping. We were able to evaluate these methods on the data warehouse of Necker-Enfants Malades created and fed during this thesis, integrating about 490,000 patients and 4 million reports. These methods and algorithms were integrated into the software Dr Warehouse developed during the thesis and distributed in Open source since September 2017.
10

Approche Bayésienne de la survie dans les essais cliniques pour les cancers rares / Bayesian Approach to Survival in Clinical Trials in Rare Cancers

Brard, Caroline 20 November 2018 (has links)
L'approche Bayésienne permet d’enrichir l'information apportée par l'essai clinique, en intégrant des informations externes à l'essai. De plus, elle permet d’exprimer les résultats directement en termes de probabilité d’un certain effet du traitement, plus informative et interprétable qu’une p-valeur et un intervalle de confiance. Par ailleurs, la réduction fréquente d’une analyse à une interprétation binaire des résultats (significatif ou non) est particulièrement dommageable dans les maladies rares. L’objectif de mon travail était d'explorer la faisabilité, les contraintes et l'apport de l'approche Bayésienne dans les essais cliniques portant sur des cancers rares lorsque le critère principal est censuré. Tout d’abord, une revue de la littérature a confirmé la faible implémentation actuelle des méthodes Bayésiennes dans l'analyse des essais cliniques avec critère de survie.Le second axe de ce travail a porté sur le développement d’un essai Bayésien avec critère de survie, intégrant des données historiques, dans le cadre d’un essai réel portant sur une pathologie rare (ostéosarcome). Le prior intégrait des données historiques individuelles sur le bras contrôle et des données agrégées sur l’effet relatif du traitement. Une large étude de simulations a permis d’évaluer les caractéristiques opératoires du design proposé, de calibrer le modèle, tout en explorant la problématique de la commensurabilité entre les données historiques et actuelles. Enfin, la ré-analyse de trois essais cliniques publiés a permis d’illustrer l'apport de l'approche Bayésienne dans l'expression des résultats et la manière dont cette approche permet d’enrichir l’analyse fréquentiste d’un essai. / Bayesian approach augments the information provided by the trial itself by incorporating external information into the trial analysis. In addition, this approach allows the results to be expressed in terms of probability of some treatment effect, which is more informative and interpretable than a p-value and a confidence interval. In addition, the frequent reduction of an analysis to a binary interpretation of the results (significant versus non-significant) is particularly harmful in rare diseases.In this context, the objective of my work was to explore the feasibility, constraints and contribution of the Bayesian approach in clinical trials in rare cancers with a primary censored endpoint. A review of the literature confirmed that the implementation of Bayesian methods is still limited in the analysis of clinical trials with a censored endpoint.In the second part of our work, we developed a Bayesian design, integrating historical data in the setting of a real clinical trial with a survival endpoint in a rare disease (osteosarcoma). The prior incorporated individual historical data on the control arm and aggregate historical data on the relative treatment effect. Through a large simulation study, we evaluated the operating characteristics of the proposed design and calibrated the model while exploring the issue of commensurability between historical and current data. Finally, the re-analysis of three clinical trials allowed us to illustrate the contribution of Bayesian approach to the expression of the results, and how this approach enriches the frequentist analysis of a trial.

Page generated in 0.4516 seconds