Global ETD Search

1	Méthode de construction d'entrepôt de données temporalisé pour un système informationnel de santé Khnaisser, Christina January 2016 (has links) Des systèmes informationnels de santé (SIS) ont été mis en place au cours des 20 dernières années pour soutenir les processus de soins, les tâches administratives et les activités de recherche ainsi que pour assurer la gestion raisonnée des établissements de santé. Un entrepôt de données (ED) doit être créé à partir de nombreuses sources de données hétérogènes afin de rendre les données exploitables d’une façon uniforme au sein des SIS. La temporalisation de cet entrepôt est rapidement devenue un enjeu crucial afin de garder les traces de l’évolution des données et d’améliorer la prise de décision clinique. L’entrepôt de données temporalisé (EDT) requiert l’application de règles systématiques afin de garantir l’intégrité et la qualité des données. Générer le schéma temporel d’un EDT est une tâche complexe. Plusieurs questions se posent dès lors, dont celles-ci : (a) Quel modèle temporel est le mieux adapté à l’automatisation de la construction d’un EDT (plus particulièrement dans le domaine de la santé)? (b) Quelles propriétés peut-on garantir formellement, suite à cette construction? D’une part, le volume du schéma de données nécessite d’importantes ressources humaines et financières, et d’autre part, plusieurs modèles temporels existent, mais ils ne sont pas formalisés ou non généraux. Les concepteurs s’en remettent donc le plus souvent à des règles de pratiques variées, floues, incomplètes et non validées. Dans ce travail, un cadre de référence permettant de formaliser, de généraliser et d’opérationnaliser des modèles temporels est défini. Deux modèles : BCDM et TRM sont présentés selon le cadre de référence avec leurs contraintes d’intégrité, leurs algorithmes de construction et une liste des prolongements requis. Il en résulte qu’il est désormais possible de s’affranchir des règles de pratique imprécises et de temporaliser un entrepôt en se fondant sur une méthode rigoureuse aux propriétés démontrables basées sur des critères fondamentaux (théorie relationnelle), des critères de conception reconnus et explicites (normalisation). Entrepôt de données temporalisé Modèle temporel Théorie relationnelle Modélisation temporelle Entrepôt de données cliniques Système informationnel de santé
2	Prédiction de survie sur des données cliniques censurées et application à la MPOC Bach, Aurélien January 2017 (has links) La Maladie Pulmonaire Obstructive Chronique est une maladie respiratoire causée principalement par le tabagisme et touchant le plus souvent des personnes âgées de plus de quarante ans. Parce qu’elle est responsable du plus haut taux de réadmission ainsi que de la troisième cause de décès en Amérique du Nord et dans le reste du monde, les chercheurs et cliniciens s’intéressent à prédire le risque auquel les patients font face, de sorte à améliorer les soins et les traitements tout en optimisant les prestations des services de santé. Dans le domaine de l’analyse de survie, on s’intéresse à deux types de prédiction. Dans un premier temps, il s’agit de prédire le temps avant qu’un évènement particulier ne survienne, à savoir une éventuelle réhospitalisation ou un décès. Dans un second temps, il s’agit de prédire le groupe de risque auquel appartiennent les patients en utilisant des méthodes de classification sur deux types d’indicateur que nous définirons. Le point clé de cette étude consiste à analyser l’impact des données censurées sur la qualité des prédictions. Prédiction de survie Analyse de survie Groupe de risque Temps-avant-événement Données cliniques
3	Apprentissage de réseaux causaux avec variables latentes et applications à des contextes génomiques et cliniques / Learning causal networks with latent variable and applications to genomic and clinical contexts Verny, Louis 04 December 2017 (has links) L’algorithme développé durant ma thèse utilise la théorie de l’information pour l’apprentissage d’une grande variété de classes de modèles graphiques à partir de données issues uniquement de l’observation d’un système. Il permet également de prendre en compte les effets de variables dites « latentes » c’est-à-dire non observées durant l’expérimentation, un problème majeur de ce domaine de recherche. Notre méthode, baptisée Miic (Multivariate Information-based Inductive Causation), part d’un réseau entièrement connecté, et supprime de façon itérative les liens non essentiels à l’explication des données. La seconde partie de mon travail de thèse a été d’analyser les réseaux reconstruits sur deux types de données biologiques. Des données génomiques d’une part : Miic a été utilisé pour reconstituer les réseaux d’interactions transcriptomiques entre les facteurs de transcriptions responsables de la différentiation des premières cellules hématopoïétiques de l’embryon. Des données cliniques d’autre part : Miic a également été utilisé sur deux jeux de données issus de deux cohortes distinctes, obtenues grâce à des collaborations avec la Pitié-Salpétrière (données de neurologie) et avec l’Institut Curie (données sur le cancer du sein). Nous démontrons l’apport de la reconstruction de modèles graphiques sur l’analyse et la compréhension de ces données. Les tests réalisés durant le développement ainsi que les résultats obtenus via l’analyse des résultats des différentes applications présentées dans ce manuscrit démontrent l’efficacité de Miic non seulement pour la détection de relations précédemment inconnues, mais également pour le contrôle de la qualité de données de ce type. / During my PhD, I worked on the development of an information theory based algorithm allowing the reconstruction of a wide variety of graphical model classes from observationnal datas. This method also allows to tackle the effect of latent (unobserved) latent variables ; which is essential given the difficultyto observe a biological/clinical system as a whole. Our method, called Miic (for Multivariate Information-based Inductive Causation), starts from a complete network (all nodes are connected to each other), and iteratively removes non essential edges from it. The second part of my thesis was to analyze and interpret the networks reconstructed from two kinds of biological datasets : Genomic dataset on one hand : Miic was used to learn networks of transcriptomic interactions driving the differentiation of the first hematopoietic cells of the embryo. Clinical datasets on the other hand : Miic was also used on two datasets extracted from two distinct cohort, obtained thanks to two collaborations, with la Pitié-Salpétrière (neurology dataset) and with Institut Curie Hospital (breast cancer dataset). The testing during Miic development, along with the results obtained when we analyzed the different applications presented in this manuscript show Miic’s efficiency at both confirming already known interactions, and getting previously unknown associations. Réseaux Causalité Information Variables latentes Hématopoïèse Clinique Données cliniques Networks Biology Information theory 004
4	Description des phénotypes cliniques des patientes diagnostiquées pour un cancer de l'ovaire de type épithélial à partir d'un entrepôt de données cliniques : un soutien pour la génomique fonctionnelle Normandeau-Babin, Vincent January 2013 (has links) Ce projet de maîtrise vise à décrire les phénotypes cliniques des patientes diagnostiquées pour un cancer de l'ovaire de type épithélial afin de soutenir la génomique fonctionnelle. Pour réaliser ce projet de recherche, quatre objectifs ont été réalisés : 1) proposer un modèle conceptuel décrivant les phénotypes cliniques des patientes à partir de données médicales enregistrées dans un entrepôt de données cliniques ; 2) à partir du modèle conceptuel, créer deux outils informatiques, dont l'un, le Master Specimen File (MSF) qui extrait des variables du modèle conceptuel issues des rapports de chirurgie et de pathologie des patientes (p. ex. histologie, stade, grade, etc.) afin de confirmer leurs diagnostics et de décrire leurs tissus de recherche selon des caractéristiques tissulaires, cellulaires et moléculaires. L'autre, le Clinical Response Database (CRD) , permet de visualiser d'autres variables (p. ex. traitements, résultats d'imagerie médicale et marqueurs tumoraux) pour déterminer l'ordre des traitements, les réponses aux traitements ainsi que les survies des patientes; 3) utiliser les deux outils informatiques au Centre hospitalier universitaire de Sherbrooke (CHUS) pour décrire les phénotypes cliniques de patientes recrutées pour le Laboratoire de génomique fonctionnelle de l'Université de Sherbrooke (LGFUS) ; et 4) réanalyser les résultats d'une étude publiée en 2009 par le LGFUS en effectuant un nouveau regroupement des patientes selon leurs phénotypes cliniques. L'utilisation des outils informatiques au CHUS a permis de décrire les phénotypes cliniques de 106 patientes diagnostiquées pour un cancer de l'ovaire de type épithélial. Ces outils ont permis de sélectionner les patientes dont les phénotypes cliniques correspondent à des critères de sélection établis par le LGFUS. Cette sélection a permis d'effectuer la réanalyse des résultats d'une étude génomique et de constater que les patientes ayant des phénotypes cliniques hétérogènes ont des moyennes de ratio d'événements d'épissage alternatif de gènes statistiquement différentes. De plus, cette reanalyse a permis d'obtenir de nouveaux résultats statistiquement significatifs et d'apporter de nouvelles hypothèses concernant le gène CDCA1 dans le cadre du cancer de l'ovaire de type épithélial. Recherche translationnelle Prise en charge médicale Phénotype clinique Outils informatiques Modèle conceptuel Génomique fonctionnelle Entrepôt de données cliniques Cancer de l'ovaire
5	Accès sémantique aux données massives et hétérogènes en santé / Semantic access to massive and heterogeneous health data Lelong, Romain 17 June 2019 (has links) Les données cliniques sont produites par différents professionnels de santé, dans divers lieux et sous diverses formes dans le cadre de la pratique de la médecine. Elles présentent par conséquent une hétérogénéité à la fois au niveau de leur nature et de leur structure mais également une volumétrie particulièrement importante et qualifiable de massive. Le travail réalisé dans le cadre de cette thèse s’attache à proposer une méthode de recherche d’information efficace au sein de ce type de données complexes et massives. L’accès aux données cliniques se heurte en premier lieu à la nécessité de modéliser l’informationclinique. Ceci peut notamment être réalisé au sein du dossier patient informatisé ou, dans une plus large mesure, au sein d’entrepôts de données. Je propose dans ce mémoire unepreuve de concept d’un moteur de recherche permettant d’accéder à l’information contenue au sein de l’entrepôt de données de santé sémantique du Centre Hospitalier Universitaire de Rouen. Grâce à un modèle de données générique, cet entrepôt adopte une vision de l’information assimilable à un graphe de données rendant possible la modélisation de cette information tout en préservant sa complexité conceptuelle. Afin de fournir des fonctionnalités de recherche adaptées à cette représentation générique, un langage de requêtes permettant l’accès à l’information clinique par le biais des diverses entités qui la composent a été développé et implémenté dans le cadre de cette thèse. En second lieu, la massivité des données cliniques constitue un défi technique majeur entravant la mise en oeuvre d’une recherche d’information efficace. L’implémentation initiale de la preuve de concept sur un système de gestion de base de données relationnel a permis d’objectiver les limites de ces derniers en terme de performances. Une migration vers un système NoSQL orienté clé-valeur a été réalisée. Bien qu’offrant de bonnes performances d’accès atomique aux données, cette migration a également nécessité des développements annexes et la définition d’une architecture matérielle et applicative propice à la mise en oeuvre des fonctionnalités de recherche et d’accès aux données. Enfin, l’apport de ce travail dans le contexte plus général de l’entrepôt de données de santé sémantique du CHU de Rouen a été évalué. La preuve de concept proposée dans ce travail a ainsi été exploitée pour accéder aux descriptions sémantiques afin de répondre à des critères d’inclusion et d’exclusion de patients dans des études cliniques. Dans cette évaluation, une réponse totale ou partielle a pu être apportée à 72,97% des critères. De plus, la généricité de l’outil a également permis de l’exploiter dans d’autres contextes tels que la recherche d’information documentaire et bibliographique en santé. / Clinical data are produced as part of the practice of medicine by different health professionals, in several places and in various formats. They therefore present an heterogeneity both in terms of their nature and structure and are furthermore of a particularly large volume, which make them considered as Big Data. The work carried out in this thesis aims at proposing an effective information retrieval method within the context of this type of complex and massive data. First, the access to clinical data constrained by the need to model clinical information. This can be done within Electronic Health Records and, in a larger extent, within data Warehouses. In this thesis, I proposed a proof of concept of a search engine allowing the access to the information contained in the Semantic Health Data Warehouse of the Rouen University Hospital. A generic data model allows this data warehouse to view information as a graph of data, thus enabling to model the information while preserving its conceptual complexity. In order to provide search functionalities adapted to this generic representation of data, a query language allowing access to clinical information through the various entities of which it is composed has been developed and implemented as a part of this thesis’s work. Second, the massiveness of clinical data is also a major technical challenge that hinders the implementation of an efficient information retrieval. The initial implementation of the proof of concept highlighted the limits of a relational database management systems when used in the context of clinical data. A migration to a NoSQL key-value store has been then completed. Although offering good atomic data access performance, this migration nevertheless required additional developments and the design of a suitable hardware and applicative architecture toprovide advanced search functionalities. Finally, the contribution of this work within the general context of the Semantic Health Data Warehouse of the Rouen University Hospital was evaluated. The proof of concept proposed in this work was used to access semantic descriptions of information in order to meet the criteria for including and excluding patients in clinical studies. In this evaluation, a total or partial response is given to 72.97% of the criteria. In addition, the genericity of the tool has also made it possible to use it in other contexts such as documentary and bibliographic information retrieval in health. Bases de données médicales Données massives Données cliniques Recherche d'information Medical databases Big data Clinical data Information retrieval 025.04

1

Page generated in 0.0586 seconds