Global ETD Search

351	Développement d'une base de données sur la résistance aux antibiotiques et son utilisation en génomique Déraspe, Maxime 23 April 2018 (has links) Le projet de maîtrise consistait à développer une base de données (BD) sur la résistance bactérienne aux antibiotiques et de l’utiliser dans les analyses bio-informatiques de deux projets de génomiques. La BD MERGEM (« Mobile Elements and Resistance Genes Enhanced for Metagenomics ») mettait l’emphase sur la bonne nomenclature des gènes et la fiabilité de l’annotation de leurs séquences, qui s’avère un réel problème dans les BD publiques en biologie. La BD MERGEM mit aussi de l’avant l’utilisation de technologies du Web sémantique et de développementWeb pour enrichir et publier son contenu. De plus, un pipeline bio-informatique d’annotations fonctionnelles fut réalisé dans le but de correctement identifier les éléments de MERGEM et leur contexte génomique dans deux projets de séquençages importants : 264 métagénomes du microbiote intestinale et 390 génomes de Pseudomonas aeruginosa. Les résultats démontrent l’utilité de développer des BD spécialisées en génomique. / The current Master’s project consist of the development of a database (DB) on bacterial antibiotic resistance and its use in bioinformatic analyses for two major genomic projects. The DB is called MERGEM (Mobile Elements and Resistance Genes Enhanced for Metagenomics) and puts a particular emphasis on a good genes nomenclature and the reliability of the annotation of their sequences, which is a real problem in biological public databases. The MERGEM database also adopts technologies of the SemanticWeb and utilizesWeb development to enrich and publish its content. Furthermore, a bioinformatic annotation pipeline was developed in order to correctly identify MERGEMs’ genes and their contexts in two important sequencing projects : one with 264 metagenomes from the human gut microbiome and another one consisting of 390 Pseudomonas aeruginosa genomes. The results of this project proves the usefulness of specialized databases in genomic studies. Génomique -- Bases de données
352	Quantification théorique des effets du paramétrage du système d'acquisition sur les variables descriptives du nuage de points LiDAR Roussel, Jean-Romain 18 May 2018 (has links) La cartographie de la ressource forestière se concrétise par la réalisation d’inventaires sur de vastes territoires grâce à des méthodes de mesure automatiques ou semi-automatiques à grandes échelles. En particulier, le développement du LiDAR (light detection and ranging) aéroporté a ouvert la voie à de nouvelles perspectives. Bien que le LiDAR aéroporté ait fait ses preuves comme outil d’inventaire et de cartographie, l’étude de la littérature scientifique sur le sujet met en évidence que les méthodes de traitement de l’information ont des limites et ne sont généralement valides que dans une région donnée et avec un système d’acquisition donné. En effet, un changement dans le dispositif d’acquisition entraîne des variations dans la structure du nuage de points acquis, rendant lesmodèles de cartographie de la ressource non généralisables. Dans le but de créer des modèles de cartographie de la ressource qui soient moins dépendants de la région d’étude et du dispositif d’acquisition utilisé pour les construire, il est nécessaire de comprendre d’où viennent ces variations et comment, à défaut de les éviter, les corriger. Nous explorons dans cette thèse comment des variations dans la configuration des systèmes d’acquisition de données peuvent engendrer des variations dans la structure des nuages de points. Ces questions sont traitées grâce à des modèles mathématiques théoriques simples et nous montrons, dans une certaine mesure, qu’il est possible de corriger les données de LiDAR aéroporté pour les normaliser afin de simuler une acquisition homogène réalisée avec un dispositif d’acquisition « standard » unique. Cette thèse aborde l’enjeu de proposer et d’initier, pour le futur, des méthodes de traitement de données reposant sur des standards mieux établis afin que les outils de cartographie de la ressource soient plus polyvalents et plus justes à grandes échelles / The mapping of the forest resource is currently achieved through inventories made across large territories using methods of automatic or semi-automatic measurements at broad scales. Notably, the development of airborne LiDAR (light detection and ranging) has opened the way for new perspectives in this context. Despite its proven suitability as a tool for inventories and mapping, the study of the scientific literature on airborne LiDAR shows that methods for processing the acquired information remain limited, and are usually valid only for a given region of interest and for a given acquisition device. Indeed, modifying the acquisition device generates variation in the structure of the point cloud that often restrict the range of application of resource evaluation models. With the aim of moving towards models for resourcemapping that are less dependent on the characteristics of both the study area and the of acquisition device, it is important to understand the source of such variation and how to correct it. We investigated, how variations in the settings of the data acquisition systems may generate some variation in the structure of the obtained point clouds. These questions were treated using simple theoretical and mathematical models and we showed, to a certain extent, that it is possible to correct the LiDAR data, and thus to normalise measurements to simulate homogeneous acquisitions with a “standard” and unique acquisition device. The challenge pursued in this thesis is to propose and initiate, for the future, data processing methods relying on better established standards in order to build more accurate and more versatile tools for the large-scalemapping of forest resources. SD 121 UL 2018 Lidar Cartographie forestière Collecte automatique des données
353	Développement d'une approche géosémantique intégrée pour ajuster les résultats des requêtes spatiotemporelles dans les bases de données géospatiales multidimensionnelles évolutives Bakillah, Mohamed 12 April 2018 (has links) Dans le domaine forestier, la gestion des ressources naturelles se base sur les données recueillies lors des inventaires portant sur la représentation spatiale d'un même territoire à différentes époques. Au fil des inventaires, l'évolution naturelle, les interventions humaines, l'évolution des modes d'acquisition, des spécifications et des normes forestières créent une hétérogénéité spatiale et sémantique entre les différentes bases de données. Dans un processus décisionnel, ces données et spécifications sont structurées d'une façon multidimensionnelle dans des cubes de données géospatiales. Par conséquent, la structure multidimensionnelle est également amenée à évoluer, ce qui affecte la réponse aux requêtes spatiotemporelles. Dans le domaine forestier, la problématique de l'évolution de structure se traduit par l'impossibilité d'effectuer des analyses spatiotemporelles, par exemple sur l'évolution du volume de bois de certaines essences ou l'évolution des épidémies, affectant directement la prise de décision dans la gestion forestière. Cette problématique exige de concevoir de nouvelles solutions capables de préserver les liens entre les membres des différentes structures. Cependant, les solutions proposées ne tiennent pas compte de manière explicite et simultanée de l'évolution sémantique et géométrique de la structure. Afin d'apporter une solution plus adaptée aux réalités des phénomènes spatiotemporels, nous avons développé une approche géosémantique intégrée pour la gestion de l'évolution de la structure du cube afin d'ajuster la qualité de la réponse à la requête spatiotemporelle et ainsi offrir un meilleur support à la prise de décision. L'approche proposée définit une méthode de rétablissement des liens entre des versions du cube. Sur le plan sémantique, nous rétablissons les liens en employant une fonction de similarité sémantique basée sur l'ontologie et qui tient compte du plus fin niveau de définition des concepts. Au niveau géométrique, notre approche se base sur une méthode d'indexation QuadTree pour constituer une matrice de correspondances spatiales entre les géométries des différentes époques. Les liens résultants sont intégrés dans une méthode de transformation matricielle afin de pouvoir répondre d'une manière plus adaptée à des requêtes spatiotemporelles. SD 121 UL 2007 Données géospatiales Forêts -- Gestion -- Logiciels
354	Développement d’une méthode d’automate cellulaire basé sur une tessellation irrégulière et hiérarchique pour la simulation des processus spatiotemporels Sammari, Hédia 23 April 2018 (has links) Les systèmes d’information géographique (SIG) sont largement utilisés pour représenter, gérer et analyser les données spatiales dans plusieurs disciplines incluant les géosciences, l’agriculture, la foresterie, la météorologie et l’océanographie. Néanmoins, malgré l’avancement récent des technologies des SIG, ils sont encore limités dans la représentation et la simulation des processus spatiotemporels. Ce travail de recherche définit le cadre théorique, conceptuel et applicatif qui vise à améliorer les méthodes de compréhension, de représentation et de simulation des processus dynamiques continus. Il vise plus précisément à améliorer les structures de données dans les SIG en développant une structure de données hiérarchique qui est la base d’un automate cellulaire capable de répondre aux principales caractéristiques de ces processus. L’exploration du potentiel des automates cellulaires pour simuler et représenter les processus dynamiques continus dans les SIG en respectant leur caractère irrégulier et hiérarchique fait l’objet de ce travail de recherche dans lequel une application dans le contexte hydrologique est mise en place. Nos objectifs spécifiques se résument dans 1) la construction d’une tessellation irrégulière et hiérarchique permettant de représenter les processus spatiotemporels et 2) la simulation de ces processus en utilisant un automate cellulaire opérant sur cette tessellation. Nous étudions la discrétisation de l’espace en tessellation irrégulière basée sur le diagramme de Voronoï et nous proposons une procédure de hiérarchisation de cette tessellation dans un objectif de représentation multi-échelle afin d’offrir une solution d’aide à la décision dans la gestion du territoire. Nous expliquons notre méthodologie et les algorithmes de sélection de données pour la génération de différents niveaux d’échelles spatiales. Un automate cellulaire non traditionnel est mis en place pour lequel nous définissons une grille à géométrie irrégulière de type Voronoï, des règles de transition spécifiques et un type particulier de voisinage orienté. Nous validons le fonctionnement de ce prototype dans le Bassin Expérimental de la Forêt Montmorency à Québec où des comparaisons sont possibles grâce à des données de débits d’eau mesurées in situ. / Geographic information systems (GIS) are widely used to represent, manage and analyse spatial data in many disciplines including geosciences, agriculture, forestry, meteorology and oceanography. However, despite recent advances in GIS technologies, they are still limited when it comes to representation and simulation of spatiotemporal processes. This research work, deals with a theoretical, conceptual and practical framework which aims to improve the representation of dynamic continuous processes. It aims especially to improve GIS capabilities by developing a CA based on a hierarchical irregular tessellation which is able to take into account the main characteristics of these processes. The exploration of the cellular automata potential to simulate and represent dynamic continuous processes regarding their irregular and hierarchic characteristics is the subject of this work where an application in the hydrologic field is established. Our specific objectives are 1) to build an irregular and hierarchic grid that can be used to represent spatiotemporal processes, 2) to simulate those processes with a cellular automata operating on this grid. We give details about the irregular geometric grid based on a Voronoï Diagram, the characteristics of a specific oriented neighbourhood and the transition rules that are governing the cells update. In addition, we discuss the hierarchical perspective of the build lattice that is essential for easy move between different spatial scales. We explain our methodology of data selection in order to generate the spatial levels of representation by demonstrating the used selection algorithms. This facilitates the representation of spatial dynamic phenomena and contributes to the better understanding of the complex behaviour of the whole system at different levels of details. We also present the data structures and general functioning of the whole simulation system. We finally, validate our framework by simulating the water flow process in a specific watershed in the region of Montmorency Forest of Quebec where in situ data are available. To validate our simulation results we compare them with measured data. SD 121 UL 2014 Automates cellulaires Tesselations Données spatio-temporelles
355	Génération et analyse de jeux de données adaptés à l'application de l'apprentissage automatique en biophotonique Bernatchez, Renaud 25 March 2024 (has links) Titre de l'écran-titre (visionné le 18 mars 2024) / Depuis plusieurs années, il y a un intérêt croissant pour l'utilisation de l'apprentissage automatique afin d'automatiser différentes tâches d'analyse quantitative d'images en biophotonique. Cependant, les images de microscopie à fluorescence présentent des défis particuliers qui complexifient l'application d'approches d'apprentissage automatique. Notamment, l'acquisition de ces images est coûteuse, leur annotation est complexe, fastidieuse et souvent bruitée, et il peut être difficile de déterminer quel type d'analyse permettra de répondre à la question biologique d'intérêt. Il est donc nécessaire de développer des approches permettant la génération de jeux de données adaptés aux différents défis propres au domaine de l'imagerie en biophotonique. Mon projet consiste à explorer des pistes aidant à considérer les problèmes propres aux données en biophotonique afin de faciliter l'application de l'apprentissage automatique à l'analyse d'images de microscopie. Afin de limiter le temps d'annotation requis lors de la génération d'un jeu de données, une approche d'apprentissage actif considérant le coût d'annotation est développée et évaluée sur un jeu de données simple. Ensuite, un jeu de données d'images de jonction serrée intestinale est généré avec des annotations adaptées, puis analysé à l'aide d'approches d'apprentissage non supervisé. Finalement, un riche jeu de données annoté d'images de super-résolution de protéines synaptiques est construit à l'aide d'un projet de science citoyenne, permettant de prendre en compte la distribution du bruit dans les annotations. Les résultats obtenus témoignent de l'importance d'un jeu de données bien conçu lors de l'application d'approches d'apprentissage actif à l'analyse de données d'imagerie en biophotonique. Notamment, l'inclusion d'experts dans le processus de conception du jeu de données est essentielle à l'acquisition d'annotations significatives permettant de répondre à des questions biologiques. / For several years, there has been growing interest in using machine learning to automate various quantitative image analysis tasks in biophotonics. However, fluorescence microscopy images present particular challenges that complicate the application of machine learning ap-proaches. Notably, the acquisition of these images is costly, their annotation is complex, tedious and often noisy, and it can be difficult to determine which type of analysis will answer the biological question of interest. It is therefore necessary to develop approaches that allow the generation of datasets adapted to the various challenges specific to the field of biophotonics imaging. My project consists in exploring ways to consider the challenges specific to biophotonics datain order to facilitate the application of machine learning to the quantitative analysis of mi-croscopy images. In order to limit the annotation time required when generating a dataset,an active learning approach considering the annotation cost is developed and evaluated on asimple dataset. Then, a dataset of intestinal tight junction images is generated with adapted annotations and analyzed using unsupervised learning approaches. Finally, a rich annotated dataset of super-resolution images of synaptic proteins is constructed using a citizen science crowdsourcing project, allowing a measure of the distribution of noise in the annotations.The results obtained demonstrate the importance of a well-designed dataset when applying active learning approaches to the analysis of imaging data in biophotonics. In particular, the inclusion of experts in the dataset design process is essential for the acquisition of meaningful annotations to answer biological questions. Jeux de données. Apprentissage automatique. Analyse d'images. Microscopie de fluorescence.
356	Intégrations unimodale et multimodale des informations somatosensorielles chez les personnes atteintes de douleur chronique Augière, Tania 05 August 2024 (has links) Introduction : Notre cerveau utilise constamment les informations sensorielles fournies par nos sens (toucher, vision, proprioception etc.). Cette intégration multimodale nous permet de percevoir notre corps précisément et de bouger efficacement. Selon le modèle de l'estimation du maximum de vraisemblance (maximum likelihood estimation ; MLE), le cerveau pondère les informations sensorielles en fonction de leur fiabilité : une modalité peu précise sera considérée comme moins fiable qu'une modalité précise, et sera donc moins utilisée (i.e., pondération plus faible). Des études suggèrent que la présence de douleur perturberait l'intégration des informations somatosensorielles. Chez les personnes ayant de la douleur chronique, comme les individus ayant la fibromyalgie (FM), des altérations de l'intégration des informations somatosensorielles seules (i.e., intégration unimodale) pourraient être associées à une plus faible pondération de ces informations lors de leur intégration multimodale. Ceci pourrait expliquer les perturbations de la représentation corporelle et les déficits sensorimoteurs observés chez ces personnes. Ainsi, l'objectif général de cette thèse était de comparer l'intégration des informations sensorielles et motrices chez les personnes atteintes de douleur chronique comparativement aux personnes sans douleur. L'hypothèse générale était que l'intégration unimodale des informations somatosensorielles sera altérée en présence de douleur chronique, ce qui se traduira par des altérations de l'intégration multimodale de ces informations dans les tâches perceptives et motrices. Méthode : Les études 1 et 2 visaient à comparer l'intégration unimodale des informations somatosensorielles. Une revue systématique (Chapitre 1) permettait de comparer la sensation des stimuli tactiles nociceptifs et non nociceptifs chez les personnes ayant la FM à celle de participant·e·s contrôles sans douleur (CTRL). Puis, une tâche d'estimation de distance tactile (Chapitre 2) était utilisée pour comparer la perception tactile. De plus, dans cette étude, une tâche de dessin du corps permettait de faire un parallèle avec l'intégration multimodale des informations tactiles. Le but des études 3 et 4 (Chapitre 3 et 5, respectivement) était de comparer l'intégration multimodale des personnes ayant la FM et des participant·e·s CTRL. Dans l'étude 3, une tâche perceptive de jugement d'ordre temporel était utilisée pour évaluer la pondération des informations visuelles et tactiles (intégration multisensorielle). L'étude 4 impliquait une tâche motrice de tracé de figures dans laquelle la rétroaction visuelle était manipulée pour devenir incongruente avec les informations somatosensorielles et efférentes (un paradigme nommé conflit sensorimoteur). Ceci permettait de comparer la pondération respective des informations sensorielles (intégration sensorimotrice). L'électroencéphalographie (EEG) était aussi utilisée pour mesurer les mécanismes cérébraux sous-jacents à cette intégration. Résultats : Les résultats obtenus dans l'étude 1 suggèrent une sensation tactile non altérée chez les individus ayant la FM, bien qu'une tendance vers l'hyperalgésie puisse être observée. L'étude 2 indique une perception tactile non altérée chez les participant·e·s ayant la FM, qui contraste avec les distorsions de la représentation corporelle révélées par les dessins. L'intégration multisensorielle du groupe FM, comme celle du groupe CTRL, semble suivre le modèle MLE (étude 3). Toutefois, plus la douleur des participant·e·s ayant la FM était élevée, moins les informations tactiles étaient utilisées pour percevoir les stimuli visuotactiles. Enfin, dans l'étude 4, la performance motrice était semblable entre les groupes de participant·e·s, ce qui suggère une absence de différence de pondération sensorielle. L'EEG mettait néanmoins en évidence une augmentation plus prononcée de la puissance thêta dans le cortex pariétal postérieur du groupe FM. Cette différence pourrait indiquer une détection altérée du conflit. Conclusion : L'intégration unimodale des informations somatosensorielles ne semble pas altérée chez les personnes ayant de la FM. De façon cohérente avec le modèle MLE, leur pondération n'était pas moindre quand elles étaient intégrées avec d'autres informations sensorielles et motrices, comparativement aux personnes sans douleur. Les perturbations de la détection du conflit (objectivées par l'EEG) et de la perception du corps (révélées par les dessins) des individus ayant la FM semblent davantage s'expliquer par des prédictions erronées sur les conséquences sensorielles du mouvement et par des connaissances a priori biaisées sur le corps. Ces résultats soutiennent une dissociation entre la perception du mouvement (altérée) et son contrôle (préservé), ainsi qu'entre deux représentations corporelles, l'image corporelle (altérée) et le schéma corporel (préservé). De futures recherches seront nécessaires pour élucider le rôle de l'intensité de la douleur sur ces altérations et pour potentiellement développer des thérapies afin de les corriger. / Introduction: Our brain constantly uses the sensory information provided by our senses (touch, vision, proprioception etc.). This multimodal integration allows us to perceive our body precisely and move efficiently. According to the maximum likelihood estimation model (MLE), the brain weights sensory information according to its reliability: a less precise modality is considered less reliable than a precise modality, and therefore will be weighted less (i.e., smaller weight). Studies suggest that pain could disturb somatosensory information integration. In people with chronic pain, such as individuals with fibromyalgia (FM), alterations of the integration of somatosensory information alone (i.e., unimodal integration) could be associated with a smaller weighting of this information during multimodal integration. Thus, this thesis' general objective was to compare sensory and motor information integration in people with chronic pain compared to pain-free individuals. The general hypothesis was that the unimodal integration of somatosensory information would be altered in chronic pain, which would lead to alterations of this information multimodal integration in perceptual and motor tasks. Methods: Studies 1 and 2 aimed to compare unimodal integration of somatosensory information. First, a systematic review (Chapter 2) allowed to compare the sensation of noxious and non-noxious tactile stimuli in individuals with FM and pain-free control participants (CTRL). Then, a tactile distance estimation task (Chapter 3) was used to compared tactile perception. In this study, a body drawing task allowed to draw a parallel with tactile information multimodal integration. The goal of studies 3 and 4 (Chapter 4 and 5, respectively) was to compare multimodal integration in FM and CTRL participants. In study 3, a temporal-order judgment perceptual task was used to assess visual and tactile information weighting (multisensory integration). Study 4 involved a figure drawing motor task in which visual feedback was manipulated to be incongruent with somatosensory and efferent information (a paradigm called sensorimotor conflict). This allowed to compare the respective weighting of the sensory information (sensorimotor integration). Electroencephalography (EEG) was also used to measure the cerebral mechanisms underlying this integration. Results: Results obtained in study 1 suggest an unaltered tactile sensation in individual with FM, even though a trend towards hyperalgesia was observed. Study 2 indicates an unaltered tactile perception in participants with FM, which contrasts with the body representation distortions revealed by the drawings. The multisensory integration of the FM group, like the CTRL group, seems to follow the MLE model (study 3). However, the more intense the pain of the participants with FM was, the less the tactile information was used compared to the visual information, to perceive the visuotactile stimuli. Finally, in study 4, motor performance was similar in both groups, which suggests an absence of difference in sensory weighting. EEG revealed a stronger theta power increase in the posterior parietal cortex of the FM group. This difference could indicate an altered conflict detection. Conclusion: The unimodal integration of somatosensory information does not seem to be altered in people with FM. Consistent with the MLE model, their weighting was not smaller when they were integrated with other sensory and motor information, compared to pain-free individuals. The perturbations of conflict detection (measured with EEG) and of the body perception (revealed by the drawings) in individuals with FM seem better explained by erroneous predictions about the sensory consequences of the movement and by biased a priori knowledge about the body. These results support a dissociation between (altered) movement perception and (preserved) motor control, as well as between two body representations, the body image (altered) and the body schema (preserved). Future research is necessary to elucidate the role of intensity of pain on these alterations and potentially develop therapies to correct them. Douleur chronique. Organes des sens. Données sensorielles. Rétroaction sensorielle. Psychomotricité.
357	Réseaux de processus flots de données avec routage pour la modélisation de systèmes embarqués Coadou, Anthony 03 December 2010 (has links) (PDF) Cette thèse définit un nouveau modèle de calcul et de communication, dénommé graphe à routage k-périodique (KRG). Ce modèle, de la famille des réseaux de processus flots de données, admet des aiguillages réguliers des données, explicités par des séquences binaires k-périodiques. Nous étudions les propriétés mathématiques intrinsèques au modèle. Le routage explicite et l'absence de conflit nous permettent d'exprimer algébriquement les dépendances de données, de même que des transformations topologiques préservant le comportement du graphe. Nous montrons ensuite comment ordonnancer le KRG, en associant aux nœuds des horloges k-périodiques. Nous positionnons ensuite notre modèle au sein d'un flot de conception dédié aux applications de traitement intensif de données. Nous montrons en particulier la capacité des KRG à représenter explicitement le parallélisme d'instruction extrait du modèle polyédrique. Nous pouvons alors appliquer un ensemble d'optimisations de bas niveau, sortant du cadre affine du modèle polyédrique. Nous présentons enfin une méthodologie pour l'implantation des KRG, basée sur la conception insensible aux latences. Réseau de processus flot de données modèle polyédrique modèle synchrone conception insensible aux latences traitement intensif de données
358	Quelques problèmes lies a l'analyse d'images numériques obtenues par un système automatique de microphotometrie a balayage Chassery, Jean-Marc 17 December 1976 (has links) (PDF) Présentation d'un système d'analyse d'image effectué avec les contraintes suivantes : obtenir un nombre suffisant de niveaux de différenciation permettant de traiter l'information non seulement avec des critères de forme mais également avec des critères lies au comportement du signal ; avoir la possibilité d'analyser des images de grande taille ; ne pas figer le traitement au problème posé. signal signaux images microscope microscopique acquisition des données traitement des données reproductibilité filtres machine séquentielle
359	IXIA (IndeX-based Integration Approach) A Hybrid Approach to Data Integration Kermanshahani, Shokoh 10 July 2009 (has links) (PDF) Aujourd'hui, il existe un nombre important et croissant de sources de données, qui peuvent être des documents et des données structurées ou semi-structurées. En général, aussi bien les documents que les bases de données sont autonomes et gérés par des systèmes différents. D'autre part, beaucoup de ces sources sont reliées tout en étant sémantiquement hétérogènes : elles modélisent la même réalité externe tout en utilisant des concepts et des structures distincts. <br />Or, les organisations et les entreprises qui sont confrontées à de telles sources de données ont besoin d'en avoir une vision homogène et cohérente. La conséquence est qu'il est nécessaire de les intégrer et de disposer d'un système qui gère ces données.<br /><br />L'objectif d'un système d'intégration des données est de proposer une interface homogène pour interroger plusieurs sources, qui peuvent être hétérogènes et autonomes. Derrière une telle interface il y a plusieurs défis, parmi lesquels nous soulignons l'hétérogénéité structurelle et sémantique des sources de données, la fragmentation des données, le traitement et l'optimisation des requêtes. <br /><br />Il existe de nombreux travaux qui présentent des approches distinctes pour l'intégration des données, et chaque approche propose des solutions spécifiques à chacun des problèmes évoqués. On considère en général que ces approches appartiennent à deux grandes catégories : l'approche matérialisée et l'approche virtuelle. Cependant, on peut aussi considérer une troisième approche, dite hybride, qui propose qu'une partie des données du système intégré soit matérialisée et qu'une autre partie des données soit virtuelle.<br /><br />Dans cette thèse, nous proposons une architecture hybride pour un système d'intégration de sources de données hétérogènes, qui vise à étendre l'optimisation des requêtes à toutes les requêtes du système d'intégration. Elle permet aussi de fournir un mécanisme flexible pour traiter la mise à jour des données afin de tolérer les différentes caractéristiques des sources et de leurs données.<br /><br />Cette approche est basée sur un système d'indexation d'objets multicritères au niveau de la médiation. Dans notre approche, nous utilisons le système Osiris et son mécanisme d'indexation. Osiris est un système de gestion de bases de données et de bases de connaissance orienté objet, où une famille d'objets est définie par une hiérarchie de vues " object-preserving ". Le système d'indexation d'Osiris est un système multi-attributs, et notre approche propose la matérialisation du sous-ensemble des données directement reliées aux attributs d'indexation. <br /><br />Le système d'intégration des données proposé, IXIA, matérialise la structure d'indexation des objets sous-jacents au niveau du médiateur. Les Oids des objets, leur correspondance avec les objets des sources et les données nécessaires pour la mise à jour de l'indexation des données sont aussi matérialisées. <br /><br />Cette approche offre une plus grande flexibilité de rafraîchissement des données qu'une approche entièrement matérialisée, et une meilleure optimisation des requêtes que les méthodes entièrement virtuelles. Intégration des données Entrepôt de données Hétérogénéité Médiateur Approches Hybrides Vues
360	Fusion de connaissances imparfaites pour l'appariement de données géographiques : proposition d'une approche s'appuyant sur la théorie des fonctions de croyance Olteanu, Ana-Maria 24 October 2008 (has links) (PDF) De nos jours, il existe de nombreuses bases de données géographiques (BDG) couvrant le même territoire. Les données géographiques sont modélisées différemment (par exemple une rivière peut être modélisée par une ligne ou bien par une surface), elles sont destinées à répondre à plusieurs applications (visualisation, analyse) et elles sont créées suivant des modes d'acquisition divers (sources, processus). Tous ces facteurs créent une indépendance entre les BDG, qui pose certains problèmes à la fois aux producteurs et aux utilisateurs. Ainsi, une solution est d'expliciter les relations entre les divers objets des bases de données, c'est-à-dire de mettre en correspondance des objets homologues représentant la même réalité. Ce processus est connu sous le nom d'appariement de données géographiques. La complexité du processus d'appariement fait que les approches existantes varient en fonction des besoins auxquels l'appariement répond, et dépendent des types de données à apparier (points, lignes ou surfaces) et du niveau de détail. Nous avons remarqué que la plupart des approches sont basées sur la géométrie et les relations topologiques des objets géographiques et très peu sont celles qui prennent en compte l'information descriptive des objets géographiques. De plus, pour la plupart des approches, les critères sont enchaînés et les connaissances sont à l'intérieur du processus. Suite à cette analyse, nous proposons une approche d'appariement de données qui est guidée par des connaissances et qui prend en compte tous les critères simultanément en exploitant à la fois la géométrie, l'information descriptive et les relations entre eux. Afin de formaliser les connaissances et de modéliser leurs imperfections (imprécision, incertitude et incomplétude), nous avons utilisé la théorie des fonctions de croyance [Shafer, 1976]. Notre approche d'appariement de données est composée de cinq étapes : après une sélection des candidats, nous initialisons les masses de croyance en analysant chaque candidat indépendamment des autres au moyen des différentes connaissances exprimées par divers critères d'appariement. Ensuite, nous fusionnons les critères d'appariement et les candidats. Enfin, une décision est prise. Nous avons testé notre approche sur des données réelles ayant des niveaux de détail différents représentant le relief (données ponctuelles) et les réseaux routiers (données linéaires) [INFO] Computer Science [INFO] Informatique Appariement Données géographiques Fusion Connaissances Imperfection Comparaisons par paires Méthode des Géographie -- Bases de données

Search results