Spelling suggestions: "subject:"digraphes"" "subject:"bigraphes""
211 |
Reconstruction et classification par optimisation dans des graphes avec à priori pour les réseaux de gènes et les images / Reconstruction and clustering with graph optimization and priors on gene networks and imagesPirayre, Aurélie 03 July 2017 (has links)
Dans de nombreuses applications telles que la médecine, l'environnement ou les biotechnologies par exemple, la découverte de nouveau processus de régulations de gènes permet une meilleure compréhension des réponses phénotypiques des cellules à des stimuli externes. Pour cela, il est alors d'usage de générer et d'analyser les données transcriptomiques issues d'expériences de types puces à ADN ou plus récemment de RNAseq. Ainsi, pour chaque gène d'un organisme d'étude placé dans différentes conditions expérimentales, un ensemble de niveau d'expression est obtenu. A partir de ces données, les mécanismes de régulation des gènes peuvent être obtenus à travers un ensemble de liens dans des graphes. Dans ces réseaux, les nœuds correspondent aux gènes. A lien entre deux nœuds est identifié si une relation de régulation existent entre les deux gènes correspondant. De tels réseaux sont appelés Réseaux de Régulation de Gènes (RRGs). Malgré la profusion de méthodes d'inférence disponible, leur construction et leur analyse restent encore à ce jour un défi.Dans cette thèse, nous proposons de répondre au problème d'inférence de réseaux par des techniques d'optimisation dans des graphes. A partir d'information de régulation sur l'ensemble des couples de gènes, nous proposons de déterminer la présence d'arêtes dans le RRG final en adoptant une formulation de fonction objectif intégrant des contraintes. Des a priori à la fois biologiques (sur les interactions entre les gènes) et structuraux (sur la connectivité des nœuds) ont été considérés pour restreindre l'espace des solutions possibles. Les différents a priori donnent des fonctions objectifs ayant des propriétés différentes, pour lesquelles des stratégies d'optimisation adaptées (continue et/ou discrète) peuvent être appliquées. Les post-traitement que nous avons développé ont mené à un ensemble de méthodes nommés BRANE, pour "Biologically-Related A priori for Network Enhancement". Pour chacune des méthodes développées (BRANE Cut, BRANE Relax et BRANE Clust), nos contributions sont triples : formulation de la fonction objectif à l'aide d'a priori, développement de la stratégie d'optimisation et validation (numérique et biologique) sur des données de parangonnage issues des challenges DREAM4 et DREAM5, montrant ainsi des améliorations pouvant atteindre 20%.En complément de l'inférence de réseaux, notre travail s'est étendu à des traitements de données sur graphe plus génériques, tels que les problèmes inverses. Nous avons notamment étudié HOGMep, une approche Bayésienne utilisant des stratégies d'approximation Bayésienne variationnelle. Cette méthode a été développée pour résoudre de façon conjointe, des problèmes de restauration et de classification sur des données multi-composantes (signaux et images). Les performances d'HOGMep dans un contexte de déconvolution d'image couleur montrent de bonnes qualités de reconstruction et de segmentation. Une étude préliminaire dans un contexte de classification de données médicales liant génotype et phénotype a également montré des résultats prometteurs pour des adaptions à venir en bioinformatiques. / The discovery of novel gene regulatory processes improves the understanding of cell phenotypicresponses to external stimuli for many biological applications, such as medicine, environmentor biotechnologies. To this purpose, transcriptomic data are generated and analyzed from mi-croarrays or more recently RNAseq experiments. For each gene of a studied organism placed indifferent living conditions, they consist in a sequence of genetic expression levels. From thesedata, gene regulation mechanisms can be recovered by revealing topological links encoded ingeometric graphs. In regulatory graphs, nodes correspond to genes. A link between two nodesis identified if a regulation relationship exists between the two corresponding genes. Such net-works are called Gene Regulatory Networks (GRNs). Their construction as well as their analysisremain challenging despite the large number of available inference methods.In this thesis, we propose to address this network inference problem with recently developedtechniques pertaining to graph optimization. Given all the pairwise gene regulation informa-tion available, we propose to determine the presence of edges in the final GRN by adoptingan energy optimization formulation integrating additional constraints. Either biological (infor-mation about gene interactions) or structural (information about node connectivity) a priorihave been considered to reduce the space of possible solutions. Different priors lead to differentproperties of the global cost function, for which various optimization strategies can be applied.The post-processing network refinements we proposed led to a software suite named BRANE for“Biologically-Related A priori for Network Enhancement”. For each of the proposed methodsBRANE Cut, BRANE Relax and BRANE Clust, our contributions are threefold: a priori-based for-mulation, design of the optimization strategy and validation (numerical and/or biological) onbenchmark datasets.In a ramification of this thesis, we slide from graph inference to more generic data processingsuch as inverse problems. We notably invest in HOGMep, a Bayesian-based approach using aVariation Bayesian Approximation framework for its resolution. This approach allows to jointlyperform reconstruction and clustering/segmentation tasks on multi-component data (for instancesignals or images). Its performance in a color image deconvolution context demonstrates bothquality of reconstruction and segmentation. A preliminary study in a medical data classificationcontext linking genotype and phenotype yields promising results for forthcoming bioinformaticsadaptations.
|
212 |
Graph based approaches for image segmentation and object tracking / Méthodes de graphe pour la segmentation d'images et le suivi d'objets dynamiquesWang, Xiaofang 27 March 2015 (has links)
Cette thèse est proposée en deux parties. Une première partie se concentre sur la segmentation d’image. C’est en effet un problème fondamental pour la vision par ordinateur. En particulier, la segmentation non supervisée d’images est un élément important dans de nombreux algorithmes de haut niveau et de systèmes d’application. Dans cette thèse, nous proposons trois méthodes qui utilisent la segmentation d’images se basant sur différentes méthodes de graphes qui se révèlent être des outils puissants permettant de résoudre ces problèmes. Nous proposons dans un premier temps de développer une nouvelle méthode originale de construction de graphe. Nous analysons également différentes méthodes similaires ainsi que l’influence de l’utilisation de divers descripteurs. Le type de graphe proposé, appelé graphe local/global, encode de manière adaptative les informations sur la structure locale et globale de l’image. De plus, nous réalisons un groupement global en utilisant une représentation parcimonieuse des caractéristiques des superpixels sur le dictionnaire de toutes les caractéristiques en résolvant un problème de minimisation l0. De nombreuses expériences sont menées par la suite sur la base de données <Berkeley Segmentation>, et la méthode proposée est comparée avec des algorithmes classiques de segmentation. Les résultats démontrent que notre méthode peut générer des partitions visuellement significatives, mais aussi que des résultats quantitatifs très compétitifs sont obtenus en comparaison des algorithmes usuels. Dans un deuxième temps, nous proposons de travailler sur une méthode reposant sur un graphe d’affinité discriminant, qui joue un rôle essentiel dans la segmentation d’image. Un nouveau descripteur, appelé patch pondéré par couleur, est développé pour calculer le poids des arcs du graphe d’affinité. Cette nouvelle fonctionnalité est en mesure d’intégrer simultanément l’information sur la couleur et le voisinage en représentant les pixels avec des patchs de couleur. De plus, nous affectons à chaque pixel une pondération à la fois local et globale de manière adaptative afin d’atténuer l’effet trop lisse lié à l’utilisation de patchs. Des expériences approfondies montrent que notre méthode est compétitive par rapport aux autres méthodes standards à partir de plusieurs paramètres d’évaluation. Finalement, nous proposons une méthode qui combine superpixels, représentation parcimonieuse, et une nouvelle caractéristisation de mi-niveau pour décrire les superpixels. Le nouvelle caractérisation de mi-niveau contient non seulement les mêmes informations que les caractéristiques initiales de bas niveau, mais contient également des informations contextuelles supplémentaires. Nous validons la caractéristisation de mi-niveau proposée sur l’ensemble de données MSRC et les résultats de segmentation montrent des améliorations à la fois qualitatives et quantitatives par rapport aux autres méthodes standards. Une deuxième partie se concentre sur le suivi d’objets multiples. C’est un domaine de recherche très actif, qui est d’une importance majeure pour un grand nombre d’applications, par exemple la vidéo-surveillance de piétons ou de véhicules pour des raisons de sécurité ou l’identification de motifs de mouvements animaliers. / Image segmentation is a fundamental problem in computer vision. In particular, unsupervised image segmentation is an important component in many high-level algorithms and practical vision systems. In this dissertation, we propose three methods that approach image segmentation from different angles of graph based methods and are proved powerful to address these problems. Our first method develops an original graph construction method. We also analyze different types of graph construction method as well as the influence of various feature descriptors. The proposed graph, called a local/global graph, encodes adaptively the local and global image structure information. In addition, we realize global grouping using a sparse representation of superpixels’ features over the dictionary of all features by solving a l0-minimization problem. Extensive experiments are conducted on the Berkeley Segmentation Database, and the proposed method is compared with classical benchmark algorithms. The results demonstrate that our method can generate visually meaningful partitions, but also that very competitive quantitative results are achieved compared with state-of-the-art algorithms. Our second method derives a discriminative affinity graph that plays an essential role in graph-based image segmentation. A new feature descriptor, called weighted color patch, is developed to compute the weight of edges in an affinity graph. This new feature is able to incorporate both color and neighborhood information by representing pixels with color patches. Furthermore, we assign both local and global weights adaptively for each pixel in a patch in order to alleviate the over-smooth effect of using patches. The extensive experiments show that our method is competitive compared to the other standard methods with multiple evaluation metrics. The third approach combines superpixels, sparse representation, and a new midlevel feature to describe superpixels. The new mid-level feature not only carries the same information as the initial low-level features, but also carries additional contextual cue. We validate the proposed mid-level feature framework on the MSRC dataset, and the segmented results show improvements from both qualitative and quantitative viewpoints compared with other state-of-the-art methods. Multi-target tracking is an intensively studied area of research and is valuable for a large amount of applications, e.g. video surveillance of pedestrians or vehicles motions for sake of security, or identification of the motion pattern of animals or biological/synthetic particles to infer information about the underlying mechanisms. We propose a detect-then-track framework to track massive colloids’ motion paths in active suspension system. First, a region based level set method is adopted to segment all colloids from long-term videos subject to intensity inhomogeneity. Moreover, the circular Hough transform further refines the segmentation to obtain colloid individually. Second, we propose to recover all colloids’ trajectories simultaneously, which is a global optimal problem that can be solved efficiently with optimal algorithms based on min-cost/max flow. We evaluate the proposed framework on a real benchmark with annotations on 9 different videos. Extensive experiments show that the proposed framework outperforms standard methods with large margin.
|
213 |
Pavages réguliers et modélisation des dynamiques spatiales à base de graphes d'interaction : conception, implémentation, application / Regular tilings in interaction-graph-based modelling of spatial dynamics : conception, implementation, applicationCastets, Mathieu 15 December 2015 (has links)
La modélisation et la simulation de dynamiques spatiales, en particulier pour l'étude de l'évolution de paysages ou de problématiques environnementales pose la question de l'intégration des différentes formes de représentation de l'espace au sein d'un même modèle. Ocelet est une approche de modélisation de dynamiques spatiales basée sur le concept original de graphe d'interaction. Le graphe porte à la fois la structure d'une relation entre entités d’un modèle et la sémantique décrivant son évolution. Les relations entre entités spatiales sont ici traduites en graphes d'interactions et ce sont ces graphes que l'on fait évoluer lors d'une simulation. Les concepts à la base d'Ocelet peuvent potentiellement manipuler les deux formes de représentation spatiale connues, celle aux contours définis (format vecteur) ou la discrétisation en grille régulière (format raster). Le format vecteur est déjà intégré dans la première version d'Ocelet. L'intégration du format raster et la combinaison des deux restaient à étudier et à réaliser. L'objectif de la thèse est d'abord étudier les problématiques liées à l'intégration des champs continus et leur représentation discrétisée en pavage régulier, à la fois dans le langage Ocelet et dans les concepts sur lesquels il repose. Il a fallu notamment prendre en compte les aspects dynamiques de cette intégration, et d'étudier les transitions entre données géographiques de différentes formes et graphe d'interactions à l'aide de concepts formalisés. Il s'est agi ensuite de réaliser l'implémentation de ces concepts dans la plateforme de modélisation Ocelet, en adaptant à la fois son compilateur et son moteur d'exécution. Enfin, ces nouveaux concepts et outils ont été mis à l'épreuve dans trois cas d'application très différents : deux modèles sur l’île de la Réunion, le premier simulant le ruissellement dans le bassin versant de la Ravine Saint Gilles s'écoulant vers la Côte Ouest de l'île, l’autre simulant la diffusion de plantes invasives dans les plaines des hauts à l'intérieur du Parc National de La Réunion. Le dernier cas décrit la spatialisation d'un modèle de culture et est appliqué ici pour simuler les rendements de cultures céréalières sur l’ensemble de l’Afrique de l’Ouest, dans le contexte d'un système d'alerte précoce de suivi des cultures à l'échelle régionale. / The modelling and simulation of spatial dynamics, particularly for studying landscape changes or environmental issues, raises the question of integrating different forms of spatial representation within the same model. Ocelet is an approach for modelling spatial dynamics based on the original concept of interaction graph. Such a graph holds both the structure of a relation between entities of a model and the semantics describing its evolution. The relationships between spatial entities are here translated into interaction graphs and these graphs are made to evolve during a simulation. The concepts on which Ocelet is based can potentially handle two known forms of spatial representation: shapes with contours (vector format) or regular grid cells (raster). The vector format is already integrated in the first version of Ocelet. The integration of raster and the combination of the two remained to be studied and carried out. The aim of the thesis is to first study the issues related to the integration of continuous fields and their representation by regular tiling, both in the Ocelet language and the concepts on which it is based. The dynamic aspects of this integration had to be taken into account and transitions between different forms of geographic data and interaction graphs had to be studied in the light of the concepts formalized. The concepts were then implemented in the Ocelet modelling platform, with the adaptation of both its compiler and runtime. Finally, these new concepts and tools were tested in three very different cases: two models on Reunion Island, the first simulating runoff in Ravine Saint Gilles watershed in the West Coast of the island, the other simulating the spread of invasive plants in the high plains inside the Reunion National Park. The last case describes the spatialisation of a crop model and is applied here to simulate the cereal crop yields in West Africa, in the context of an early warning system for regional crop monitoring.
|
214 |
De la conception d'un système d'observation à large échelle au déploiement et à l'exploitation de son système d'information : application à l'observation des habitats coralligènes et à la colonisation de récifs artificiels (ARMS) / From designing a large-scale observation system to deploying and operating its information system : application to the observation of coralligenous habitats and the colonization of artificial reefs (ARMS)David, Romain 06 July 2018 (has links)
Dans le domaine marin, des protocoles d’observation développés dans de nombreux cadres produisent un grand volume de données hétérogènes, difficiles à agréger et à utiliser. Ce travail propose i) des méthodes, protocoles et recommandations pour construire et/ou soutenir la mise en place de réseaux de suivis multi-usagers,) des utilisations novatrices des données.Deux cas d’étude ont été choisis : les habitats coralligènes à l’échelle de la Méditerranée et la colonisation de récifs artificiels dans différentes mers régionales.L’expérimentation à large échelle se base sur des méthodes de mesures les plus simples possibles, décrites très explicitement dans des termes standardisés, sur des opérateurs intercalibrés et une méthode de traitement des données. Un mécanisme de couplage de données de différentes origines reposant sur la requalification des facteurs descriptifs hétérogènes et une méthode d’analyse et de fouille de données basé sur la théorie des graphes sont proposées. / In the marine domain, observation protocols developed in many settings produce a large volume of heterogeneous data that are difficult to aggregate and use. This work proposes to develop i) methods, protocols and recommendations to build and / or support the establishment of multi-user monitoring networks, ii) innovative uses of data.Two case studies were chosen: coralligenous habitats at the Mediterranean scale and the colonisation of artificial reefs in different regional seas.Large-scale experimentation is based on the simplest possible measurement methods, described very explicitly in standardised terms, on intercalibrated operators and a method of data processing. A mechanism for coupling data from different origins based on the requalification of heterogeneous descriptive factors and a method for analysis and data mining based on graph theory is also proposed.
|
215 |
Ingénierie des connaissances pour l’épidémiologie et l’aide à la décision en santé publique : Analyse des besoins potentiels et expérimentations dans le contexte du registre français des maladies rénales / Knowledge engineering for epidemiology and decision making in public healthepidemiology : Analysis of needs and experimentations in the context of the French registry of kidney diseaseBelhadj, Ihssen 01 December 2014 (has links)
Construire des terminologies de maladies est un enjeu majeur dans le développement des systèmes d’information épidémiologiques et d’aide à la décision de santé publique qui soient efficients et durables. A partir du contexte du registre français de l'Insuffisance Rénale Terminale, une analyse des besoins de représentation des termes de maladies a été réalisée mettant en évidence le problème aigu et occulté de continuité statistique dans les bases de données et de connaissances. La « continuité terminologique » est proposée comme une réponse au besoin de continuité statistique. Une méthode générative de construction de Ressources Termino-Ontologiques a été conçue et expérimentée. Plutôt que de s’intéresser à l’ensemble des termes qui sont nécessaires pour décrire un domaine, nous nous sommes concentré uniquement sur la modélisation d'un sous ensemble de connaissances élémentaires sur les maladies. Cette méthode générative produit simultanément des termes normalisés (Nomenclature artificielle) et leur représentation sémantique/conceptuelle formelle se basant sur le formalisme des Graphes Conceptuels (GC). Les opérations de généralisation/spécialisation des GC sont utilisées pour déduire l’organisation poly-hiérarchique La continuité terminologique doit être considéré comme étant un critère majeur dans la construction de terminologies de maladies au même titre que la couverture terminologique. Les approches génératives contribuent à améliorer la continuité terminologique, car elles imposent cette contrainte de créer chaque nouveau terme sur des bases formelles avec des propriétés définitoires nécessairement sémantiquement définis dans une ontologie existante. / Expressing terms referring to pathological conceptualization is an important issue toward the development of clinical research and public health decision support systems. From the context of the French Registry of End Stage Renal Disease, requirements for disease terms representation are anlysed highlighting the acute and hidden problem of statistical continuity in disease data and knowledge representation. The underpinned assumption relies on the idea of ensuring terminological continuity through agenerative method of building Ontology Based Terminological systems. Rather than looking at all the terms that are necessary to describe a domain, we focused solely on the modeling of basic and definitional knowledge about disease. A set ontological rules for diseases hierachies were defined. Eperiments have been designed and implemented taking advantage of GC formalism and a logic programming toll called prolog-GC. The results confimed that such method allow performing two major activities that are carried out in the conventional building process of medical terminologies : refinement of disease terms granularity and consistency improvement. Terminological continuity needs to be considered as major criteria in disease terminological building. Generative approaches helps to improve the terminological continuity as imposes to create news terms of the bases of existing ones formal definitions.
|
216 |
Architecture et gestion d'un réseau continu maillé haute-tension pour l'aéronautique / Architecture and Management of a meshed HVDC electrical network for aeronautic applicationBaumann, Cédric 20 March 2009 (has links)
L'objectif de réduction de la consommation en kérosène des avions passant par une plus grande efficacité des systèmes, la distribution électrique devient un moyen privilégié pour satisfaire les besoins. Dans ce cadre, la notion d'avion « plus électrique » implique de revoir les systèmes de distribution et d'étudier, notamment, le passage en haute tension continue (HVDC). Une description générale des systèmes embarqués sur les avions civils est donnée dans ce manuscrit ainsi qu'une description des avantages et inconvénients des différents vecteurs énergétiques permettant de mieux situer les gains envisageables lors du passage à l'électrification des systèmes. Cependant, la mise en place de la distribution HVDC peut entraîner de nouveaux problèmes, notamment de qualité et/ou d'instabilité. Afin de palier ces problèmes, une architecture est proposée dans laquelle les équipements sont reliés entre eux par des coeurs de distribution eux-mêmes liés par des organes de transferts de puissances pouvant maîtriser ces transferts : on parle alors de réseau maillé. Pour pouvoir réaliser ces transferts, deux types d'équipements électroniques de puissance sont proposés : le DCPFC (Direct Current Power Flow Controler) et le MAPFC (Mixed function for Actuation and Power Flow Control). Ces équipements imposent une gestion énergétique spécifique : il faut déterminer les modes de fonctionnement des équipements ainsi que les références des puissances à transférer. Pour cela, une modélisation du réseau sous forme de graphe est effectuée, ceci se traduisant par un algorithme générique permettant de déterminer les équations structurelles du réseau ainsi que deux algorithmes servant à contrôler des grandeurs distinctes : Les grandeurs discrètes sont contrôlées par un système expert détenant un ensemble de règles de fonctionnement ; Les grandeurs continues sont gérées par un algorithme de recherche de flot dans un graphe. Après la mise en place en simulation de l'ensemble du réseau maillé, un banc d'essai expérimental valide les principes décrits théoriquement et permet l'étude de différentes gestions énergétiques (tout autant qu'il permet de tester un équipement seul ou le réseau dans une configuration non-maillée). Finalement, une exploitation des concepts sur un réseau répondant aux normes aéronautiques est développée. Ceci posant notamment des problèmes aux niveaux de la conception des équipements mais également sur l'architecture actuelle des réseaux électriques (connexion du neutre des générateurs, protection des personnes, compatibilité électromagnétique, etc.). / As the aircraft fuel consumption needs more efficient systems, electrical distribution becomes a favoured way in satisfying those needs. In this context, the “more electrical aircraft” notion implies to deeply refund distribution means. High Voltage Direct Current - HVDC - distribution helps in going this way. A general description of civil aircraft embedded systems is given in this document. Advantages and drawbacks of energetic vectors are described too, allowing a better comprehension of possible improvements due to system electrification. Therefore, the HVDC deployment can lead to new problems, particularly in quality and stability domains. In order to take into account these problems, we propose a new distribution architecture in which equipments are interconnected through power distribution centres, which ones are interconnected through power flow controller equipments. This new architecture is described as a meshed distribution network. Two kinds of equipment are proposed to control the electrical power flow: DCPFC - for Direct Current Power Flow Controller - and MAPFC - Mixed function for Actuation Power Flow Control. As a result, a specific power management is needed. Equipment operating modes and power to transfer references have to be determined. In a first step, a graph based modelling of the electrical network is done, resulting in a generic algorithm which permits to determine network structural equations. In a second step, two algorithms control the network: - Discrete quantities are regulated by an expert system based on a rule set; - Continuous quantities are managed through a flow research algorithm based on the graph modelling; The validation of these concepts is realised through electrical simulations of the whole meshed network. Then, an experimental test bench validates the theoretical principles and allows the operation of equipments and meshed network in multiple configurations. Finally, concepts are extrapolated in an electrical network respecting aeronautic constraints. Those constraints are highlighted at equipment level and network level.
|
217 |
Cross-model queries and schemas : complexity and learning / Requêtes et schémas hétérogènes : complexité et apprentissageCiucanu, Radu 01 July 2015 (has links)
La spécification de requêtes est généralement une tâche difficile pour les utilisateurs non-experts. Le problème devient encore plus difficile quand les utilisateurs ont besoin d'interroger des bases de données de grande taille et donc difficiles à visualiser. Le schéma pourrait aider à cette spécification, mais celui-ci manque souvent ou est incomplet quand les données viennent de sources hétérogènes. Dans cette thèse, nous abordons le problème de la spécification de requêtes pour les utilisateurs non-experts. Nous identifions deux approches pour attaquer ce problème : apprendre les requêtes à partir d'exemples ou transformer les données dans un format plus facilement interrogeable par l'utilisateur. Nos contributions suivent ces deux directions et concernent trois modèles de données parmi les plus populaires : XML, relationnel et orienté graphe. Cette thèse comprend deux parties, consacrées à (i) la définition et la transformation de schémas, et (ii) l'apprentissage de schémas et de requêtes. Dans la première partie, nous définissons des formalismes de schémas pour les documents XML non-ordonnés et nous analysons leurs propriétés computationnelles; nous étudions également la complexité du problème d'échange de données entre une source relationnelle et une cible orientée graphe. Dans la deuxième partie, nous étudions le problème de l'apprentissage à partir d'exemples pour les schémas XML proposés dans la première partie, ainsi que pour les requêtes de jointures relationnelles et les requêtes de chemins sur les graphes. Nous proposons notamment un scénario interactif qui permet d'aider des utilisateurs non-experts à définir des requêtes dans ces deux classes. / Specifying a database query using a formal query language is typically a challenging task for non-expert users. In the context of big data, this problem becomes even harder because it requires the users to deal with database instances of large size and hence difficult to visualize. Such instances usually lack a schema to help the users specify their queries, or have an incomplete schema as they come from disparate data sources. In this thesis, we address the problem of query specification for non-expert users. We identify two possible approaches for tackling this problem: learning queries from examples and translating the data in a format that the user finds easier to query. Our contributions are aligned with these two complementary directions and span over three of the most popular data models: XML, relational, and graph. This thesis consists of two parts, dedicated to (i) schema definition and translation, and to (ii) learning schemas and queries. In the first part, we define schema formalisms for unordered XML and we analyze their computational properties; we also study the complexity of the data exchange problem in the setting of a relational source and a graph target database. In the second part, we investigate the problem of learning from examples the schemas for unordered XML proposed in the first part, as well as relational join queries and path queries on graph databases. The interactive scenario that we propose for these two classes of queries is immediately applicable to assisting non-expert users in the process of query specification.
|
218 |
Etude de la connectivité fonctionnelle dans les pathologies de mouvement de Parkinson et de Huntington en utilisant l’approche par graine et la théorie des graphes / Functional connectivity study in Parkinson's and Huntington diseases using the seed based analysis and graph theoryGargouri, Fatma 14 December 2017 (has links)
L’imagerie par résonance magnétique fonctionnelle permet d’explorer l’activité neuronale en utilisant un contraste endogène appelé BOLD. Il a été montré que les fluctuations du signal BOLD au repos corrélaient dans des régions cérébrales distantes. C’est la connectivité fonctionnelle. Elle représente l’activité spontanée du cerveau et elle est mesurée par l’IRMf au repos. Notre projet de recherche a donc combiné un aspect méthodologique et deux applications dans le domaine des pathologies du mouvement. Nous avons étudié les stratégies de prétraitement des données. L'objectif était d'étudier l'influence du type de prétraitement ainsi que leur ordre d'application sur l'optimisation de la topologie des réseaux cérébraux. Nous avons comparé 12 stratégies différentes de prétraitement. Dans ces stratégies nous avons appliqué les techniques standards avec un ordre d'application différent. Les deux études suivantes ont utilisé l'IRMf au repos pour étudier la physiopathologie de deux pathologies du mouvement : la maladie de Huntington et la maladie de Parkinson. Dans ces pathologies, nous nous sommes centrés sur l'étude des réseaux cérébraux grâce à l'étude de la connectivité fonctionnelle. Nous avons déterminé si l'IRMf au repos et les mesures de la théorie des graphes permettaient d'identifier des biomarqueurs robustes de l'évolution de la maladie de Huntington dans une étude longitudinale. Ensuite, nous avons étudié le rôle des noyaux cholinergiques du cerveau basal antérieur et de leurs connexions dans la survenue des troubles cognitifs présentés par les patients atteints de maladie de Parkinson. L'approche par graine est une méthode adaptée à ce type de question. / Functional magnetic resonance imaging (fMRI) is a technique that allows exploring neuronal activity using an endogenous contrast based on the oxygenation level of hemoglobin. This contrast is called BOLD (Blood oxygenated Level Dependent). It has been shown that fluctuations in the BOLD signal at rest, correlated in distant brain regions, defining long-distance brain functional networks. This is called functional connectivity. The latter represents the spontaneous activity of the brain and it is measured by fMRI at rest. Our research project has therefore combined a methodological aspect and two applications in the field of movement pathologies. In the first part of our project we studied data preprocessing strategies. The objective was to study the influence of the preprocessing steps and their order of application on the brain networks’ topology. We compared 12 different pretreatment strategies. In these strategies we applied the standard and most used techniques but with a different order of application. The following two studies used resting-state fMRI to study: Huntington's disease and Parkinson's disease. In these pathologies, we focused on the study of the brain networks addressed through the study of functional connectivity. We determined whether resting-state fMRI and graph theory measures were able to identify robust biomarkers of Huntington's disease progression in a longitudinal study. In the second study, we investigated the role of cholinergic basal nuclei of the forebrain and their connections in the onset of cognitive problems presented in Parkinson's disease. The seed-based analysis is a suitable method for this type of question.
|
219 |
Cellular matrix for parallel k-means and local search to Euclidean grid matching / Matrice cellulaire pour des algorithmes parallèles de k-means et de recherche locale appliqués à des problèmes euclidiens d’appariement de graphesWang, Hongjian 03 December 2015 (has links)
Dans cette thèse, nous proposons un modèle de calcul parallèle, appelé « matrice cellulaire », pour apporter des réponses aux problématiques de calcul parallèle appliqué à la résolution de problèmes d’appariement de graphes euclidiens. Ces problèmes d’optimisation NP-difficiles font intervenir des données réparties dans le plan et des structures élastiques représentées par des graphes qui doivent s’apparier aux données. Ils recouvrent des problèmes connus sous des appellations diverses telles que geometric k-means, elastic net, topographic mapping, elastic image matching. Ils permettent de modéliser par exemple le problème du voyageur de commerce euclidien, le problème du cycle médian, ainsi que des problèmes de mise en correspondance d’images. La contribution présentée est divisée en trois parties. Dans la première partie, nous présentons le modèle de matrice cellulaire qui partitionne les données et définit le niveau de granularité du calcul parallèle. Nous présentons une boucle générique de calcul parallèle qui modélise le principe des projections de graphes et de leur appariement. Dans la deuxième partie, nous appliquons le modèle de calcul parallèle aux algorithmes de k-means avec topologie dans le plan. Les algorithmes proposés sont appliqués au voyageur de commerce, à la génération de maillage structuré et à la segmentation d'image suivant le concept de superpixel. L’approche est nommée superpixel adaptive segmentation map (SPASM). Dans la troisième partie, nous proposons un algorithme de recherche locale parallèle, appelé distributed local search (DLS). La solution du problème résulte des opérations locales sur les structures et les données réparties dans le plan, incluant des évaluations, des recherches de voisinage, et des mouvements structurés. L’algorithme est appliqué à des problèmes d’appariement de graphe tels que le stéréo-matching et le problème de flot optique. / In this thesis, we propose a parallel computing model, called cellular matrix, to provide answers to problematic issues of parallel computation when applied to Euclidean graph matching problems. These NP-hard optimization problems involve data distributed in the plane and elastic structures represented by graphs that must match the data. They include problems known under various names, such as geometric k-means, elastic net, topographic mapping, and elastic image matching. The Euclidean traveling salesman problem (TSP), the median cycle problem, and the image matching problem are also examples that can be modeled by graph matching. The contribution presented is divided into three parts. In the first part, we present the cellular matrix model that partitions data and defines the level of granularity of parallel computation. We present a generic loop for parallel computations, and this loop models the projection between graphs and their matching. In the second part, we apply the parallel computing model to k-means algorithms in the plane extended with topology. The proposed algorithms are applied to the TSP, structured mesh generation, and image segmentation following the concept of superpixel. The approach is called superpixel adaptive segmentation map (SPASM). In the third part, we propose a parallel local search algorithm, called distributed local search (DLS). The solution results from the many local operations, including local evaluation, neighborhood search, and structured move, performed on the distributed data in the plane. The algorithm is applied to Euclidean graph matching problems including stereo matching and optical flow.
|
220 |
Graph based transforms for compression of new imaging modalities / Transformées basées graphes pour la compression de nouvelles modalités d’imageRizkallah, Mira 26 April 2019 (has links)
En raison de la grande disponibilité de nouveaux types de caméras capturant des informations géométriques supplémentaires, ainsi que de l'émergence de nouvelles modalités d'image telles que les champs de lumière et les images omnidirectionnelles, il est nécessaire de stocker et de diffuser une quantité énorme de hautes dimensions. Les exigences croissantes en matière de streaming et de stockage de ces nouvelles modalités d’image nécessitent de nouveaux outils de codage d’images exploitant la structure complexe de ces données. Cette thèse a pour but d'explorer de nouvelles approches basées sur les graphes pour adapter les techniques de codage de transformées d'image aux types de données émergents où les informations échantillonnées reposent sur des structures irrégulières. Dans une première contribution, de nouvelles transformées basées sur des graphes locaux sont conçues pour des représentations compactes des champs de lumière. En tirant parti d’une conception minutieuse des supports de transformées locaux et d’une procédure d’optimisation locale des fonctions de base , il est possible d’améliorer considérablement le compaction d'énergie. Néanmoins, la localisation des supports ne permettait pas d'exploiter les dépendances à long terme du signal. Cela a conduit à une deuxième contribution où différentes stratégies d'échantillonnage sont étudiées. Couplés à de nouvelles méthodes de prédiction, ils ont conduit à des résultats très importants en ce qui concerne la compression quasi sans perte de champs de lumière statiques. La troisième partie de la thèse porte sur la définition de sous-graphes optimisés en distorsion de débit pour le codage de contenu omnidirectionnel. Si nous allons plus loin et donnons plus de liberté aux graphes que nous souhaitons utiliser, nous pouvons apprendre ou définir un modèle (ensemble de poids sur les arêtes) qui pourrait ne pas être entièrement fiable pour la conception de transformées. La dernière partie de la thèse est consacrée à l'analyse théorique de l'effet de l'incertitude sur l'efficacité des transformées basées graphes. / Due to the large availability of new camera types capturing extra geometrical information, as well as the emergence of new image modalities such as light fields and omni-directional images, a huge amount of high dimensional data has to be stored and delivered. The ever growing streaming and storage requirements of these new image modalities require novel image coding tools that exploit the complex structure of those data. This thesis aims at exploring novel graph based approaches for adapting traditional image transform coding techniques to the emerging data types where the sampled information are lying on irregular structures. In a first contribution, novel local graph based transforms are designed for light field compact representations. By leveraging a careful design of local transform supports and a local basis functions optimization procedure, significant improvements in terms of energy compaction can be obtained. Nevertheless, the locality of the supports did not permit to exploit long term dependencies of the signal. This led to a second contribution where different sampling strategies are investigated. Coupled with novel prediction methods, they led to very prominent results for quasi-lossless compression of light fields. The third part of the thesis focuses on the definition of rate-distortion optimized sub-graphs for the coding of omni-directional content. If we move further and give more degree of freedom to the graphs we wish to use, we can learn or define a model (set of weights on the edges) that might not be entirely reliable for transform design. The last part of the thesis is dedicated to theoretically analyze the effect of the uncertainty on the efficiency of the graph transforms.
|
Page generated in 0.0335 seconds