• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 133
  • 91
  • 53
  • Tagged with
  • 269
  • 147
  • 116
  • 101
  • 82
  • 60
  • 53
  • 45
  • 45
  • 40
  • 37
  • 36
  • 33
  • 33
  • 32
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Étude quantitative de processus de Markov déterministes par morceaux issus de la modélisation / Quantitative study of piecewise deterministic Markov processes arising in modelization

Bouguet, Florian 29 June 2016 (has links)
L'objet de cette thèse est d'étudier une certaine classe de processus de Markov, dits déterministes par morceaux, ayant de très nombreuses applications en modélisation. Plus précisément, nous nous intéresserons à leur comportement en temps long et à leur vitesse de convergence à l'équilibre lorsqu'ils admettent une mesure de probabilité stationnaire. L'un des axes principaux de ce manuscrit de thèse est l'obtention de bornes quantitatives fines sur cette vitesse, obtenues principalement à l'aide de méthodes de couplage. Le lien sera régulièrement fait avec d'autres domaines des mathématiques dans lesquels l'étude de ces processus est utile, comme les équations aux dérivées partielles. Le dernier chapitre de cette thèse est consacré à l'introduction d'une approche unifiée fournissant des théorèmes limites fonctionnels pour étudier le comportement en temps long de chaînes de Markov inhomogènes, à l'aide de la notion de pseudo-trajectoire asymptotique. / The purpose of this Ph.D. thesis is the study of piecewise deterministic Markov processes, which are often used for modeling many natural phenomena. Precisely, we shall focus on their long time behavior as well as their speed of convergence to equilibrium, whenever they possess a stationary probability measure. Providing sharp quantitative bounds for this speed of convergence is one of the main orientations of this manuscript, which will usually be done through coupling methods. We shall emphasize the link between Markov processes and mathematical fields of research where they may be of interest, such as partial differential equations. The last chapter of this thesis is devoted to the introduction of a unified approach to study the long time behavior of inhomogeneous Markov chains, which can provide functional limit theorems with the help of asymptotic pseudotrajectories.
52

Évolution de l’architecture des génomes : modélisation et reconstruction phylogénétique / Evolution of the architecture of genomes : modelling and phylogenetic reconstruction

Semeria, Magali 09 December 2015 (has links)
L'évolution des génomes peut être observée à plusieurs échelles, chaque échelle révélant des processus évolutifs différents. A l'échelle de séquences ADN, il s'agit d'insertions, délétions et substitutions de nucléotides. Si l'on s'intéresse aux gènes composant les génomes, il s'agit de duplications, pertes et transferts horizontaux de gènes. Et à plus large échelle, on observe des réarrangements chromosomiques modifiant l'agencement des gènes sur les chromosomes. Reconstruire l'histoire évolutive des génomes implique donc de comprendre et de modéliser tous les processus à l'œuvre, ce qui reste hors de notre portée. A la place, les efforts de modélisation ont exploré deux directions principales. D'un côté, les méthodes de reconstruction phylogénétique se sont concentrées sur l'évolution des séquences, certaines intégrant l'évolution des familles de gènes. D'un autre côté, les réarrangements chromosomiques ont été très largement étudiés, donnant naissance à de nombreux modèles d'évolution de l'architecture des génomes. Ces deux voies de modélisation se sont rarement rencontrées jusqu'à récemment. Au cours de ma thèse, j'ai développé un modèle d'évolution de l'architecture des génomes prenant en compte l'évolution des gènes et des séquences. Ce modèle rend possible une reconstruction probabiliste de l'histoire évolutive d'adjacences et de l'ordre des gènes de génomes ancestraux en tenant compte à la fois d'évènements modifiant le contenu en gènes des génomes (duplications et pertes de gènes), et d'évènements modifiant l'architecture des génomes (les réarrangements chromosomiques). Intégrer l'information phylogénétique à la reconstruction d'ordres des gènes permet de reconstruire des histoires évolutives plus complètes. Inversement, la reconstruction d'ordres des gènes ancestraux peut aussi apporter une information complémentaire à la phylogénie et peut être utilisée comme un critère pour évaluer la qualité d'arbres de gènes, ouvrant la voie à un modèle et une reconstruction intégrative / Genomes evolve through processes that modify their content and organization at different scales, ranging from the substitution, insertion or deletion of a single nucleotide to the duplication, loss or transfer of a gene and to large scale chromosomal rearrangements. Extant genomes are the result of a combination of many such processes, which makes it difficult to reconstruct the overall picture of genome evolution. As a result, most models and methods focus on one scale and use only one kind of data, such as gene orders or sequence alignments. Most phylogenetic reconstruction methods focus on the evolution of sequences. Recently, some of these methods have been extended to integrate gene family evolution. Chromosomal rearrangements have also been extensively studied, leading to the development of many models for the evolution of the architecture of genomes. These two ways to model genome evolution have not exchanged much so far, mainly because of computational issues. In this thesis, I present a new model of evolution for the architecture of genomes that accounts for the evolution of gene families. With this model, one can reconstruct the evolutionary history of gene adjacencies and gene order accounting for events that modify the gene content of genomes (duplications and losses of genes) and for events that modify the architecture of genomes (chromosomal rearrangements). Integrating these two types of information in a single model yields more accurate evolutionary histories. Moreover, we show that reconstructing ancestral gene orders can provide feedback on the quality of gene trees thus paving the way for an integrative model and reconstruction method
53

Equations différentielles stochastiques rétrogrades ergodiques et applications aux EDP / Ergodic backward stochastic differential equations and their applications to PDE

Madec, Pierre-Yves 30 June 2015 (has links)
Cette thèse s'intéresse à l'étude des EDSR ergodiques et à leurs applications à l'étude du comportement en temps long des solutions d'EDP paraboliques semi-linéaires. Dans un premier temps, nous établissons des résultats d'existence et d'unicité d'une EDSR ergodique avec conditions de Neumann au bord dans un convexe non borné et dans un environnement faiblement dissipatif. Nous étudions ensuite leur lien avec les EDP avec conditions de Neumann au bord et nous donnons un exemple d'application à un problème de contrôle optimal stochastique. La deuxième partie est constituée de deux sous-parties. Tout d'abord, nous étudions le comportement en temps long des solutions mild d'une EDP parabolique semi-linéaire en dimension infinie par des méthodes probabilistes. Cette méthode probabiliste repose sur une application d'un résultat nommé "Basic coupling estimate" qui nous permet d'obtenir une vitesse de convergence exponentielle de la solution vers sons asymptote. Au passage notons que cette asymptote est entièrement déterminée par la solution de l'EDP ergodique semi-linéaire associée à l'EDP parabolique semi-linéaire initiale. Puis, nous adaptons cette méthode à l'étude du comportement en temps long des solutions de viscosité d'une EDP parabolique semi-linéaire avec condition de Neumann au bord dans un convexe borné en dimension finie. Par des méthodes de régularisation et de pénalisation des coefficients et en utilisant un résultat de stabilité pour les EDSR, nous obtenons des résultats analogues à ceux obtenus dans le contexte mild, avec notamment une vitesse exponentielle de convergence de la solution vers son asymptote. / This thesis deals with the study of ergodic BSDE and their applications to the study of the large time behaviour of solutions to semilinear parabolic PDE. In a first time, we establish some existence and uniqueness results to an ergodic BSDE with Neumann boundary conditions in an unbounded convex set in a weakly dissipative environment. Then we study their link with PDE with Neumann boundary condition and we give an application to an ergodic stochastic control problem. The second part consists of two sections. In the first one, we study the large time bahaviour of mild solutions to semilinear parabolic PDE in infinite dimension by a probabilistic method. This probabilistic method relies on a Basic coupling estimate result which gives us an exponential rate of convergence of the solution toward its asymptote. Let us mention that that this asymptote is fully determined by the solution of the ergodic semilinear PDE associated to the parabolic semilinear PDE. Then, we adapt this method to the sudy of the large time behaviour of viscosity solutions of semilinear parabolic PDE with Neumann boundary condition in a convex and bounded set in finite dimension. By regularization and penalization procedures, we obtain similar results as those obtained in the mild context, especially with an exponential rate of convergence for the solution toward its asymptote.
54

Prise en compte des incertitudes et calcul de probabilité dans les études de risques liés au sol et au sous-sol / Uncertainties and probabilities in risk management of ground and underground issues

Cauvin, Maxime 20 December 2007 (has links)
L’analyse des risques liés aux objets rocheux (effondrement ou affaissement de terrain, écroulement de falaise, etc.) s’effectue généralement dans un contexte lourd en incertitudes. Malheureusement, les outils dont dispose aujourd’hui l’expert pour réaliser ses études souffrent de ne pouvoir apporter de solutions suffisamment précises pour réellement saisir ce contexte d’incertitude. Ce mémoire effectue d’abord un retour sur la notion d’incertitude dans les études de risques liés au sol et au sous-sol. Une définition et une typologie détaillée en sont proposées et des outils, issus de la littérature ou développés dans le cadre de la thèse, sont fournis pour permettre un traitement pratique de chacune des classes introduites. L’utilisation des probabilités comme outil d’aide à la prise en compte des incertitudes est ensuite examinée. Une discussion, confrontant les approches fréquentiste et épistémique, est proposée pour évaluer la possibilité et les limites d’une interprétation opérationnelle de résultats probabilistes dans une analyse de risque. Ce travail est principalement destiné à l’expert du terrain réalisant une étude de risque. Ainsi, plusieurs exemples réels (analyse de la stabilité d’une mine de charbon, étude de l’aléa fontis au droit d’une carrière souterraine de gypse, réalisation d’un Plan de Prévention des Risques Miniers) sont proposés pour éclairer les propos, illustrer l’adaptabilité des outils introduits aux méthodologies actuelles, et présenter les avantages concrets que le traitement des incertitudes et le calcul probabiliste peuvent apporter en terme d’aide à la démarche d’expertise et à la communication entre les acteurs de la gestion du risque / Analyses of risks related to ground and underground issues (surface collapses, subsidence, rockfalls, etc.) are generally undertaken in a strong context of uncertainty. However, tools that are available for geotechnical expert to carry out his study suffer today from not being able to really seize this context of uncertainty. This work takes firstly stock of the notion of uncertainty in risk analyses. It provides a definition and a typology of uncertainty that can be concretely used by the expert. For each of the defined classes, methods allowing an operational treatment of uncertainties are presented, either extracted from a literature survey or developed in the framework of the Thesis. The use of probabilities as an expertise-help tool is secondly examined. A discussion, which distinguishes between frequentist and epistemic interpretations of probabilities, is proposed to evaluate the benefits and implications that probabilities can have towards the practical elaboration of a risk analysis. This study is mainly dedicated to the field expert in charge of the analysis. Numerous concrete examples (analysis of surface stability above an underground coal mine, sinkhole development analysis over an underground gypsum mine, elaboration of a Mining Risk Prevention Plan) are therefore provided both to present the main results of the work and to illustrate the adaptability of the tools being introduced to the current methodologies of analysis. They also aim at highlighting the fact that the treatment of uncertainties and the use of probabilities in risk analyses can facilitate the process of expertise and allow a better communication between the various actors of risk management
55

Questions de localisabilité pour le calcul distribué / On localisability with applications to distributed computing

Kachigar, Ghazal 10 December 2019 (has links)
Cette thèse suit un plan à deux parties. Le point de départ en est la notion de résistance à la localisation, qui est importante en calcul distribué quantique.Dans la première partie, qui est plutôt théorique, nous retraçons l’historique de certaines notions et résultats en information quantique et en calcul distribué, plus précisément le phénomène d’intrication et la condition non-signalling en information quantique et le modèle LOCAL et le problème de coloration en calcul distribué. Ensuite, nous évoquons le modèle φ-LOCAL, développé en 2009 comme adaptation de la condition non-signalling au modèle LOCAL dans le but d’étudier l’existence d’algorithmes distribués quantiques. Finalement, nous soulignons quelques limites du modèle φ-LOCAL à l’aide des notions de consistance globale et de consistance locale, et nous présentons une version plus adéquate de ce modèle.La deuxième partie comporte les principaux résultats techniques obtenus au cours de cette thèse dans le domaine de la théorie des probabilités. Nous introduisons la notion de k-localisabilité qui est une traduction probabiliste du modèle φ-LOCAL. Nous montrons en quoi cette notion est proche, mais plus faible, que la notion de k-dépendance, largement étudiée dans la littérature probabiliste. Nous évoquons des résultats récents autour de la coloration 1-dépendante du chemin qui permettent de conclure au sujet de la coloration 1-localisable du chemin : elle est possible dès qu’il y a plus de quatre couleurs. Dans la suite, nous traitons la question de la possibilité de la coloration 1-localisable du chemin à l’aide de trois couleurs : nous verrons qu’elle n’est pas possible. Pour répondre à cette question, nous avons eu recours à la programmation linéaire et à la combinatoire : en particulier, nous démontrons un théorème qui donne la solution explicite d’un programme linéaire ayant une forme particulière, ainsi qu’une formule pour les nombres de Catalan. / This thesis is divided in two parts. Its starting point is the concept of resistance to localisation, an important concept in distributed quantum computing.In the first, theoretical part of this thesis, we go over the history of certain concepts and results in quantum information theory and distributed computing, such as the phenomenon of entanglement and the non-signalling condition in the first domain, and the LOCAL model and the colouring problem in the second domain. We then focus on the φ-LOCAL model, whose goal is to study the possibility of quantum distributed algorithms, and which was developedin 2009 by adapting the non-signalling condition to the LOCAL model. We introduce the concepts of global and local consistency in order to emphasise some shortcomings of this model. Finally, we present a more adequate version ofthe φ-LOCAL model.The second part of this thesis contains our major technical results in probability theory. We define the concept of k-localisability which is a probabilistic translation of the φ-LOCAL model. We show that this concept is close to but weaker than the concept of k-dependence which is well-studied in the probabilistic literature. We mention recent results concerning 1-dependent colouring of the path graph and the conclusion they allow us to reach with regards to 1-localisable colouring of the path graph : that it is possible with four or more colours. The rest of this part is dedicated to answering the question of the possibility of 1-localisable colouring of the path graph using three colours which we will show to be impossible. In answering this question we have made use of methods in linear programming and combinatorics. In particular, we prove a theorem on the explicit solution of a linear programming problem having a certain form, and a formula for the Catalan numbers.
56

Une promenade aléatoire entre combinatoire et mécanique statistique / A random hike between combinatorics and statistical mechanics

Huynh, Cong Bang 27 June 2019 (has links)
Cette thèse se situe à l'interface entre combinatoire et probabilités,et contribue à l'étude de différents modèles issus de la mécanique statistique : polymères, marches aléatoires inter-agissantes ou en milieu aléatoire, cartes aléatoires. Le premier modèle que nous étudions est une famille de mesures de probabilités sur les chemins auto-évitants de longueur infinie sur un réseau régulier, construites à partir de marches aléatoires biaisées sur l'arbre des chemins auto-évitants finis. Ces mesures, introduites par Beretti et Sokal, existent pour tout biais strictement supérieur à l'inverse de la constante de connectivité, et leur limite en ce biais critique serait l'un des définitions naturelles de la marche aléatoire uniforme en longueur infinie. Le but de ce travail, en collaboration avec Vincent Beffara, est de comprendre le lien entre cette limite, si elle existe, et d'autres chemins aléatoires notamment la mesure de Kesten (qui est la limite faible de la marche auto-évitante uniforme dans le demi-plan) et les interfaces de percolation de Bernoulli critique; d'une certaine façon le modèle constitue une interpolation entre les deux. Dans une deuxième partie, nous considérons des marches aléatoires en conductances aléatoires sur un arbre quelconque, dans le cas où la loi des conductances est à queue lourde. L’objectif de notre travail, en collaboration avec Andrea Collevecchio et Daniel Kious, est de montrer une transition de phase par rapport au paramètre de la queue; on exprime le paramètre critique comme une fonction explicite de l'arbre sous-jacent. Parallèlement, nous étudions des modèles de marches aléatoires excitées sur des arbres et leurs transitions de phase. En particulier, nous étendons une conjecture de Volkov et généralisons des résultats de Bas devant et Singh. Enfin, une troisième partie en collaboration avec Vincent Beffara et Benjamin Lévêque porte sur les cartes aléatoires en genre supérieur : nous montrons l'existence de limites d'échelle, le long de sous-suites, pour les triangulations simples uniformes sur le tore, étendant à ce cas les résultats d'Adario-Berri et Albenque (sur les triangulations simples de la sphère) et de Bettinelli (sur les quadrangulations du tore). La question de l'unicité de la limite et de son universalité restent ouvertes, mais nous obtenons des résultats partiels dans ce sens. / This thesis is at the interface between combinatorics and probability,and contributes to the study of a few models stemming from statisticalmechanics: polymers, self-interacting random walks and random walks inrandom environment, random maps.bigskipThe first model that we investigate is a one-parameter family ofprobability measures on self-avoiding paths of infinite length on aregular lattice, constructed from biased random walks on the tree offinite self-avoiding paths. These measures, initially introduced byBeretti and Sokal, exist for every bias larger than the inverseconnectivity constant, and their limit at the critical bias would beaamong the natural definitions of the uniform self-avoiding walk ofinfinite length. The aim of our work, in collaboration with VincentBeffara, is to understand the link between this limit, if it indeedexists, and other random infinite paths such as Kesten's measure(which is the weak limit of uniformly random finite self-avoidingwalks in the half-plane) and critical Bernoulli percolationinterfaces; the model can be seen as an interpolation between thesetwo.In a second part, we consider random walks with random conductances ona tree, in the case when the law of the conductances has heavy tail.Our aim, in collabration with Andrea Collevecchio and Daniel Kious, isto show a phase transition in the tail parameter; we express thecritical point as an explicit function of the underlying tree.In parallel, we study excited random walks on trees and their phasetransitions: we extend a conjecture of Volkov's and generalize resultsby Basdevant and Singh.Finally, a third part in collaboration with Vincent Beffara andBenjamin Lévêque contributes to the study of random maps of highergenus: we show the existence of subsequential scaling limits foruniformly random simple triangulations of the torus, extending to thatsetup fromer results by Adario-Berri and Albenque (on simpletriangulations of the sphere) and by Bettinelli (on quadrangulationsof the torus). The question of uniqueness and universality of thelimit remain open, but we obtain partial results in that direction.
57

Tirer parti de la structure des données incertaines / Leveraging the structure of uncertain data

Amarilli, Antoine 14 March 2016 (has links)
La gestion des données incertaines peut devenir infaisable, dans le cas des bases de données probabilistes, ou même indécidable, dans le cas du raisonnement en monde ouvert sous des contraintes logiques. Cette thèse étudie comment pallier ces problèmes en limitant la structure des données incertaines et des règles. La première contribution présentée s'intéresse aux conditions qui permettent d'assurer la faisabilité de l'évaluation de requêtes et du calcul de lignage sur les instances relationnelles probabilistes. Nous montrons que ces tâches sont faisables, pour diverses représentations de la provenance et des probabilités, quand la largeur d'arbre des instances est bornée. Réciproquement, sous des hypothèses faibles, nous pouvons montrer leur infaisabilité pour toute autre condition imposée sur les instances. La seconde contribution concerne l'évaluation de requêtes sur des données incomplètes et sous des contraintes logiques, sous l'hypothèse de finitude généralement supposée en théorie des bases de données. Nous montrons la décidabilité de cette tâche pour les dépendances d'inclusion unaires et les dépendances fonctionnelles. Ceci constitue le premier résultat positif, sous l'hypothèse de la finitude, pour la réponse aux requêtes en monde ouvert avec un langage d'arité arbitraire qui propose à la fois des contraintes d'intégrité référentielle et des contraintes de cardinalité. / The management of data uncertainty can lead to intractability, in the case of probabilistic databases, or even undecidability, in the case of open-world reasoning under logical rules. My thesis studies how to mitigate these problems by restricting the structure of uncertain data and rules. My first contribution investigates conditions on probabilistic relational instances that ensure the tractability of query evaluation and lineage computation. I show that these tasks are tractable when we bound the treewidth of instances, for various probabilistic frameworks and provenance representations. Conversely, I show intractability under mild assumptions for any other condition on instances. The second contribution concerns query evaluation on incomplete data under logical rules, and under the finiteness assumption usually made in database theory. I show that this task is decidable for unary inclusion dependencies and functional dependencies. This establishes the first positive result for finite open-world query answering on an arbitrary-arity language featuring both referential constraints and number restrictions.
58

Modélisation de performance des caches basée sur l'analyse de données / A Data Driven Approach for Cache Performance Modeling

Olmos Marchant, Luis Felipe 30 May 2016 (has links)
L’Internet d’aujourd’hui a une charge de trafic de plus en plus forte à cause de la prolifération des sites de vidéo, notamment YouTube. Les serveurs Cache jouent un rôle clé pour faire face à cette demande qui croît vertigineusement. Ces serveurs sont déployés à proximité de l’utilisateur, et ils gardent dynamiquement les contenus les plus populaires via des algorithmes en ligne connus comme « politiques de cache ». Avec cette infrastructure les fournisseurs de contenu peuvent satisfaire la demande de façon efficace, en réduisant l’utilisation des ressources de réseau. Les serveurs Cache sont les briques basiques des Content Delivery Networks (CDNs), que selon Cisco fourniraient plus de 70% du trafic de vidéo en 2019.Donc, d’un point de vue opérationnel, il est très important de pouvoir estimer l’efficacité d’un serveur Cache selon la politique employée et la capacité. De manière plus spécifique, dans cette thèse nous traitons la question suivante : Combien, au minimum, doit-on investir sur un serveur cache pour avoir un niveau de performance donné?Produit d’une modélisation qui ne tient pas compte de la façon dont le catalogue de contenus évolue dans le temps, l’état de l’art de la recherche fournissait des réponses inexactes à la dernière question.Dans nos travaux, nous proposons des nouveaux modèles stochastiques, basés sur les processus ponctuels, qui permettent d’incorporer la dynamique du catalogue dans l’analyse de performance. Dans ce cadre, nous avons développé une analyse asymptotique rigoureuse pour l’estimation de la performance d’un serveur Cache pour la politique « Least Recently Used » (LRU). Nous avons validé les estimations théoriques avec longues traces de trafic Internet en proposant une méthode de maximum de vraisemblance pour l’estimation des paramètres du modèle. / The need to distribute massive quantities of multimedia content to multiple users has increased tremendously in the last decade. The current solution to this ever-growing demand are Content Delivery Networks, an application layer architecture that handle nowadays the majority of multimedia traffic. This distribution problem has also motivated the study of new solutions such as the Information Centric Networking paradigm, whose aim is to add content delivery capabilities to the network layer by decoupling data from its location. In both architectures, cache servers play a key role, allowing efficient use of network resources for content delivery. As a consequence, the study of cache performance evaluation techniques has found a new momentum in recent years.In this dissertation, we propose a framework for the performance modeling of a cache ruled by the Least Recently Used (LRU) discipline. Our framework is data-driven since, in addition to the usual mathematical analysis, we address two additional data-related problems: The first is to propose a model that a priori is both simple and representative of the essential features of the measured traffic; the second, is the estimation of the model parameters starting from traffic traces. The contributions of this thesis concerns each of the above tasks.In particular, for our first contribution, we propose a parsimonious traffic model featuring a document catalog evolving in time. We achieve this by allowing each document to be available for a limited (random) period of time. To make a sensible proposal, we apply the "semi-experimental" method to real data. These "semi-experiments" consist in two phases: first, we randomize the traffic trace to break specific dependence structures in the request sequence; secondly, we perform a simulation of an LRU cache with the randomized request sequence as input. For candidate model, we refute an independence hypothesis if the resulting hit probability curve differs significantly from the one obtained from original trace. With the insights obtained, we propose a traffic model based on the so-called Poisson cluster point processes.Our second contribution is a theoretical estimation of the cache hit probability for a generalization of the latter model. For this objective, we use the Palm distribution of the model to set up a probability space whereby a document can be singled out for the analysis. In this setting, we then obtain an integral formula for the average number of misses. Finally, by means of a scaling of system parameters, we obtain for the latter expression an asymptotic expansion for large cache size. This expansion quantifies the error of a widely used heuristic in literature known as the "Che approximation", thus justifying and extending it in the process.Our last contribution concerns the estimation of the model parameters. We tackle this problem for the simpler and widely used Independent Reference Model. By considering its parameter (a popularity distribution) to be a random sample, we implement a Maximum Likelihood method to estimate it. This method allows us to seamlessly handle the censor phenomena occurring in traces. By measuring the cache performance obtained with the resulting model, we show that this method provides a more representative model of data than typical ad-hoc methodologies.
59

Combined complexity of probabilistic query evaluation / Complexité combinée de l'évaluation de requêtes sur des données probabilistes

Monet, Mikaël 12 October 2018 (has links)
L'évaluation de requêtes sur des données probabilistes(probabilistic query evaluation, ou PQE) est généralement très coûteuse enressources et ce même à requête fixée. Bien que certaines restrictions sur les requêtes et les données aient été proposées pour en diminuerla complexité, les résultats existants ne s'appliquent pas à la complexité combinée, c'est-à-dire quand la requête n'est pas fixe.Ma thèse s'intéresse à la question de déterminer pour quelles requêtes et données l'évaluation probabiliste est faisable en complexité combinée.La première contribution de cette thèse est d'étudier PQE pour des requêtes conjonctives sur des schémas d'arité 2. Nous imposons que les requêtes et les données aient la forme d'arbres et montrons l'importance de diverses caractéristiques telles que la présence d'étiquettes sur les arêtes, les bifurcations ou la connectivité.Les restrictions imposées dans ce cadre sont assez sévères, mais la deuxième contribution de cette thèse montreque si l'on est prêts à augmenter la complexité en la requête, alors il devient possible d'évaluer un langage de requête plus expressif sur des données plus générales. Plus précisément, nous montrons que l'évaluation probabiliste d'un fragment particulier de Datalog sur des données de largeur d'arbre bornée peut s'effectuer en temps linéaire en les donnéeset doublement exponentiel en la requête. Ce résultat est prouvé en utilisant des techniques d'automatesd'arbres et de compilation de connaissances. La troisième contribution de ce travail est de montrer les limites de certaines de ces techniques, en prouvant desbornes inférieures générales sur la taille de formalismes de représentation utilisés en compilation de connaissances et en théorie des automates. / Query evaluation over probabilistic databases (probabilistic queryevaluation, or PQE) is known to be intractable inmany cases, even in data complexity, i.e., when the query is fixed. Althoughsome restrictions of the queries and instances have been proposed tolower the complexity, these known tractable cases usually do not apply tocombined complexity, i.e., when the query is not fixed. My thesis investigates thequestion of which queries and instances ensure the tractability ofPQE in combined complexity.My first contribution is to study PQE of conjunctive queries on binary signatures, which we rephraseas a probabilistic graph homomorphism problem. We restrict the query and instance graphs to be trees and show the impact on the combined complexity of diverse features such as edge labels, branching,or connectedness. While the restrictions imposed in this setting are quite severe, my second contribution shows that,if we are ready to increase the complexity in the query, then we can evaluate a much more expressive language on more general instances. Specifically, I show that PQE for a particular class of Datalog queries on instances of bounded treewidth can be solved with linear complexity in the instance and doubly exponential complexity in the query.To prove this result, we use techniques from tree automata and knowledge compilation. The third contribution is to show the limits of some of these techniques by proving general lower bounds on knowledge compilation and tree automata formalisms.
60

Les mesures de Jensen extrémales

Roy, Sylvain 12 April 2018 (has links)
Soit fi un sous-ensemble ouvert de Rd (d > 2) et soit x E fi. Une mesure de Jensen pour x par rapport à fi est une mesure borélienne de probabilité /i, supportée par un sous-ensemble compact de fi, telle que J ud/i < u(x) pour chaque fonction surharmonique u définie sur fi. Notons par Jx(fi) la famille des mesures de Jensen pour x par rapport à fi et par Jx(fi) l'ensemble des éléments extrémaux de Jx(tt). Le principal problème relié aux mesures de Jensen n'est pas de les exhiber comme il est parfois le cas avec certains objets mathématiques. Il est plutôt question de les contrôler, c'est-à-dire de les exprimer en termes d'objets mieux connus. C'est ce dont il est question dans cette thèse. Dans les Chapitres 1 à 3, on introduit les différents concepts que le lecteur devrait connaître pour bien comprendre la suite. On y aborde les principaux résultats de la théorie du potentiel classique, les mesures de Jensen ainsi que la théorie fine du potentiel et les mesures finement harmoniques construites à partir de la topologie fine relative à l'ensemble de fonctions surharmoniques. Le résultat principal de cette thèse est la caractérisation complète de ext(Jr(fi)) en termes de mesures finement harmoniques et aussi en termes de limites de mesures harmoniques définies sur des suites décroissantes de domaines. Ceci représente le contenu des Théorèmes 0.1 et 0.2 démontrés aux Chapitres 4 à 8. Au Chapitre 9, on présente un résultat sur la majoration des mesures de Jensen par les mesures harmoniques. Par le fait même, on affaiblit l'hypothèse sur la borne inférieure locale dans un résultat de B. Cole et T. Ransford (le résultat principal de Jensen measures and harmonie measures, J. Reine Angew. Math. 541 (2001), 29-53). Au chapitre 10, on présente une application à l'analyse complexe dans laquelle on améliore un résultat de Khabibullin sur la question de savoir, étant donné une suite (an) de nombres complexes et une fonction continue M : C -> R+ , s'il existe une fonction entière / ^ 0 qui s'annule en chaque an et dont le module est inférieur à M. Finalement, au chapitre 10, il est question d'une troisième caractérisation des mesures de Jensen extrémales en termes d'approximation par les fonctions (J-surharmoniques.

Page generated in 0.0622 seconds