Global ETD Search

191	Adaptabilité des flux multimédia appliquée au télé-diagnostic médical / Adaptability of multimedia streams applied to medical telediagnosis Muthada Pottayya, Ronnie 08 December 2017 (has links) Dans le domaine médical, la plupart des établissements (hôpitaux, cliniques, …) utilisent des applications distribuées dans le cadre de la télémédecine. Comme la sécurité de l’information est primordiale dans ces établissements,ces applications doivent pouvoir traverser les barrières de sécurité (passerelles sécurisées comme les proxies Web, les pare-feu, …). Le protocole UDP (User Datagram Protocol en anglais), qui est classiquement recommandé pour les applications de vidéo conférence ou toutes autres données soumises à la contrainte temps-réel, n’est pas utilisable par ces dispositifs de sécurité (sauf si des ports fixes sont explicitement configurés : ce qui est considéré comme une violation de sécurité au sein de ces établissements). Dans cette thèse, nous proposons une nouvelle plateforme appelée VAGABOND (Video Adaptation framework, crossing security GAteways, Based ON transcoDing) qui fonctionne de manière très efficace et originale sur la base du protocole TCP (Transmission Control Protocol). VAGABOND est composé de proxies d’adaptation,appelés des AP (pour Adaptation Proxy), qui ont été conçus pour prendre en considération les préférences utilisateurs des professionnels de santé, les hétérogénéités des périphériques,et les variations dynamiques de la bande passante dans un réseau. VAGABOND est capable de s’adapter tout aussi bien au niveau utilisateur qu’au niveau réseau. La loi binômiale et l’inférence bayésienne sur une proportion binômiale sont utilisées pour déclencher des adaptations de profils utilisateurs. Ainsi, nous souhaitons être plus tolérants aux fortes variations de la bande passante d'un réseau. Avec une précision plus fine et grâce à ces lois de probabilité,l'adaptation du profil utilisateur n'est déclenchée que lorsque des congestions réseau sévères surviennent.Enfin, TCP étant un protocole de transport fiable et en mode connecté,nous avons eu besoin de concevoir et d'utiliser de nouvelles stratégies d'adaptation intelligentes avec la transmission de données afin de faire face aux problèmes de latence et à la temporisation des sockets. / In the medical area, most of medical facilities (hospitals, clinics, ldots) use distributed applications in the context of telemedecine.As information security is mandatory, these applications must be able to cross the security protocols (secured gateways like proxies, firewalls, ldots). User Datagram Protocol (UDP), which is classically recommended for videoconferencing applications, does not cross firewalls or proxies unless explicitly configured fixed ports are declared. These fixed ports are considered as a security breach.In this thesis, we propose a novel platform called VAGABOND (Video Adaptation framework, crossing security GAteways, Based ON transcoDing) which works, in a very efficient and original way; on TCP (Transmission Control Protocol). VAGABOND is composed of Adaptation Proxies (APs), which have been designed to take into consideration medical experts videoconferencing preferences, device heterogeneities, and network dynamic bandwidth variations. VAGABOND is able to adapt itself at the user and network levels.The cumulative binomial probability law and the Bayesian inference on a binomial proportion are used to trigger user profile adaptations. In fact, we aim at being more tolerant to severe network bandwidth variations. With a finer precision and following these probability laws, user profile adaptation is only triggered when severe network congestions arise. However, as TCP is a reliable transport protocol, we needed to design and to employ new intelligent adaptation strategies together with data transmission in order to cope with latency issues and sockets timeout. Adaptation distribuée Vidéoconférence Proxies Échange de données Vidéo sur TCP Loi Binômiale Inférence Bayésienne Télémédecine Distributed adaptation Videoconferencing Proxies Data exchange Video on TCP Binomial law Bayesian inference Telemedicine 005.8
192	Statistical Physics of Sparse and Dense Models in Optimization and Inference / Physique statistique des modèles épars et denses en optimisation et inférence Schmidt, Hinnerk Christian 10 October 2018 (has links) Une donnée peut avoir diverses formes et peut provenir d'un large panel d'applications. Habituellement, une donnée possède beaucoup de bruit et peut être soumise aux effets du hasard. Les récents progrès en apprentissage automatique ont relancé les recherches théoriques sur les limites des différentes méthodes probabilistes de traitement du signal. Dans cette thèse, nous nous intéressons aux questions suivantes : quelle est la meilleure performance possible atteignable ? Et comment peut-elle être atteinte, i.e., quelle est la stratégie algorithmique optimale ?La réponse dépend de la forme des données. Les sujets traités dans cette thèse peuvent tous être représentés par des modèles graphiques. Les propriétés des données déterminent la structure intrinsèque du modèle graphique correspondant. Les structures considérées ici sont soit éparses, soit denses. Les questions précédentes peuvent être étudiées dans un cadre probabiliste, qui permet d'apporter des réponses typiques. Un tel cadre est naturel en physique statistique et crée une analogie formelle avec la physique des systèmes désordonnés. En retour, cela permet l'utilisation d'outils spécifiques à ce domaine et de résoudre des problèmes de satisfaction de contraintes et d'inférence statistique. La problématique de performance optimale est directement reliée à la structure des extrema de la fonction d'énergie libre macroscopique, tandis que les aspects algorithmiques proviennent eux de la minimisation de la fonction d'énergie libre microscopique (c'est-à-dire, dans la forme de Bethe).Cette thèse est divisée en quatre parties. Premièrement, nous aborderons par une approche de physique statistique le problème de la coloration de graphes aléatoires et mettrons en évidence un certain nombre de caractéristiques. Dans un second temps, nous calculerons une nouvelle limite supérieure de la taille de l'ensemble contagieux. Troisièmement, nous calculerons le diagramme de phase du modèle de Dawid et Skene dans la région dense en modélisant le problème par une factorisation matricielle de petit rang. Enfin, nous calculerons l'erreur optimale de Bayes pour une classe restreinte de l'estimation matricielle de rang élevé. / Datasets come in a variety of forms and from a broad range of different applications. Typically, the observed data is noisy or in some other way subject to randomness. The recent developments in machine learning have revived the need for exact theoretical limits of probabilistic methods that recover information from noisy data. In this thesis we are concerned with the following two questions: what is the asymptotically best achievable performance? And how can this performance be achieved, i.e., what is the optimal algorithmic strategy? The answer depends on the properties of the data. The problems in this thesis can all be represented as probabilistic graphical models. The generative process of the data determines the structure of the underlying graphical model. The structures considered here are either sparse random graphs or dense (fully connected) models. The above questions can be studied in a probabilistic framework, which leads to an average (or typical) case answer. Such a probabilistic formulation is natural to statistical physics and leads to a formal analogy with problems in disordered systems. In turn, this permits to harvest the methods developed in the study of disordered systems, to attack constraint satisfaction and statistical inference problems. The formal analogy can be exploited as follows. The optimal performance analysis is directly related to the structure of the extrema of the macroscopic free energy. The algorithmic aspects follow from the minimization of the microscopic free energy (that is, the Bethe free energy in this work) which is closely related to message passing algorithms. This thesis is divided into four contributions. First, a statistical physics investigation of the circular coloring problem is carried out that reveals several distinct features. Second, new rigorous upper bounds on the size of minimal contagious sets in random graphs, with bounded maximum degree, are obtained. Third, the phase diagram of the dense Dawid-Skene model is derived by mapping the problem onto low-rank matrix factorization. The associated approximate message passing algorithm is evaluated on real-world data. Finally, the Bayes optimal denoising mean square error is derived for a restricted class of extensive rank matrix estimation problems. Systèmes désordonnés Verres de spin Inférence bayésienne Graphe aléatoire Problème de satisfaction de contraintes Disordered systems Spin glasses Bayesian inference Random graphs Constraint satisfaction problems
193	Analyse économétrique des décisions de production des propriétaires forestiers privés non industriels en France Kere, Eric Nazindigouba 21 March 2013 (has links) La production de bois intègre notamment des enjeux économiques, climatiques et énergétiques. En France, selon les données de l'Institut National de l'Information Géographique et Forestière, l'accroissement biologique de la forêt est largement supérieur aux prélèvements de bois. C'est pourquoi l'État français a fixé l'objectif de prélever 21 millions de m3 supplémentaires de bois d'ici 2020 (Grenelle de l'environnement, 2007). Cependant, la forêt française appartient majoritairement à des propriétaires forestiers privés qui ont des préférences à la fois pour le revenu issu de la vente de bois et pour les aménités non-bois. Les politiques visant à accroître la production de bois doivent donc intégrer ces aspects. L'objectif de ce travail de thèse est de comprendre les déterminants de la production jointe de bois et d'aménités non-bois en France. Pour ce faire, nous nous sommes d'abord intéressés aux déterminants individuels et régionaux de l'offre de bois. Nous montrons que le comportement d'offre de bois d'un propriétaire peut varier en fonction du comportement de production de bois constaté chez ses pairs (effets sociaux). Ensuite, nous mettons en évidence un comportement de mimétisme dans les décisions de production jointe de bois et d'aménités des propriétaires forestiers privés. Enfin, nous analysons les arbitrages inter-temporels réalisés par les propriétaires entre aménités non-bois et revenu de la vente de bois en prenant en compte explicitement les anticipations de prix et de croissance. Nous évaluons à 23e par an la valeur que les propriétaires de notre échantillon accordent à 1m3/ha de bois supplémentaire laissé sur pied par rapport au niveau de stock des propriétaires industriels afin d'avoir des aménités plus importantes.Un des enjeux de ce travail est d?offrir des pistes pour mobiliser la ressource forestière ne faisant pas l'objet d'une offre, faute d'implication des propriétaires privés, soit par manque de connaissance ou d'intérêt pour leur forêt, soit parce que d'autres aspects sont privilégiés (services d'aménités non-bois par exemple). Dans cette thèse, nous montrons que les effets de mimétisme et d'entrainement social (effets sociaux) peuvent être utilisés pour amener les propriétaires forestiers à produire plus de bois. Nous montrons également, qu'une hausse du prix du bois ou la mise en place d'une taxepeut favoriser la prise de la décision de coupe de bois et augmenter l'intensité de la récolte. / Timber production is related to economic, climate and energy issues. In France,according to data from the National Institute of Geoinformation and Forestry, thebiological growth rate of the forest is greater than the timber harvest rate. Thus, theFrench government has set a target of harvesting an additional quantity of 21 millioncubic meter of timber by 2020 ("Grenelle de l'environnement, 2007"). However, theFrench forest is majority owned by private forest owners who have preferences forboth income from timber trade and from non-timber amenities. The policies toincrease timber production must include these aspects. The objective of this thesisis to understand the determinants of joint production of timber and non-timberamenities in France.Therefore, we first analyze private forest owners' timber supply, taking into accountindividual and regional determinants. Afterwards, we investigate whether thedrivers of forest owners behavior differ within and between these different levels.We show that similar timber supply behavior can be observed when regional characteristicsor those of peers are similar. Then, we highlight a mimicry behavior injoint production decisions of timber and amenities made by private forest owners.Finally, we analyze inter-temporal trade-offs made by the owners from non-timberamenities and income from the sale of wood. We explicitly take into account theprice expectations and growth. Our estimations show that the willingness to pay fornon-timber amenities is e23 for our case study. This value is the difference betweenthe value they could have earned if they tried to maximize timber revenue and therevenue of their actual logging.Mainly beacause of a lack of involvement of private owners, either through a lackof knowledge or interest in their forest, or because other aspects are privileged (nontimberamenities, e.g.), a part of forest ressource is not subject to a commercial offer.Providing ways to mobilize this ressource is one of the challenges of this work. Weshow that the mimetic effects and the contextual effects can be used to encourageforest owners to produce more timber. An effective policy could be a combinationof these two effects. We also show that an increase in the price of timber or theadoption of a tax may be an incentive for timber harvesting. Forêt Interactions spatiales et sociales Biais de sélection Programmationdynamique stochastique Econométrie spatiale Inférence indirecte Forest Spatial and social interactions Selection bias Stochastic dynamic programming Spatial econometrics Indirect inference
194	Efficient high-dimension gaussian sampling based on matrix splitting : application to bayesian Inversion / Échantillonnage gaussien en grande dimension basé sur le principe du matrix splitting. : application à l’inversion bayésienne Bӑrbos, Andrei-Cristian 10 January 2018 (has links) La thèse traite du problème de l’échantillonnage gaussien en grande dimension.Un tel problème se pose par exemple dans les problèmes inverses bayésiens en imagerie où le nombre de variables atteint facilement un ordre de grandeur de 106_109.La complexité du problème d’échantillonnage est intrinsèquement liée à la structure de la matrice de covariance. Pour résoudre ce problème différentes solutions ont déjà été proposées,parmi lesquelles nous soulignons l’algorithme de Hogwild qui exécute des mises à jour de Gibbs locales en parallèle avec une synchronisation globale périodique.Notre algorithme utilise la connexion entre une classe d’échantillonneurs itératifs et les solveurs itératifs pour les systèmes linéaires. Il ne cible pas la distribution gaussienne requise, mais cible une distribution approximative. Cependant, nous sommes en mesure de contrôler la disparité entre la distribution approximative est la distribution requise au moyen d’un seul paramètre de réglage.Nous comparons d’abord notre algorithme avec les algorithmes de Gibbs et Hogwild sur des problèmes de taille modérée pour différentes distributions cibles. Notre algorithme parvient à surpasser les algorithmes de Gibbs et Hogwild dans la plupart des cas. Notons que les performances de notre algorithme dépendent d’un paramètre de réglage.Nous comparons ensuite notre algorithme avec l’algorithme de Hogwild sur une application réelle en grande dimension, à savoir la déconvolution-interpolation d’image.L’algorithme proposé permet d’obtenir de bons résultats, alors que l’algorithme de Hogwild ne converge pas. Notons que pour des petites valeurs du paramètre de réglage, notre algorithme ne converge pas non plus. Néanmoins, une valeur convenablement choisie pour ce paramètre permet à notre échantillonneur de converger et d’obtenir de bons résultats. / The thesis deals with the problem of high-dimensional Gaussian sampling.Such a problem arises for example in Bayesian inverse problems in imaging where the number of variables easily reaches an order of 106_109. The complexity of the sampling problem is inherently linked to the structure of the covariance matrix. Different solutions to tackle this problem have already been proposed among which we emphasizethe Hogwild algorithm which runs local Gibbs sampling updates in parallel with periodic global synchronisation.Our algorithm makes use of the connection between a class of iterative samplers and iterative solvers for systems of linear equations. It does not target the required Gaussian distribution, instead it targets an approximate distribution. However, we are able to control how far off the approximate distribution is with respect to the required one by means of asingle tuning parameter.We first compare the proposed sampling algorithm with the Gibbs and Hogwild algorithms on moderately sized problems for different target distributions. Our algorithm manages to out perform the Gibbs and Hogwild algorithms in most of the cases. Let us note that the performances of our algorithm are dependent on the tuning parameter.We then compare the proposed algorithm with the Hogwild algorithm on a large scalereal application, namely image deconvolution-interpolation. The proposed algorithm enables us to obtain good results, whereas the Hogwild algorithm fails to converge. Let us note that for small values of the tuning parameter our algorithm fails to converge as well.Not with standing, a suitably chosen value for the tuning parameter enables our proposed sampler to converge and to deliver good results. Échantillonnage Distribution gaussienne Monte-Carlo par chaînes de Markov, Grande dimension Inférence bayésienne Problèmes inverses Sampling Gaussian distribution Markov Chain Monte Carlo High dimensional Bayesian inference Inverse problems
195	Méthodes bayésiennes pour l'analyse génétique / Bayesian methods for gene expression factor analysis Bazot, Cécile 27 September 2013 (has links) Ces dernières années, la génomique a connu un intérêt scientifique grandissant, notamment depuis la publication complète des cartes du génome humain au début des années 2000. A présent, les équipes médicales sont confrontées à un nouvel enjeu : l'exploitation des signaux délivrés par les puces ADN. Ces signaux, souvent de grande taille, permettent de connaître à un instant donné quel est le niveau d'expression des gênes dans un tissu considéré, sous des conditions particulières (phénotype, traitement, ...), pour un individu. Le but de cette recherche est d'identifier des séquences temporelles caractéristiques d'une pathologie, afin de détecter, voire de prévenir, une maladie chez un groupe de patients observés. Les solutions développées dans cette thèse consistent en la décomposition de ces signaux en facteurs élémentaires (ou signatures génétiques) selon un modèle bayésien de mélange linéaire, permettant une estimation conjointe de ces facteurs et de leur proportion dans chaque échantillon. L’utilisation de méthodes de Monte Carlo par chaînes de Markov sera tout particulièrement appropriée aux modèles bayésiens hiérarchiques proposés puisqu'elle permettra de surmonter les difficultés liées à leur complexité calculatoire. / In the past few years, genomics has received growing scientic interest, particularly since the map of the human genome was completed and published in early 2000's. Currently, medical teams are facing a new challenge: processing the signals issued by DNA microarrays. These signals, often of voluminous size, allow one to discover the level of a gene expression in a given tissue at any time, under specic conditions (phenotype, treatment, ...). The aim of this research is to identify characteristic temporal gene expression proles of host response to a pathogen, in order to detect or even prevent a disease in a group of observed patients. The solutions developed in this thesis consist of the decomposition of these signals into elementary factors (genetic signatures) following a Bayesian linear mixing model, allowing for joint estimation of these factors and their relative contributions to each sample. The use of Markov chain Monte Carlo methods is particularly suitable for the proposed hierarchical Bayesian models. Indeed they allow one to overcome the diculties related to their computational complexity. Analyse génétique Méthodes MCMC Inférence bayésienne Traitement du signal Données d’expression des gènes Factor analysis MCMC methods Bayesian inference Signal processing Gene expression data
196	Credit Scoring et ses applications dans la gestion du risque du crédit / Credit Scoring and its applications in Credit Risk Management Nguyen, Ha Thu 13 June 2016 (has links) Alors que les modèles de credit scoring sont largement utilisés depuis plus de cinquante ans et sont considérés comme un outil indispensable dans la prise de décision dans d'innombrables institutions financières du monde entier, la littérature et les empiriques disponibles sur ce sujet restent encore très limitées. Notre objectif est de combler cette lacune en présentant une analyse approfondie sur les modèles de credit scoring et le processus de prise de décision d’octroi de crédit, avec diverses applications sur des données réelles et extensives provenant de différents pays. Notre thèse comporte trois chapitres. Chapitre 1 commence par présenter le processus de développement d’un modèle de credit scoring, et fournit une application sur des données réelles d'une banque de détail basée en France. Visant à donner de nouvelles perspectives sur les pays émergents, Chapitre 2 analyse le marché du crédit à la consommation en Chine et enquête sur l'utilisation des modèles de credit scoring dans un tel marché prometteur. Chapitre 3 va plus loin que la littérature méthodologique précédente et se concentre sur les différentes techniques d'inférence des refusés qui peuvent corriger le biais de sélection lors de la construction d'un modèle de crédit scoring basé uniquement sur les dossiers acceptés. Ces chapitres présentent les différents aspects du crédit scoring, pour lesquels les principales problématiques de credit scoring seront traitées. / While credit scoring has been broadly used for more than fifty years and continued to be a great support on decision-making in countless businesses around the world, the amount of literature, especially empirical studies, available on this subject is still limited. Our aim in this thesis is to fill this gap by providing a profound analysis on credit scoring and credit decision processes, with various applications using real and extensive sets of data coming from different countries. The thesis is organized in three chapters. Chapter 1 starts by presenting the credit scoring development process, and provides an application to real data from a France-based retail bank. Aiming at providing new insights regarding emerging countries, Chapter 2 analyzes the Chinese consumer lending market and investigates the use of credit scoring in such a promising market. Chapter 3 goes further than the previous methodological literature and focuses on reject inference techniques which can be a way to address the bias when developing a credit-scoring model based solely on accepted applicants. These chapters provide a round tour on credit scoring, after which major issues in credit scoring are treated. Credit Scoring Score de comportement Score d’octroi Régression logistique Inférence des refusés Risque de crédit Credit Scoring Behavioral scorecard Application scorecard Logistic reression Reject inference Credit risk 330
197	Identification de l’impédance d’un traitement en présence d’un écoulement / Acoustical impedance identification under flow conditions Buot de l’Épine, Yorick 29 June 2017 (has links) Afin de réduire les bruits rayonnés en sortie de guide d’onde, des traitements acoustiques localement réactifs, comme les structures « Plaque perforée/Nid d’abeilles », peuvent être appliqués en liner. La conception de ces liners devient alors un challenge important avec l’apparition de nouvelles normes sur le bruit et impose de posséder une très bonne connaissance du comportement de ces traitements, en particulier leur impédance de surface. Néanmoins, la caractérisation de cette impédance n’est pas une chose facile et est généralement réalisée via des modèles semi-empiriques comme ceux de Guess, Elnady, Allam ou expérimentalement par des méthodes de mesures directes ou inverses. Ces approches inverses permettent, par la confrontation d’une modélisation du problème avec des observations expérimentales, de retourner, au travers d’une fonction coût, l’impédance du traitement. Ces méthodes ont l’avantage de réaliser une observation dans les conditions réelles d’utilisation du traitement. En effet, de nombreux paramètres influencent l’impédance de surface comme la présence d’un écoulement, l’incidence de l’onde… Dans cette thèse, une méthode d’identification de l’impédance est proposée. A partir de l’impédance de surface d’un traitement « Plaque perforée/Nid d’abeille » prédite par un modèle empirique via ses paramètres géométriques (épaisseur de la plaque, diamètre des perforations…), une méthode basée sur l’approche Bayésienne est implémentée afin de remonter à l’impédance réelle du traitement. Le problème étudié consiste en la propagation d’une onde dans un tronçon rectangulaire traité sur sa face supérieure et la mesure des pressions acoustiques est réalisée sur le banc d’essai de l’Université Technologique de Compiègne avec un écoulement rasant. Un modèle de propagation d’ondes dans le conduit est développé via la technique du raccordement modal, afin de prédire la pression aux positions des microphones pour n’importe quelle valeur d’impédance. A partir de la mesure et de la simulation, la règle de Bayes peut être appliquée afin de construire la densité de probabilité a posteriori. Cette densité de probabilité est alors échantillonnée au travers d’un algorithme Évolutionnaire de Monte Carlo par Chaîne de Markov (EMCMC). L’intérêt principale de cette méthode, est d’obtenir de nombreuses d’informations statistiques sur les paramètres caractérisant l’impédance de surface comme leur distribution et leur corrélation. / Locally reactive acoustic liners such as honeycomb structures with perforated panels can be modeled with a surface impedance in standard numerical models. However, the characterization of this impedance is not always straightforward. Empirical models or standing wave tube measurements are generally used to get the behavior of these acoustic treatments. Unfortunately, these methods provide only an evaluation of the impedance under specific conditions. Moreover, the conditions of use can change significantly the acoustic liners behavior as grazing flow conditions or oblique incident waves. A characterization of locally reactive acoustic liners is presented here. Starting from a set of parameters and represents a surface impedance using empirical model, an inverse method based on Bayesian approach is used to return the surface impedance taking in consideration the real conditions of use. A rectangular duct treated by a liner on its upper face is considered and these conditions are similar to the experiment present at the Université de Technologie de Compiègne. This inverse method requires a direct model to predict the pressure at some microphone positions with any surface impedance. The model used in the following is based on the Mode-Matching method. From the direct analytical model, the Bayes'rule is then used to get the posterior probability density function of the estimated impedance. An Evolutionary Monte Carlo by Markov chain (EMCMC) method is used to sample this posterior probability density. This method provides not only the best set of parameters but also some statistical information for each parameter. Guide d'onde acoustique Inférence bayésienne Chaînes de Markov Écoulement Acoustic Inverse problems Sound-waves Propagation of sound waves Monte Carlo method Markov processes Evolutionary algorithms Noise control Acoustical engineering
198	Modélisation probabiliste et inférence par l'algorithme Belief Propagation / Probabilistic Modelling and Inference using the Belief Propagation Algorithm Martin, Victorin 23 May 2013 (has links) On s'intéresse à la construction et l'estimation - à partir d'observations incomplètes - de modèles de variables aléatoires à valeurs réelles sur un graphe. Ces modèles doivent être adaptés à un problème de régression non standard où l'identité des variables observées (et donc celle des variables à prédire) varie d'une instance à l'autre. La nature du problème et des données disponibles nous conduit à modéliser le réseau sous la forme d'un champ markovien aléatoire, choix justifié par le principe de maximisation d'entropie de Jaynes. L'outil de prédiction choisi dans ces travaux est l'algorithme Belief Propagation - dans sa version classique ou gaussienne - dont la simplicité et l'efficacité permettent son utilisation sur des réseaux de grande taille. Après avoir fourni un nouveau résultat sur la stabilité locale des points fixes de l'algorithme, on étudie une approche fondée sur un modèle d'Ising latent où les dépendances entre variables réelles sont encodées à travers un réseau de variables binaires. Pour cela, on propose une définition de ces variables basée sur les fonctions de répartition des variables réelles associées. Pour l'étape de prédiction, il est nécessaire de modifier l'algorithme Belief Propagation pour imposer des contraintes de type bayésiennes sur les distributions marginales des variables binaires. L'estimation des paramètres du modèle peut aisément se faire à partir d'observations de paires. Cette approche est en fait une manière de résoudre le problème de régression en travaillant sur les quantiles. D'autre part, on propose un algorithme glouton d'estimation de la structure et des paramètres d'un champ markovien gaussien, basé sur l'algorithme Iterative Proportional Scaling. Cet algorithme produit à chaque itération un nouveau modèle dont la vraisemblance, ou une approximation de celle-ci dans le cas d'observations incomplètes, est supérieure à celle du modèle précédent. Cet algorithme fonctionnant par perturbation locale, il est possible d'imposer des contraintes spectrales assurant une meilleure compatibilité des modèles obtenus avec la version gaussienne de Belief Propagation. Les performances des différentes approches sont illustrées par des expérimentations numériques sur des données synthétiques. / In this work, we focus on the design and estimation - from partial observations - of graphical models of real-valued random variables. These models should be suited for a non-standard regression problem where the identity of the observed variables (and therefore of the variables to predict) changes from an instance to the other. The nature of the problem and of the available data lead us to model the network as a Markov random field, a choice consistent with Jaynes' maximum entropy principle. For the prediction task, we turn to the Belief Propagation algorithm - in its classical or Gaussian flavor - which simplicity and efficiency make it usable on large scale networks. After providing a new result on the local stability of the algorithm's fixed points, we propose an approach based on a latent Ising model, where dependencies between real-valued variables are encoded through a network of binary variables. To this end, we propose a definition of these variables using the cumulative distribution functions of the real-valued variables. For the prediction task, it is necessary to modify the Belief Propagation algorithm in order to impose Bayesian-like constraints on marginal distributions of the binary variables. Estimation of the model parameters can easily be performed using only pairwise observations. In fact, this approach is a way to solve the regression problem by working on quantiles.Furthermore, we propose a greedy algorithm for estimating both the structure and the parameters of a Gauss-Markov random field based on the Iterative Proportional Scaling procedure. At each iteration, the algorithm yields a new model which likelihood, or an approximation of it in the case of partial observations,is higher than the one of the previous model. Because of its local perturbation principle, this algorithm allows us to impose spectral constraints, increasing the compatibility with the Gaussian Belief Propagation algorithm. The performances of all approaches are empirically illustrated on synthetic data. Belief Propagation Inférence Champ markovien aléatoire Modèle gaussien Iterative proportional scaling Belief Propagation Inference Markov Random Field Gaussian model Iterative proportional scaling
199	Mesurer les musiques pour parler du passé : la comparaison des musiques du Gabon comme source d'informations historiques / Measuring music to grasp the past : a formal comparison of Gabonese music as a way of inferring historical information Gardent, Jérémy 30 June 2017 (has links) Les musiques du Gabon semblent se distinguer par certains aspects importants des autres musiques d'Afrique centrale, en particulier du Cameroun et de Centrafrique. Cette singularité pourrait être liée à l'histoire complexe des populations de cette région. L'histoire de ces musiques, aujourd'hui presque inconnue, pourrait aider à mieux comprendre celle des personnes qui les pratiquent. Cette thèse explore l'utilisation des méthodes d'inférence historique, développées parallèlement en philologie, en systématique biologique et en linguistique historique afin de retrouver l'histoire des musiques et des populations. J'étudie un jeu de données obtenu par l'analyse (via les outils de la systématique musicale) de près de 200 pièces voco-instrumentales collectées dans une vingtaine de populations provenant de différentes régions du Gabon. Cette recherche nourrit des questionnements empiriques et théoriques concernant l'usage de la musique comme source historique, mais aussi sur la pratique de l'interdisciplinarité. / Gabonese music differs in several important ways from other Central African musics, especially music from Cameroon and Central African Republic. This could be due to the complex history of populations in this area. The history of these musics, almost unknown up to now, could help better understand the history of the people playing them. This thesis investigates the use of historical inference methods, indepndently developed in philology, in biological systematics and in historical linguistics, in order to discover the history of musics and populations. I analyse a dataset obtained through the analysis (thanks to the tools of musical systematics) of almost 200 voco-instrumental pieces collected in 20 different populations from various regions of Gabon. This investigation raises interesting empirical and theoretical questions concerning the use of music as historical source, but also concerning the practice of interdisciplinarity. Musiques du Gabon Inférence historique Comparaison musicale Interdisciplinarité Transposition de méthodes Evolution culturelle Gabon music Historical inference Musical comparison Interdisciplinarity Method transposition Cultural evolution
200	Analyse et modélisation du repliement spatial de l'épigénome / Analysis and modelization of the spatial folding of the epigenome Haddad, Noëlle 17 November 2016 (has links) L'ADN chromosomique des cellules eucaryotes est fortement condensé au sein d'un complexe nucléoprotéïque, la chromatine. Aussi bien l'organisation spatiale que la composition biochimique (état “épigénomique”) de la chromatine jouent un rôle fondamental dans la régulation des gènes. Grâce aux récents développements des techniques de séquençage à haut-débit, il est possible de déterminer l'état épigénomique local de la chromatine ainsi que la probabilité de contact entre deux sites génomiques (technique dite de “Hi-C”). Ces deux techniques ont permis de mettre en évidence l’existence de domaines d’interaction dont les positions corrèlent fortement avec la segmentation épigénomique de la chromatine. Cependant, les mécanismes responsables de ce couplage sont encore mal compris. L’objectif de cette thèse est de bâtir des modèles physiques permettant de valider l’hypothèse que l’épigénome est un acteur majeur dans le repliement 3D de la chromatine. Pour cela, nous avons tout d’abord développé “IC-Finder”, un algorithme permettant de segmenter les cartes Hi-C en domaines d’interaction. Nous avons alors pu quantifier précisément l’association entre épigénome et organisation de la chromatine. Les corrélations trouvées justifient l’idée de modéliser la chromatine par un copolymère par bloc dont les monomères ont chacun un état épigénomique. Dans ce cadre, nous avons développé une méthode d’inférence des potentiels d'interaction entre sites génomiques à partir des cartes Hi-C expérimentales. Ce travail permettra à plus long terme de prévoir l’organisation de la chromatine sous différentes conditions, ce qui permettra d’étudier en particulier les changements de structure résultant de l’altération de l’épigénome. / DNA of eukaryotes is highly condensed in a nucleoprotein complex called chromatin. Both the spatial organization and the biochemical composition (“epigenomic” state) of the chromatin are fundamental for gene regulation. Remarkably, recent studies indicate that1D epigenomic domains tend to fold into 3D topologically associated domains (TADs) forming specialized nuclear chromatin compartments. In this thesis, we address the question of the coupling between chromatin folding and epigenome. We first built a software called IC-finder to segment HiC maps into interacting domains. We next used it to quantify correlations between the TADs and epigenomic partitions of the genome. This led us to develop a physical model of the chromatin with the working hypothesis that chromatin organization is driven by physical interactions between epigenomic loci. We modeled chromatin as a block copolymer where each block corresponds to an epigenomic domain. With this framework, we developed a method to infer interaction parameters between chromatin loci from experimental Hi-C map. An outcome of such inference process would be a powerful tool to predict chromatin organization in various conditions, allowing investigating in silico changes in TAD formations and long-range contacts when altering the epigenome. Chromatine Organisation nucléaire Compartimentation 3D Hi-C Physique des polymères Copolymère par bloc Inférence Chromatin Nuclear organization 3D compartimentalization Hi-C Polymer physics Block copolymer Inference

Search results