Spelling suggestions: "subject:"modèle bayésien"" "subject:"modèle bayésiens""
1 |
Influences de la texture sur la perception du mouvement : psychophysique et modélisation bayésienneNguyen-Tri, David January 2005 (has links)
Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal.
|
2 |
Moyennage bayésien de modèles de régression linéaire simpleDragomir, Elena Alice January 2003 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
|
3 |
Utilisation de ressources externes dans un modèle Bayésien de Recherche d'Information. Application à la recherche d'information multilingue avec UMLS.Le, Thi Hoang Diem 29 May 2009 (has links) (PDF)
Dans les systèmes de recherche d'information, une indexation à base de termes et une correspondance à base d'intersection introduisent le problème de la disparité à cause des variations linguistiques. Avec l'objectif de résoudre ce problème, notre travail de thèse se positionne dans l'utilisation des ressources externes dans la recherche d'information. Ces ressources offrent non seulement les concepts pour une indexation plus précise et indépendante de langue, mais aussi une base de relations sémantiques entre ces concepts. Nous étudions en premier une indexation par concepts extraits à partir d'une ressource externe. Nous proposons ensuite de prendre en compte ces relations sémantiques entre les concepts dans la correspondance par un modèle de recherche d'information basé sur un réseau Bayésien des concepts et leurs relations sémantiques. Ainsi, nous étudions les extensions de l'indexation conceptuelle à des documents et requête structurés et multi-médias. Les fonctions de reclassement et de combinaison ont été proposées afin d'améliorer la performance de la recherche dans ces contextes. La validation des propositions est effectuée par des expérimentations dans la recherche d'information multilingue médicale, avec l'utilisation du méta thésaurus UMLS comme ressource externe.
|
4 |
Prédiction de la composition corporelle par modélisation locale et les réseaux bayésiens / Body composition prediction by locally weighted and Bayesian networks modelingTian, Simiao 29 November 2013 (has links)
La composition corporelle est importante pour évaluer l'état de santé et le statut nutritionnel d'individus. Le surpoids et l'obésité deviennent des problèmes de santé à l'échelle mondiale. L'accroissement de la masse grasse, notamment celle du tronc, a été associée à une augmentation du risque de maladies métaboliques, telles que le diabète de type 2 et les maladies cardiovasculaires. La masse musculaire, en particulier appendiculaire, est également un indice de santé, et est liée au taux de mortalité. En outre, le vieillissement s'accompagne de changements importants dans la composition corporelle. La masse maigre diminue (Kyle et al., 2001) et la masse grasse augmente, liée à une accumulation de tissus adipeux, en particulier dans la région abdominale (Kuk et al., 2009). Il est donc important d'étudier ces changements en fonction de l'âge pour tenter d'établir un pré-diagnostic et aider à la prévention de la morbidité et de mortalité. La composition corporelle se mesure par différentes méthodes, telles que le pesage sous l'eau ou l'absorption bi-photonique à rayons X (DXA). Cependant, ces méthodes de mesure ne sont pas adaptées pour des populations de taille très grande, car elles nécessitent un équipement fixe, demandent des manipulations longues et sont coûteuses. En revanche, le potentiel de méthodes de prédiction statistique a été mis en évidence pour estimer la composition corporelle (Snijder et al., 2006), et plusieurs modèles ont été proposés pour prédire la composition corporelle, notamment le pourcentage de la masse grasse (BF%) (Gallagher et al.,2000a; Jackson et al., 2002; Mioche et al., 2011b). Le premier objectif de cette thèse est de développer un modèle multivarié à partir de covariables anthropométriques pour prédire simultanément les masses grasse et maigre de différents segments du corps. Pour cela, nous avons proposé une régression linéaire multivariable publiée dans le British Journal of Nutrition. Notre proposition multivariée présente deux avantages principaux. Le premier avantage consiste à utiliser les covariables très simples que sont l'âge, le poids et la taille dont la mesure est facile et peu coûteuse. L'utilité d'ajouter comme covariable le tour de taille a été évaluée. Le deuxième avantage est que l'approche multivariée prend en compte la structure de corrélation entre les variables, ce qui est utile pour certaines études d'inférence où on s'intéresse à des fonctions des variables prédites. La qualité de la précision multivariée a été évaluée par comparaison avec celle des modèles univariés déjà publiés. Nous avons montré que la prédiction multivariée est bonne et que notre approche peut donc être utilisée pour des études de risques métaboliques en grandes populations. Le second objectif de cette thèse est d'étudier l'évolution de la composition corporelle au cours du vieillissement, en tenant compte des covariables anthropométriques. Deux modélisations bayésiennes ont été retenues et développées. Un des avantages principaux de nos propositions est, grâce à une modélisation, de réaliser une analyse longitudinale à partir de données transversales. En outre, la modélisation bayésienne permet de fournir une distribution prédictive, et non pas une simple valeur prédite, ce qui permet d'explorer l'incertitude de la prédiction. Également, des résultats antérieurs ou publiés peuvent être incorporés dans la distribution priore, ce qui conduit à des conclusions plus précises. Les prédictions précédentes sont fondées sur des modèles où la structure de corrélation entre les variables est laissée libre, le troisième objectif de notre travail a été d'imposer une structure de corrélation particulière adaptée au problème. L'avantage est l'utilisation d'un sous-modèle parcimonieux du modèle multivarié précédent. Cette structure est décrite au moyen d'un réseau bayésien gaussien (GBN). [...] Suite et fin du résumé dans la thèse. / The assessment of human body composition is important for evaluating health and nutritional status. Among health issues, overweight and obesity are worldwide problems. Increased fat mass, especially in the trunk location, has been associated with an increased risk of metabolic diseases, such as type 2 diabetes and cardiovascular disease. The lean body mass, especially appendicular muscle mass, is also directly related to health and particularly with the mortality rate. Also, aging is associated with substantial changes in body composition. Reduction in body lean or body fat-free mass occurs during aging (Kyle et al., 2001) together with an increase of body fat related to accumulation of adipose tissues, particularly in abdominal region (Kuk et al., 2009); therefore assessing these changes in segmental body composition may be important because the study will lead to a pre-diagnosis for the prevention of morbidity and mortality risk. Accurate measurements of body composition can be obtained from different methods, such as underwater weighing and dual-energy X-ray absorptiometry (DXA). However, their applications are not always convenient, because they require fixed equipment and they are also time consuming and expensive. As a result, they are not convenient for use as a part of routine clinical examinations or population studies. The potential uses of statistical methods for body composition assessment have been highlighted (Snijder et al., 2006), and several attempts to predict body composition, particularly body fat percentage (BF%), have been made (Gallagher et al., 2000a; Jackson et al., 2002; Mioche et al., 2011b).The first aim in this thesis was to develop a multivariate model for predicting simultaneously body, trunk and appendicular fat and lean masses from easily measured anthropometric covariables. We proposed a linear solution published in the British Journal of Nutrition. There are two main advantages in our proposed multivariate approach. The first consists in using very simple covariables, such as body weight and height, because these measurements are easy and not expensive. The usefulness of waist circumference is also investigated and combined with age, height and weight as predictor variables. The second advantage is that the multivariate approach enables to take into account the correlation structure between the responses into account, which is useful for a number of inference tasks, e.g., to give simultaneous confidence regions for all the responses together. Then the prediction accuracy of the multivariate approach is justified by comparing with that of the available univariate models that predict body fat percentage (BF%). With a good accuracy, the multivariate outcomes might then be used in studies necessitating the assessment of metabolic risk factors in large populations.The second aim in this thesis was to study age-related changes in segmental body compositions, associated with anthropometric covariables. Two Bayesian modeling methods are proposed for the exploration of age-related changes. The main advantage of these methods is to propose a surrogate for a longitudinal analysis from the cross-sectional datasets. Moreover, the Bayesian modeling enables to provide a prediction distribution, rather than a simple estimate, this is more relevant for exploring the uncertainty or accuracy problems. Also we can incorporate the previous findings in the prior distribution, by combining it with the datasets, we could obtain more suitable conclusions.The previous predictions were based on models supposing any correlation structure within the variables, the third aim in this thesis was to propose a parsimonious sub-model of the multivariable model described by a Gaussian Bayesian network (GBN), more precisely Crossed Gaussian Bayesian Networks (CGBN). Last and final summary in the thesis.
|
5 |
Epidémiologie de la sclérose en plaques en France / Epidemiology of Multiple Sclerosis en FranceFromont, Agnès 06 November 2012 (has links)
En Europe, la France est située entre des zones à haut et bas risque de Sclérose en Plaques (SEP).Nous avons estimé la prévalence de la SEP en France au 31 octobre 2004 et l’incidence entre 2000 et 2007 à partir des données de la Caisse Nationale d’Assurance Maladie des Travailleurs Salariés (CNAMTS) qui assure 87 % de la population. La SEP, comme d’autres maladies chroniques, fait partie des affections de longue durée (ALD). Les variations géographiques de la prévalence et de l’incidence ont été analysées par un modèle Bayesien.La prévalence standardisée sur l’âge était de 94,7 pour 100 000 ; 130,5 pour les femmes ; 54,8 pour les hommes. Le taux de notification de SEP (2000-2007) standardisé sur la population Européenne était de 6,8 pour 100 000 ; 9,8 parmi les femmes et 3,7 parmi les hommes. Avec le modèle Bayesien, la prévalence était plus forte au nord-est et plus faible dans la région parisienne et sur la Côte d’Azur. L’incidence était également plus forte au nord-est mais plus faible sur la côte atlantique et de part et d’autre du Rhône.A partir des autres ALD, les comorbidités survenant avant l’ALD SEP ont été étudiées. Elles étaient rares et essentiellement représentées par les troubles psychiatriques (40,2%) et le diabète (20,3%). Cette étude a été réalisée parmi une population représentative avec une seule et même méthodologie. Le modèle Bayesien prenant en compte l’hétérogénéité et l’auto-corrélation spatiales ne confirme pas l’existence d’un gradient net mais des zones à sur ou sous risque. La meilleure connaissance de l’épidémiologie de la SEP permettra d’avancer sur ses facteurs étiologiques. / In Europe, France is located between high and low risk areas of Multiple Sclerosis (MS). We estimated the national prevalence of MS in France on 31st October 2004 and the incidence between 2000 and 2007 based on data from the ‘Caisse Nationale d’Assurance Maladie des Travailleurs Salariés’ which insures 87% of the population. MS like other chronic diseases is one of the 30 long-term illnesses (Affections de Longue Durée, ALD). We analysed geographic variations in the prevalence and incidence of MS in France using the Bayesian approach.Total MS prevalence in France standardised for age was 94.7 per 100,000; 130.5 in women; 54.8 in men. The notification rate for MS (2000-2007) after age-standardisation according to the European population was 6.8 per 100,000; 9.8 in women and 3.7 in men. With a Bayesian approach, the prevalence of MS was higher in northeast and lower in the Paris area and on the Mediterranean coast. The notification rate was higher in northeast and lower on the Atlantic coast and in the Alps as well as on both sides of the Rhône River.The study of other chronic diseases for which ALD status was registered before MS revealed that comorbidities were rare, essentially represented by psychiatric diseases (40.2%) and diabetes (20.3%).This study is performed among a representative population using the same method throughout. The Bayesian approach which takes into account spatial heterogeneity and spatial autocorrelation did not confirm the existence of a clear gradient but only higher or lower areas of MS. The better knowledge of MS epidemiology will allow to venture hypothesis its etiological factors.
|
6 |
Évaluation d'un modèle a priori basé sur un seuillage de la TCD en super-résolution et comparaison avec d'autres modèles a prioriSt-Onge, Philippe January 2008 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
7 |
Modélisation bayésienne des changements aux niches écologiques causés par le réchauffement climatiqueAkpoué, Blache Paul 05 1900 (has links)
Cette thèse présente des méthodes de traitement de données de comptage en particulier et des données discrètes en général. Il s'inscrit dans le cadre d'un projet stratégique du CRNSG, nommé CC-Bio, dont l'objectif est d'évaluer l'impact des changements climatiques sur la répartition des espèces animales et végétales.
Après une brève introduction aux notions de biogéographie et aux modèles linéaires mixtes généralisés aux chapitres 1 et 2 respectivement, ma thèse s'articulera autour de trois idées majeures.
Premièrement, nous introduisons au chapitre 3 une nouvelle forme de distribution dont les composantes ont pour distributions marginales des lois de Poisson ou des lois de Skellam. Cette nouvelle spécification permet d'incorporer de l'information pertinente sur la nature des corrélations entre toutes les composantes. De plus, nous présentons certaines propriétés de ladite distribution. Contrairement à la distribution multidimensionnelle de Poisson qu'elle généralise, celle-ci permet de traiter les variables avec des corrélations positives et/ou négatives. Une simulation permet d'illustrer les méthodes d'estimation dans le cas bidimensionnel. Les résultats obtenus par les méthodes bayésiennes par les chaînes de Markov par Monte Carlo (CMMC) indiquent un biais relatif assez faible de moins de 5% pour les coefficients de régression des moyennes contrairement à ceux du terme de covariance qui semblent un peu plus volatils.
Deuxièmement, le chapitre 4 présente une extension de la régression multidimensionnelle de Poisson avec des effets aléatoires ayant une densité gamma. En effet, conscients du fait que les données d'abondance des espèces présentent une forte dispersion, ce qui rendrait fallacieux les estimateurs et écarts types obtenus, nous privilégions une approche basée sur l'intégration par Monte Carlo grâce à l'échantillonnage préférentiel. L'approche demeure la même qu'au chapitre précédent, c'est-à-dire que l'idée est de simuler des variables latentes indépendantes et de se retrouver dans le cadre d'un modèle linéaire mixte généralisé (GLMM) conventionnel avec des effets aléatoires de densité gamma. Même si l'hypothèse d'une connaissance a priori des paramètres de dispersion semble trop forte, une analyse de sensibilité basée sur la qualité de l'ajustement permet de démontrer la robustesse de notre méthode.
Troisièmement, dans le dernier chapitre, nous nous intéressons à la définition et à la construction d'une mesure de concordance donc de corrélation pour les données augmentées en zéro par la modélisation de copules gaussiennes. Contrairement au tau de Kendall dont les valeurs se situent dans un intervalle dont les bornes varient selon la fréquence d'observations d'égalité entre les paires, cette mesure a pour avantage de prendre ses valeurs sur (-1;1). Initialement introduite pour modéliser les corrélations entre des variables continues, son extension au cas discret implique certaines restrictions. En effet, la nouvelle mesure pourrait être interprétée comme la corrélation entre les variables aléatoires continues dont la discrétisation constitue nos observations discrètes non négatives. Deux méthodes d'estimation des modèles augmentés en zéro seront présentées dans les contextes fréquentiste et bayésien basées respectivement sur le maximum de vraisemblance et l'intégration de Gauss-Hermite. Enfin, une étude de simulation permet de montrer la robustesse et les limites de notre approche. / This thesis presents some estimation methods and algorithms to analyse count data in particular and discrete data in general. It is also part of an NSERC strategic project, named CC-Bio, which aims to assess the impact of climate change on the distribution of plant and animal species in Québec.
After a brief introduction to the concepts and definitions of biogeography and those relative to the generalized linear mixed models in chapters 1 and 2 respectively, my thesis will focus on three major and new ideas.
First, we introduce in chapter 3 a new form of distribution whose components have marginal distribution Poisson or Skellam. This new specification allows to incorporate relevant information about the nature of the correlations between all the components. In addition, we present some properties of this probability distribution function. Unlike the multivariate Poisson distribution initially introduced, this generalization enables to handle both positive and negative correlations. A simulation study illustrates the estimation in the two-dimensional case. The results obtained by Bayesian methods via Monte Carlo Markov chain (MCMC) suggest a fairly low relative bias of less than 5% for the regression coefficients of the mean. However, those of the covariance term seem a bit more volatile.
Later, the chapter 4 presents an extension of the multivariate Poisson regression with random effects having a gamma density. Indeed, aware that the abundance data of species have a high dispersion, which would make misleading estimators and standard deviations, we introduce an approach based on integration by Monte Carlo sampling. The approach remains the same as in the previous chapter. Indeed, the objective is to simulate independent latent variables to transform the multivariate problem estimation in many generalized linear mixed models (GLMM) with conventional gamma random effects density. While the assumption of knowledge a priori dispersion parameters seems too strong and not realistic, a sensitivity analysis based on a measure of goodness of fit is used to demonstrate the robustness of the method.
Finally, in the last chapter, we focus on the definition and construction of a measure of concordance or a correlation measure for some zeros augmented count data with Gaussian copula models. In contrast to Kendall's tau whose values lie in an interval whose bounds depend on the frequency of ties observations, this measure has the advantage of taking its values on the interval (-1, 1). Originally introduced to model the correlations between continuous variables, its extension to the discrete case implies certain restrictions and its values are no longer in the entire interval (-1,1) but only on a subset. Indeed, the new measure could be interpreted as the correlation between continuous random variables before being transformed to discrete variables considered as our discrete non negative observations. Two methods of estimation based on integration via Gaussian quadrature and maximum likelihood are presented. Some simulation studies show the robustness and the limits of our approach.
|
8 |
Perception des objets en mouvement<br />Composition bayésienne du flux optique et du mouvement de l'observateurColas, Francis 27 January 2006 (has links) (PDF)
La perception est le regroupement d'informations en vue de comprendre son environnement. Pour cela, l'homme utilise plusieurs modalités sensorielles consistuées de plusieurs types d'information. L'une d'entre elles est le flux optique, le déplacement de l'image sur la rétine.<br />Le flux optique permet de recouvrer une partie de la géometrie de la scène observée, mais il s'agit d'un problème très complexe car inverse, mal-posé et incertain.<br />Ces difficultés peuvent être surmontées à l'aide du formalisme de la programmation bayésienne qui s'appuie sur l'usage des probabilités, pour manipuler l'incertitude et le caractère mal-posé, et de la règle de Bayes pour résoudre l'inversion.<br />Nous proposons un modèle bayésien de la perception de plans par le flux optique basé sur quelques hypothèses explicites. Ces hypothèses sont principalement la rigidité, qui considère que l'on observe plus probablement un plan rigide qu'une collection de points de mouvements indépendants et la sationnarité, qui suppose que le mouvement du plan est plus probablement petit.<br />Nous validons notre modèle en nous basant sur cinq expériences issues de la littérature. Pour chacune d'elles, nous expliquons les détails du fonctionnement du modèle et les hypothèses qui conditionnent la bonne reproduction des résultats. Enfin, nous montrons d'une part comment intégrer notre modele au sein de systèmes plus complexes et, d'autre part, l'applicabilité du modèle bayésien à des expériences de perception du flux optique différentes de part leurs protocoles, mais similaires dans leurs ambiguités.
|
9 |
Epidémiologie de la sclérose en plaques en FranceFromont, Agnès 06 November 2012 (has links) (PDF)
En Europe, la France est située entre des zones à haut et bas risque de Sclérose en Plaques (SEP).Nous avons estimé la prévalence de la SEP en France au 31 octobre 2004 et l'incidence entre 2000 et 2007 à partir des données de la Caisse Nationale d'Assurance Maladie des Travailleurs Salariés (CNAMTS) qui assure 87 % de la population. La SEP, comme d'autres maladies chroniques, fait partie des affections de longue durée (ALD). Les variations géographiques de la prévalence et de l'incidence ont été analysées par un modèle Bayesien.La prévalence standardisée sur l'âge était de 94,7 pour 100 000 ; 130,5 pour les femmes ; 54,8 pour les hommes. Le taux de notification de SEP (2000-2007) standardisé sur la population Européenne était de 6,8 pour 100 000 ; 9,8 parmi les femmes et 3,7 parmi les hommes. Avec le modèle Bayesien, la prévalence était plus forte au nord-est et plus faible dans la région parisienne et sur la Côte d'Azur. L'incidence était également plus forte au nord-est mais plus faible sur la côte atlantique et de part et d'autre du Rhône.A partir des autres ALD, les comorbidités survenant avant l'ALD SEP ont été étudiées. Elles étaient rares et essentiellement représentées par les troubles psychiatriques (40,2%) et le diabète (20,3%). Cette étude a été réalisée parmi une population représentative avec une seule et même méthodologie. Le modèle Bayesien prenant en compte l'hétérogénéité et l'auto-corrélation spatiales ne confirme pas l'existence d'un gradient net mais des zones à sur ou sous risque. La meilleure connaissance de l'épidémiologie de la SEP permettra d'avancer sur ses facteurs étiologiques.
|
10 |
Évaluation d'un modèle a priori basé sur un seuillage de la TCD en super-résolution et comparaison avec d'autres modèles a prioriSt-Onge, Philippe January 2008 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
|
Page generated in 0.031 seconds