• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 328
  • 163
  • 35
  • 1
  • Tagged with
  • 519
  • 265
  • 108
  • 95
  • 93
  • 84
  • 80
  • 79
  • 76
  • 74
  • 61
  • 60
  • 59
  • 56
  • 56
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
431

Inférence de réseaux pour modèles inflatés en zéro / Network inference for zero-inflated models

Karmann, Clémence 25 November 2019 (has links)
L'inférence de réseaux ou inférence de graphes a de plus en plus d'applications notamment en santé humaine et en environnement pour l'étude de données micro-biologiques et génomiques. Les réseaux constituent en effet un outil approprié pour représenter, voire étudier des relations entre des entités. De nombreuses techniques mathématiques d'estimation ont été développées notamment dans le cadre des modèles graphiques gaussiens mais aussi dans le cas de données binaires ou mixtes. Le traitement des données d'abondance (de micro-organismes comme les bactéries par exemple) est particulier pour deux raisons : d'une part elles ne reflètent pas directement la réalité car un processus de séquençage a lieu pour dupliquer les espèces et ce processus apporte de la variabilité, d'autre part une espèce peut être absente dans certains échantillons. On est alors dans le cadre de données inflatées en zéro. Beaucoup de méthodes d'inférence de réseaux existent pour les données gaussiennes, les données binaires et les données mixtes mais les modèles inflatés en zéro sont très peu étudiés alors qu'ils reflètent la structure de nombreux jeux de données de façon pertinente. L'objectif de cette thèse concerne l'inférence de réseaux pour les modèles inflatés en zéro. Dans cette thèse, on se limitera à des réseaux de dépendances conditionnelles. Le travail présenté dans cette thèse se décompose principalement en deux parties. La première concerne des méthodes d'inférence de réseaux basées sur l'estimation de voisinages par une procédure couplant des méthodes de régressions ordinales et de sélection de variables. La seconde se focalise sur l'inférence de réseaux dans un modèle où les variables sont des gaussiennes inflatées en zéro par double troncature (à droite et à gauche). / Network inference has more and more applications, particularly in human health and environment, for the study of micro-biological and genomic data. Networks are indeed an appropriate tool to represent, or even study, relationships between entities. Many mathematical estimation techniques have been developed, particularly in the context of Gaussian graphical models, but also in the case of binary or mixed data. The processing of abundance data (of microorganisms such as bacteria for example) is particular for two reasons: on the one hand they do not directly reflect reality because a sequencing process takes place to duplicate species and this process brings variability, on the other hand a species may be absent in some samples. We are then in the context of zero-inflated data. Many graph inference methods exist for Gaussian, binary and mixed data, but zero-inflated models are rarely studied, although they reflect the structure of many data sets in a relevant way. The objective of this thesis is to infer networks for zero-inflated models. In this thesis, we will restrict to conditional dependency graphs. The work presented in this thesis is divided into two main parts. The first one concerns graph inference methods based on the estimation of neighbourhoods by a procedure combining ordinal regression models and variable selection methods. The second one focuses on graph inference in a model where the variables are Gaussian zero-inflated by double truncation (right and left).
432

Climate change and agriculture / Changement climatique et agriculture

Gallic, Ewen 02 June 2017 (has links)
Le climat de la planète se réchauffe et ses effets sont entachés d'une forte incertitude. Une hausse de la température et de la fréquence d'événements extrêmes tels des inondations ou des sécheresses est prévue. La forte dépendance de l'agriculture aux conditions climatiques en fait de facto un champ d'application privilégié. Cette thèse se destine ainsi à étudier la relation entre climat et agriculture, afin d'évaluer les conséquences potentielles du changement climatique, en mêlant travaux empiriques et théoriques. Les deux premiers chapitres se concentrent sur les pays en développement au travers de deux études examinant la production et les profits agricoles ainsi que les décisions de consommation des ménages agricoles indiens. Les divers scénarios climatiques envisagés montrent un effet global négatif sur la production et les profits, particulièrement pour les ménages agricoles du sud du pays. L'irrigation tout comme le mélange des cultures permettent toutefois de réduire les dommages subis, notamment pour les petits exploitants. Les deux chapitres suivants considèrent des pays économiquement développés, en commençant par une étude des rendements céréaliers européens. Les projections sous les différents scénarios climatiques indiquent une faible croissance des rendements du blé d'ici à la fin du XXIe siècle, comparativement aux observations des 25 dernières années. Ces gains faibles sont toutefois accompagnés d'une forte hétérogénéité régionale. Pour le maïs, des faibles gains d'ici la moitié du XXIe s'effacent derrières de plus fortes pertes dans le long terme. L'approche partielle est ensuite délaissée pour laisser place à une analyse en équilibre général s'attachant à étudier les effets de court terme des chocs climatiques sur les cycles économiques, à travers leur impact sur l'agriculture. Une hausse de la variance des chocs climatiques conformément à celle prévue par des scénarios climatiques entraîne un accroissement substantiel de variables macroéconomiques telles la production et l'inflation. / Global climate is warming, and the effects of climate change are associated with a lot of uncertainty. Not only average temperatures are expected to rise, but also the occurrence of extreme events such as floods or droughts. Agriculture is particularly at risk, due to the importance of weather conditions in production. This thesis therefore aims at investigating the relationship between weather variations and agricultural production, to better assess the potential effects of climate change on agriculture, relying on both theoretical and empirical methods. The first two chapters focus on developing countries and provide two empirical studies based on Indian data at the individual farm level that link climate to agricultural production and profits and to consumption decisions. We find contrasted results, with an overall damaging effect of climate change scenarios on Indian agricultural production and profits, especially for farmers in southern India. Irrigation may however help mitigating the losses, as well as crop mixing, particularly for small farms. The last two chapters consider developed countries. The first step focuses on crop yields in Europe. Under the tested climate scenarios, wheat yields are projected to slightly increase by the end of the 21$^\textrm{st}$ century relative to the observed yields from the past 25 years. These small gains are however accompanied by a lot of regional heterogeneity. For European corn yields, the projections highlight small gains in by the middle of the 21$^\textrm{st}$ century, followed by relatively higher losses in the long run. The second step relies on a general equilibrium approach, and aims at investigating the short-run impacts of weather shocks on business cycles, through their damaging effects on agriculture. Increasing the variance of climate shocks in accordance with forthcoming climate change leads to a sizeable increase in the volatility of key macroeconomic variables, such as production and inflation.
433

Développement de méthodes statistiques nécessaires à l'analyse de données génomiques : application à l'influence du polymorphisme génétique sur les caractéristiques cutanées individuelles et l'expression du vieillissement cutané / Development of statistical methods for genetic data analysis : identification of genetic polymorphisms potentially involved in skin aging

Bernard, Anne 20 December 2013 (has links)
Les nouvelles technologies développées ces dernières années dans le domaine de la génétique ont permis de générer des bases de données de très grande dimension, en particulier de Single Nucleotide Polymorphisms (SNPs), ces bases étant souvent caractérisées par un nombre de variables largement supérieur au nombre d'individus. L'objectif de ce travail a été de développer des méthodes statistiques adaptées à ces jeux de données de grande dimension et permettant de sélectionner les variables les plus pertinentes au regard du problème biologique considéré. Dans la première partie de ce travail, un état de l'art présente différentes méthodes de sélection de variables non supervisées et supervisées pour 2 blocs de variables et plus. Dans la deuxième partie, deux nouvelles méthodes de sélection de variables non supervisées de type "sparse" sont proposées : la Group Sparse Principal Component Analysis (GSPCA) et l'Analyse des Correspondances Multiples sparse (ACM sparse). Vues comme des problèmes de régression avec une pénalisation group LASSO elles conduisent à la sélection de blocs de variables quantitatives et qualitatives, respectivement. La troisième partie est consacrée aux interactions entre SNPs et dans ce cadre, une méthode spécifique de détection d'interactions, la régression logique, est présentée. Enfin, la quatrième partie présente une application de ces méthodes sur un jeu de données réelles de SNPs afin d'étudier l'influence possible du polymorphisme génétique sur l'expression du vieillissement cutané au niveau du visage chez des femmes adultes. Les méthodes développées ont donné des résultats prometteurs répondant aux attentes des biologistes, et qui offrent de nouvelles perspectives de recherches intéressantes / New technologies developed recently in the field of genetic have generated high-dimensional databases, especially SNPs databases. These databases are often characterized by a number of variables much larger than the number of individuals. The goal of this dissertation was to develop appropriate statistical methods to analyse high-dimensional data, and to select the most biologically relevant variables. In the first part, I present the state of the art that describes unsupervised and supervised variables selection methods for two or more blocks of variables. In the second part, I present two new unsupervised "sparse" methods: Group Sparse Principal Component Analysis (GSPCA) and Sparse Multiple Correspondence Analysis (Sparse MCA). Considered as regression problems with a group LASSO penalization, these methods lead to select blocks of quantitative and qualitative variables, respectively. The third part is devoted to interactions between SNPs. A method employed to identify these interactions is presented: the logic regression. Finally, the last part presents an application of these methods on a real SNPs dataset to study the possible influence of genetic polymorphism on facial skin aging in adult women. The methods developed gave relevant results that confirmed the biologist's expectations and that offered new research perspectives.
434

Model Averaging in Large Scale Learning / Estimateur par agrégat en apprentissage statistique en grande dimension

Grappin, Edwin 06 March 2018 (has links)
Les travaux de cette thèse explorent les propriétés de procédures d'estimation par agrégation appliquées aux problèmes de régressions en grande dimension. Les estimateurs par agrégation à poids exponentiels bénéficient de résultats théoriques optimaux sous une approche PAC-Bayésienne. Cependant, le comportement théorique de l'agrégat avec extit{prior} de Laplace n'est guère connu. Ce dernier est l'analogue du Lasso dans le cadre pseudo-bayésien. Le Chapitre 2 explicite une borne du risque de prédiction de cet estimateur. Le Chapitre 3 prouve qu'une méthode de simulation s'appuyant sur un processus de Langevin Monte Carlo permet de choisir explicitement le nombre d'itérations nécessaire pour garantir une qualité d'approximation souhaitée. Le Chapitre 4 introduit des variantes du Lasso pour améliorer les performances de prédiction dans des contextes partiellement labélisés. / This thesis explores properties of estimations procedures related to aggregation in the problem of high-dimensional regression in a sparse setting. The exponentially weighted aggregate (EWA) is well studied in the literature. It benefits from strong results in fixed and random designs with a PAC-Bayesian approach. However, little is known about the properties of the EWA with Laplace prior. Chapter 2 analyses the statistical behaviour of the prediction loss of the EWA with Laplace prior in the fixed design setting. Sharp oracle inequalities which generalize the properties of the Lasso to a larger family of estimators are established. These results also bridge the gap from the Lasso to the Bayesian Lasso. Chapter 3 introduces an adjusted Langevin Monte Carlo sampling method that approximates the EWA with Laplace prior in an explicit finite number of iterations for any targeted accuracy. Chapter 4 explores the statisctical behaviour of adjusted versions of the Lasso for the transductive and semi-supervised learning task in the random design setting.
435

Analyse de trajectoires, perte d'autonomie et facteurs prédictifs : Modélisation de trajectoires / Trajectory analysis, loss of independence and predictive factors : Trajectory modeling

Bimou, Charlotte 09 October 2019 (has links)
La poursuite du rythme d’augmentation de l’espérance de vie des générations issue du baby-boom dans les pays développés serait souvent accompagnée de limitations fonctionnelles, d’incapacité, de plus en plus observées dans la population gériatrique. L'objectif général de cette thèse était de contribuer à la connaissance de l’évolution de l’autonomie fonctionnelle des personnes âgées dans une population hétérogène. Il s’agissait dans un premier temps d'identifier des groupes homogènes dans une population hétérogène de personnes âgées suivant la même trajectoire d'autonomie fonctionnelle sur une période de deux ans, ainsi que des facteurs prédictifs potentiels. Dans un second temps, d’analyser les conséquences cliniques des trajectoires et la survie des patients sur la même période d’observation. Le SMAF (Système de Mesure de l’Autonomie Fonctionnelle) et les échelles ADL (Activities of Daily Living) ont été employés comme indicateurs d’évaluation de l’autonomie. Dans ce contexte, des données de 221 patients issues de la cohorte UPSAV (Unité de Prévention, de Suivi et d’Analyse du Vieillissement) ont été exploitées. Nous avons employé trois méthodes d’analyse de trajectoires dont le GBTM (Group-Based Trajectory Modeling), k-means et classification ascendante hiérarchique. Les résultats ont révélé trois trajectoires distinctes d’autonomie fonctionnelle : stable, stable pendant un temps puis détériorée, continuellement altérée. Les facteurs prédictifs des trajectoires obtenus à l’aide de la régression logistique sont des critères socio-démographiques, médicaux et biologiques. Les personnes âgées affectées à la trajectoire de perte d’autonomie (trajectoire continuellement altérée) ont montré de fortes proportions de chutes dommageables. A partir d’un modèle de Cox, les troubles neurocognitifs, l’insuffisance cardiaque, la perte de poids involontaire et l’alcool ont été révélés comme facteurs prédictifs de la survenue du décès. On conclut de ces travaux que l’analyse longitudinale sur deux ans de suivi a permis de trouver des sous-groupes homogènes de personnes âgées en termes d’évolution de l’indépendance fonctionnelle. Quel que soit le niveau d’autonomie, la prévention de l’UPSAV devient utile même si le niveau d’utilité n’est pas le même. La prévention et le dépistage de la perte d’autonomie de la personne âgée suivie sur son lieu de vie doivent être anticipés afin de retarder la dégradation et maintenir l’autonomie à domicile. Des analyses ultérieures devraient s’intéresser à l’exploration de plus larges cohortes de personnes âgées pour confirmer et généraliser notre travail. / The increase in life expectancy of baby boom generations in developed countries would often be accompanied by functional limitations, disability, increasingly observed in the geriatric population. The general objective of this thesis was to contribute to the knowledge of the evolution of the functional independence of older people in a heterogeneous population. First, it was to identify homogeneous groups in a heterogeneous population of elderly people following the same functional independence trajectory over a two-year period, and potential predictive factors. Second, it was to analyze the clinical consequences of trajectories and patient survival over the same observation period. The SMAF (Système de Mesure de l'Autonomie Fonctionnelle) and ADL (Activities of Daily Living) scales were used as indicators for measuring independence. Analysis were performed from a sample of 221 patients of UPSAV (Unit for Prevention, Monitoring and Analysis of Aging) cohort. We used three methods including trajectory analysis including GBTM (Group-Based Trajectory Modeling), k-means and ascending hierarchical classification. The results suggest three distinct trajectories of functional independence: stable, stable then decline, continuously decline. The predictors of trajectories obtained using logistic regression are socio-demographic, medical and biological criteria. Patients assigned to the loss of independence trajectory (continuously altered trajectory) reported high proportions of injurious falls. Based on a Cox model, neurocognitive disorders, heart failure, involuntary weight loss and alcohol were revealed as predictors of death. We conclude from this work that the two-year longitudinal analysis identified homogeneous subgroups of elderly people in terms of changes in functional independence. The prevention of UPSAV becomes a useful even if the utility level is not the same. Prevention and screening of the loss of independence of the elderly person followed at home must be anticipated in order to delay the deterioration and to maintaining the autonomy. Future analyses should focus on exploring large cohorts of older people to confirm and generalize our research.
436

Contributions à la modélisation de données spatiales et fonctionnelles : applications / Contributions to modeling spatial and functional data : applications

Ternynck, Camille 28 November 2014 (has links)
Dans ce mémoire de thèse, nous nous intéressons à la modélisation non paramétrique de données spatiales et/ou fonctionnelles, plus particulièrement basée sur la méthode à noyau. En général, les échantillons que nous avons considérés pour établir les propriétés asymptotiques des estimateurs proposés sont constitués de variables dépendantes. La spécificité des méthodes étudiées réside dans le fait que les estimateurs prennent en compte la structure de dépendance des données considérées.Dans une première partie, nous appréhendons l’étude de variables réelles spatialement dépendantes. Nous proposons une nouvelle approche à noyau pour estimer les fonctions de densité de probabilité et de régression spatiales ainsi que le mode. La particularité de cette approche est qu’elle permet de tenir compte à la fois de la proximité entre les observations et de celle entre les sites. Nous étudions les comportements asymptotiques des estimateurs proposés ainsi que leurs applications à des données simulées et réelles.Dans une seconde partie, nous nous intéressons à la modélisation de données à valeurs dans un espace de dimension infinie ou dites "données fonctionnelles". Dans un premier temps, nous adaptons le modèle de régression non paramétrique introduit en première partie au cadre de données fonctionnelles spatialement dépendantes. Nous donnons des résultats asymptotiques ainsi que numériques. Puis, dans un second temps, nous étudions un modèle de régression de séries temporelles dont les variables explicatives sont fonctionnelles et le processus des innovations est autorégressif. Nous proposons une procédure permettant de tenir compte de l’information contenue dans le processus des erreurs. Après avoir étudié le comportement asymptotique de l’estimateur à noyau proposé, nous analysons ses performances sur des données simulées puis réelles.La troisième partie est consacrée aux applications. Tout d’abord, nous présentons des résultats de classification non supervisée de données spatiales (multivariées), simulées et réelles. La méthode de classification considérée est basée sur l’estimation du mode spatial, obtenu à partir de l’estimateur de la fonction de densité spatiale introduit dans le cadre de la première partie de cette thèse. Puis, nous appliquons cette méthode de classification basée sur le mode ainsi que d’autres méthodes de classification non supervisée de la littérature sur des données hydrologiques de nature fonctionnelle. Enfin, cette classification des données hydrologiques nous a amené à appliquer des outils de détection de rupture sur ces données fonctionnelles. / In this dissertation, we are interested in nonparametric modeling of spatial and/or functional data, more specifically based on kernel method. Generally, the samples we have considered for establishing asymptotic properties of the proposed estimators are constituted of dependent variables. The specificity of the studied methods lies in the fact that the estimators take into account the structure of the dependence of the considered data.In a first part, we study real variables spatially dependent. We propose a new kernel approach to estimating spatial probability density of the mode and regression functions. The distinctive feature of this approach is that it allows taking into account both the proximity between observations and that between sites. We study the asymptotic behaviors of the proposed estimates as well as their applications to simulated and real data. In a second part, we are interested in modeling data valued in a space of infinite dimension or so-called "functional data". As a first step, we adapt the nonparametric regression model, introduced in the first part, to spatially functional dependent data framework. We get convergence results as well as numerical results. Then, later, we study time series regression model in which explanatory variables are functional and the innovation process is autoregressive. We propose a procedure which allows us to take into account information contained in the error process. After showing asymptotic behavior of the proposed kernel estimate, we study its performance on simulated and real data.The third part is devoted to applications. First of all, we present unsupervised classificationresults of simulated and real spatial data (multivariate). The considered classification method is based on the estimation of spatial mode, obtained from the spatial density function introduced in the first part of this thesis. Then, we apply this classification method based on the mode as well as other unsupervised classification methods of the literature on hydrological data of functional nature. Lastly, this classification of hydrological data has led us to apply change point detection tools on these functional data.
437

Inférence statistique dans le modèle de régression logistique avec fraction immune / Statistical inference in logistic regression model with immune fraction

Diop, Aba 15 November 2012 (has links)
Les modèles linéaires généralisés sont une généralisation des modèles de régression linéaire, et sont très utilisés dans le domaine du vivant. Le modèle de régression logistique, l'un des modèles de cette classe, très souvent utilisé dans les études biomédicales demeure le modèle de régression le plus approprié quand il s'agit de modéliser une variable discrète de nature binaire. Dans cette thèse, nous nous intéressons au problème de l'inférence statistique dans le modèle de régression logistique, en présence d'individus immunes dans la population d'étude.Dans un premier temps, nous considérons le problème de l'estimation dans le modèle de régression logistique en présence d'individus immunes, qui entre dans le cadre des modèles de régression à excès de zéros (ou zéro-inflatés). Un individu est dit immune s'il n'est pas exposé à l'événement d'intérêt. Le statut d'immunité est inconnu sauf si l'événement d'intérêt a été observé. Nous développons une méthode d'estimation par maximum de vraisemblance en proposant une modélisation conjointe de l'immunité et des risques d'infection. Nous établissons d'abord l'identifiabilité du modèle proposé. Puis, nous montrons l'existence de l'estimateur du maximum de vraisemblance des paramètres de ce modèle. Nous montrons ensuite,la consistance de cet estimateur, et nous établissons sa normalité asymptotique. Enfin, nous étudions, au moyen de simulations, leur comportement sur des échantillons de taille finie.Dans un deuxième temps, nous nous intéressons à la construction de bandes de confiance simultanées pour la probabilité d'infection, dans le modèle de régression logistique avec fraction immune. Nous proposons trois méthodes de constructions de bandes de confiance pour la fonction de régression. La première méthode (méthodede Scheffé) utilise la propriété de normalité asymptotique de l'estimateur du maximum de vraisemblance, et une approximation par une loi du khi deux pour approcher le quantile nécessaire à la construction des bandes. La deuxième méthode utilise également la propriété de normalité asymptotique de l'estimateur du maximum de vraisemblance et est basée sur une égalité classique de (Landau & Sheep 1970). La troisième méthode (méthode bootstrap) repose sur des simulations, pour estimer le quantile approprié de la loi du supremum d'un processus gaussien. Enfin, nous évaluons, au moyen de simulations, leurs propriétés sur des échantillons de taille finie.Enfin, nous appliquons les résultats de modélisation à des données réelles surla dengue. Il s'agit d'une maladie vectorielle tropicale à transmission strictement inter-humaine. Les résultats montrent que les probabilités d'infection estimées à partir de notre approche de modélisation sont plus élevées que celles obtenues à partir d'un modèle de régression logistique standard qui ne tient pas compte d'une possible immunité. En particulier, les estimations fournies par notre approche suggèrent que le sous-poids constitue un facteur de risque majeur de l'infection par la dengue, indépendamment de l'âge. / Generalized linear models are a generalization of linear regression models, and are widely used in the field of life. The logistic regression model, one of this class of models, widely used in biomedical studies remains the most appropriate regression model when it comes to model discrete variable, binary in nature. In this thesis, we investigate the problem of statistical inference in the logistic regression model, in the presence of immune individuals in the study population.At first, we consider the problem of estimation in the logistic regression model in the presence of immune individuals that enters in the case of zero-inflated regression models. A subject is said to be immune if he cannot experience the outcome of interest. The immune status is unknown unless the event of interest has been observed. We develop a maximum like lihood estimation procedure for this problem, based on the joint modeling of the binary response of interest and the cure status. We investigate the identifiability of the resulting model. Then, we establish the existence, consistency and asymptotic normality of the proposed estimator, and we conduct a simulation study to investigate its finite-sample behavior. In a second time, we focus on the construction of simultaneous confidence bands for the probability of infection in the logistic regression model with immune fraction.We propose three methods of construction of confidence bands for the regression function. The first method (Scheffe's method) uses the asymptotic normality of the maximum like lihood estimator, and an approximation by the chi-squared distribution to approximate the necessary quantile for the construction of bands. The second method uses also the asymptotic normality of the maximum like lihood estimator and is based on a classical equality by (Landau & Sheep 1970). The third method (bootstrap method) is based on simulations, to estimate the appropriate quantile of the law of a supremum of a Gaussian process. Finally, we conduct a simulation study to investigate its finite-sample properties.Finally, we consider a study of dengue fever, which is a tropical mosquito-borneviral human disease, strictly inter-human. The results show that, the estimated probabilities of infection obtained from our approach are larger than the ones derived from a standard analysis that does not take account of the possible immunity. Inparticular, the estimates provided by our approach suggest that underweight constitutes a major risk factor for dengue infection, irrespectively of age.
438

Liens entre activité physique quotidienne et utilisation de l’automobile comme moyen de transport : une étude transversale montréalaise

Parenteau, Nicolas 11 1900 (has links)
Contexte: La réduction de l'utilisation de l’automobile a déjà été identifiée comme étant une intervention populationnelle pouvant promouvoir l’activité physique. Les recherches portant sur la relation entre l’utilisation de l’automobile et l’activité physique utilisent typiquement une variable catégorielle pour décrire le mode de transport, tiennent peu compte du motif de déplacement et n’explorent pas la variation de l’association selon le lieu de résidence. Cette étude utilise à la fois l'activité physique auto-rapportée et objectivement mesurée pour tester l'association entre l’utilisation de l’automobile et l’activité physique totale, tout en tenant compte de ces limitations antérieures. Méthode: Les données de 780 participants provenant de la branche montréalaise de l’étude INTERACT (2018-2019) ont été analysées. Des modèles de régression linéaire ont été construits afin d’examiner la relation entre l’utilisation de l’automobile et l'activité physique modérée-vigoureuse (APMV) totale (auto-rapportée avec transformation logarithmique et objectivement mesurée). Ensuite, le motif de déplacement a été inclus dans ces modèles. Enfin, une régression pondérée géographiquement a permis d’explorer la variation spatiale de l'association entre l’usage de l’automobile et l’APMV. Résultats: La proportion des déplacements effectués en automobile est associée négativement avec l'APMV totale auto-rapportée (coefficient : -0,009, intervalle de confiance à 95% : -0,012 à -0,006) et objectivement mesurée (Coefficient : -0,29 minute par jour, intervalle de confiance à 95% : -0,55 à -0,03). La régression pondérée géographiquement indique une faible variation spatiale de l'association entre l'utilisation de l’automobile et l’APMV totale auto-rapportée. Le nombre de déplacements pour un motif tel que commerce et services est associé à l'APMV totale. Conclusion: Cette étude transversale a démontré une association négative entre l’utilisation de l’automobile et l’APMV totale sur le territoire montréalais. Certains motifs de déplacement sont associés à l’activité physique totale. / Background: Car usage reduction has previously been pointed out to be a population-based intervention promoting physical activity. Previous literature on the car usage-physical activity relation typically uses categorical variables for transport modes, rarely accounts for trip purpose and does not explore the influence of home location on this association. This study uses both self-reported and objectively measured physical activity to test the association between car usage and total daily physical activity, while accounting for previous limitations. Methods: INTERACT data collected in 2018-2019 among 780 participants from the Montreal metropolitan area site were analysed. Linear regression models of self-reported (log-transformed) and objectively measured total moderate-vigorous physical activity (MVPA) were built separately, as a function of car usage. Trip purpose was then included in these models. Finally, a geographically weighted regression (GWR) model was built to explore the spatial variation of the car usage-MVPA association. Results: The proportion of trips made by car showed a negative association with both self-reported (coefficient: -0.009, 95% CI [-0.012, -0.006]) and objectively measured (coefficient: -0.29 minutes per day, 95% CI [-0.55, -0.03]) total MVPA. GWR showed little spatial variation in the car usage-total self-reported MVPA. The number of trips toward certain purposes (e.g. “shops and services”) is associated with total MVPA. Conclusion: This cross-sectional study showed a negative association between car usage and total MVPA in the Montreal metropolitan area. Some trip purpose is associated with total physical activity.
439

Profils alimentaires, niveau de transformation des aliments et risque de cancer de la prostate : une étude cas-témoins à Montréal, Canada

Trudeau, Karine 12 1900 (has links)
Le cancer de la prostate est le cancer le plus fréquemment diagnostiqué chez les hommes canadiens. Aucun facteur de risque modifiable n’a été identifié, mais l’alimentation pourrait être impliquée. Les profils alimentaires, décrivant l’ensemble de l’apport alimentaire, constituent une approche de recherche prometteuse. L’objectif général de cette thèse était d’évaluer le rôle des profils alimentaires et du niveau de transformation des aliments sur le risque de cancer de la prostate. Les données colligées dans une vaste étude cas-témoins populationnelle menée chez les résidents montréalais ont été utilisées. Les 1919 cas incidents histologiquement confirmés étaient âgés de 75 ans ou moins et avaient été diagnostiqués entre 2005 et 2009. Les 1991 témoins ont été sélectionnés aléatoirement à partir de la liste électorale, puis appariés aux cas selon l’âge (± 5 ans). Les informations concernant l’alimentation ont été recueillies avec un questionnaire de fréquence alimentaire documentant la consommation deux ans avant le diagnostic ou l’entrevue. Le premier objectif visait à identifier des profils alimentaires parmi les témoins francophones ainsi que les caractéristiques associées à ces profils. Une analyse en composantes principales a permis d’identifier les profils alimentaires Santé, Occidental modifié - Salé et Occidental modifié - Sucré. Le profil Santé a été associé à des niveaux plus élevés de revenu et d’éducation, à un niveau modéré d’activité physique et à un faible niveau de tabagisme. Le profil Occidental modifié - Salé a été associé avec des ethnicités française, européenne (autre que française) ou latine, avec le fait d’être marié ou en union libre, et était inversement associé avec l’âge. Le profil Occidental modifié - Sucré était plus commun chez les hommes d’origine française et chez les consommateurs de suppléments de vitamines et minéraux. Le deuxième objectif visait à évaluer les associations entre les profils alimentaires et le cancer de la prostate. Les rapports de cotes (RC) et intervalles de confiance (IC) à 95% ont été obtenus par régression logistique non conditionnelle ajustée pour les facteurs de confusion. Le profil Santé était inversement associé au risque de cancer de la prostate (RC= 0,76 [IC 95% = 0,61-0,93], en comparant le quartile supérieur au quartile inférieur). Le profil Occidental - Sucré et Boissons était associé à une augmentation du risque de cancer de la prostate (RC= 1,35 [IC 95% =1,10-1,66], quartile supérieur vs inférieur). Ces résultats sont novateurs. Aucune association n’a été observée avec le profil Occidental - Salé et Alcool. Le troisième objectif visait à évaluer l’association entre le niveau de transformation des aliments et le cancer de la prostate. Les aliments transformés étaient associés à une augmentation du risque (RC= 1,32 [IC 95% =1,07-1,62], quartile supérieur vs inférieur) et l’association était légèrement plus prononcée pour les cancers agressifs. En conclusion, ces résultats suggèrent que les profils alimentaires et le niveau de transformation des aliments jouent un rôle dans le développement du cancer de la prostate. Il s’agit d’informations importantes pour soutenir la promotion de saines habitudes de vie et la prévention du cancer de la prostate. / Prostate cancer is the most commonly diagnosed cancer among men in Canada. No modifiable risk factor has been identified, but diet is suspected to play a role. Dietary patterns, which describe the overall dietary intake rather than the consumption of specific foods or nutrients, represent a promising research approach. The general objective of this thesis was to assess the role of dietary patterns and the level of food processing on the risk of prostate cancer. Data collected in a large population-based case-control study conducted among Montreal residents were used. The 1919 histologically confirmed incident cases were 75 years of age or younger and had been diagnosed between 2005 and 2009. Concurrently, the 1991 controls were randomly selected from the electoral list and frequency-matched to cases by age (± 5 years). Food consumption was assessed using a food frequency questionnaire focusing on the period two years before diagnosis or interview. The first objective was to identify dietary patterns among the French-speaking controlsas well as the characteristics associated with these patterns. Principal component analysis led to the identification of three dietary patterns: Healthy, Western modified - Salty and Western modified - Sweet. The Healthy pattern was associated with higher income, education, moderate levels of recreational physical activity and lower levels of smoking. The Western modified – Salty pattern was positively associated with French, other European (other than French), and Latino ancestries, and with married and common-law relationships, whereas it was inversely associated with age. Finally, the Modified Western – Sweet pattern was more common among men of French ancestry and users of vitamin/mineral supplements. The second objective was to assess associations between the different dietary patterns and prostate cancer. Odds ratios (OR) and 95% confidence interval (95% CI) were obtained by unconditional logistic regression adjusting for confounders. The Healthy dietary pattern was inversely associated with prostate cancer (OR = 0,76 [95% CI = 0,61-0,93], highest vs lowest quartile), whereas the Western - Sweet and beverages pattern increased the risk of this cancer (OR = 1,35 [95% CI = 1,10-1,66], highest vs lowest quartile). Both results are novel. The Western - Salty and alcohol pattern was not associated with prostate cancer risk. The third objective was to assess the association between the level of food processing and prostate cancer. The level of food processing in the diet was assigned using the NOVA food classification. Processed foods were associated with an increased risk (OR = 1,32 [95% CI] = 1,07-1,62], highest vs lowest quartile) of prostate cancer, and the association was slightly more pronounced for high-grade prostate cancers. In conclusion, these results suggest that dietary patterns and the level of food processing play a role on the risk of developing prostate cancer. This information is important for promoting a healthy lifestyle and for prostate cancer prevention.
440

Reinforcement learning applied to the real world : uncertainty, sample efficiency, and multi-agent coordination

Mai, Vincent 12 1900 (has links)
L'immense potentiel des approches d'apprentissage par renforcement profond (ARP) pour la conception d'agents autonomes a été démontré à plusieurs reprises au cours de la dernière décennie. Son application à des agents physiques, tels que des robots ou des réseaux électriques automatisés, est cependant confrontée à plusieurs défis. Parmi eux, l'inefficacité de leur échantillonnage, combinée au coût et au risque d'acquérir de l'expérience dans le monde réel, peut décourager tout projet d'entraînement d'agents incarnés. Dans cette thèse, je me concentre sur l'application de l'ARP sur des agents physiques. Je propose d'abord un cadre probabiliste pour améliorer l'efficacité de l'échantillonnage dans l'ARP. Dans un premier article, je présente la pondération BIV (batch inverse-variance), une fonction de perte tenant compte de la variance du bruit des étiquettes dans la régression bruitée hétéroscédastique. La pondération BIV est un élément clé du deuxième article, où elle est combinée avec des méthodes de pointe de prédiction de l'incertitude pour les réseaux neuronaux profonds dans un pipeline bayésien pour les algorithmes d'ARP avec différences temporelles. Cette approche, nommée apprentissage par renforcement à variance inverse (IV-RL), conduit à un entraînement nettement plus rapide ainsi qu'à de meilleures performances dans les tâches de contrôle. Dans le troisième article, l'apprentissage par renforcement multi-agent (MARL) est appliqué au problème de la réponse rapide à la demande, une approche prometteuse pour gérer l'introduction de sources d'énergie renouvelables intermittentes dans les réseaux électriques. En contrôlant la coordination de plusieurs climatiseurs, les agents MARL obtiennent des performances nettement supérieures à celles des approches basées sur des règles. Ces résultats soulignent le rôle potentiel que les agents physiques entraînés par MARL pourraient jouer dans la transition énergétique et la lutte contre le réchauffement climatique. / The immense potential of deep reinforcement learning (DRL) approaches to build autonomous agents has been proven repeatedly in the last decade. Its application to embodied agents, such as robots or automated power systems, is however facing several challenges. Among them, their sample inefficiency, combined to the cost and the risk of gathering experience in the real world, can deter any idea of training embodied agents. In this thesis, I focus on the application of DRL on embodied agents. I first propose a probabilistic framework to improve sample efficiency in DRL. In the first article, I present batch inverse-variance (BIV) weighting, a loss function accounting for label noise variance in heteroscedastic noisy regression. BIV is a key element of the second article, where it is combined with state-of-the-art uncertainty prediction methods for deep neural networks in a Bayesian pipeline for temporal differences DRL algorithms. This approach, named inverse-variance reinforcement learning (IV-RL), leads to significantly faster training as well as better performance in control tasks. In the third article, multi-agent reinforcement learning (MARL) is applied to the problem of fast-timescale demand response, a promising approach to the manage the introduction of intermittent renewable energy sources in power-grids. As MARL agents control the coordination of multiple air conditioners, they achieve significantly better performance than rule-based approaches. These results underline to the potential role that DRL trained embodied agents could take in the energetic transition and the fight against global warming.

Page generated in 0.0701 seconds