• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 17
  • 10
  • 3
  • Tagged with
  • 29
  • 29
  • 22
  • 21
  • 8
  • 7
  • 7
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Inégalités de revenus des ménages ruraux à Madagascar. / Income inequality of rural households in Madagascar

Mbima, Césaire 13 January 2017 (has links)
Madagascar est un pays riche en ressources naturelles mais sa population reste pauvre et vit dans un écart de revenus important. Cette étude aborde le thème des "Inégalités de revenus des ménages en milieu rural malgache" afin de pouvoir apporter des éclaircissements à ce phénomène qui, d’une part, ruine la population rurale et, d’autre part, fragilise la stabilité et la performance économique du pays. Focalisée sur une période quinquennale d’observations répétées, la thèse porte sur les données de panel issues de 667 ménages. La thèse retrace le processus de calculs des revenus des paysans et du "seuil d’inégalité". Adoptant les modèles linéaire et non-linéaire, il s’attache aux spécifications et aux estimations des déterminants qui creusent ou réduisent les écarts de revenus des ménages intra-observatoires et entre observatoires de la côte Centre-Est. Les inégalités de revenus des ménages ruraux existent dans la société rurale Betsimisaraka. Elles sont multiformes. Plus de huit ménages sur dix vivent dans la "zone des pauvres inégalitaires". Les paysans de Mahanoro sont les plus pauvres et subissent aussi plus d’inégalités que ceux de Fénérive-Est. En revanche, à l’intérieur de l’observatoire, la situation a légèrement tendance à décroître au fil du temps. Pour une population assez homogène vivant dans une pauvreté alarmante, les inégalités entre ménages pauvres ne sont pas trop élevées. Les résultats des modèles économétriques soutiennent que la bonne production annuelle de riz réduit les écarts de revenus tandis que le sexe féminin et le niveau d’éducation du chef de ménage, la faible superficie rizicole ainsi que l’investissement, le dépôt financier, la thésaurisation, le sans épargne, l’emprunt, les revenus secondaires, le PIB et la crise politique accentuent les inégalités de revenus / Madagascar is a country rich in natural resources, but its population is poor and lives in a significant income gap. This thesis deals with the issue of "household income inequalities in rural areas in Madagascar", in order to clarify this phenomenon which, on the one hand, ruin the rural population and on the other hand, weakens the country's stability and the economic performance. Covering a five-year period of repeated observations, this thesis focuses on data from 667 households, from a balanced panel. The thesis traces the calculation process of farmers’ income and “inequality threshold”. Adopting linear and non-linear models, it endeavors to specify and estimate determinants that increase or reduce the wealth gap within and between observatories of the Central East Coast of Madagascar. Income inequalities of rural households are found in Betsimisaraka rural society. They are multifaceted. More than eight out of ten households live in the “area of unequal poors”. The farmers in Mahanoro are poorer and suffer more inequalities than in Fenerive Est. However, inside the observatory, the situation slightly tends to increase over time. For a rather homogeneous population living in alarming poverty, the inequalities between poor households are not too high. The results of econometric models argue that the good annual production of rice reduces income disparities, whereas the feminine gender and the education level of the household head, the small size of rice area along with the investment, the financial deposit, the hoarding, the "No savings", the debt, the secondary income, the GDP and the political crisis contribute to greater income inequalities.
22

Contribution à la sélection de variables en présence de données longitudinales : application à des biomarqueurs issus d'imagerie médicale / Contribution to variable selection in the presence of longitudinal data : application to biomarkers derived from medical imaging

Geronimi, Julia 13 December 2016 (has links)
Les études cliniques permettent de mesurer de nombreuses variables répétées dans le temps. Lorsque l'objectif est de les relier à un critère clinique d'intérêt, les méthodes de régularisation de type LASSO, généralisées aux Generalized Estimating Equations (GEE) permettent de sélectionner un sous-groupe de variables en tenant compte des corrélations intra-patients. Les bases de données présentent souvent des données non renseignées et des problèmes de mesures ce qui entraîne des données manquantes inévitables. L'objectif de ce travail de thèse est d'intégrer ces données manquantes pour la sélection de variables en présence de données longitudinales. Nous utilisons la méthode d'imputation multiple et proposons une fonction d'imputation pour le cas spécifique des variables soumises à un seuil de détection. Nous proposons une nouvelle méthode de sélection de variables pour données corrélées qui intègre les données manquantes : le Multiple Imputation Penalized Generalized Estimating Equations (MI-PGEE). Notre opérateur utilise la pénalité group-LASSO en considérant l'ensemble des coefficients de régression estimés d'une même variable sur les échantillons imputés comme un groupe. Notre méthode permet une sélection consistante sur l'ensemble des imputations, et minimise un critère de type BIC pour le choix du paramètre de régularisation. Nous présentons une application sur l'arthrose du genoux où notre objectif est de sélectionner le sous-groupe de biomarqueurs qui expliquent le mieux les différences de largeur de l'espace articulaire au cours du temps. / Clinical studies enable us to measure many longitudinales variables. When our goal is to find a link between a response and some covariates, one can use regularisation methods, such as LASSO which have been extended to Generalized Estimating Equations (GEE). They allow us to select a subgroup of variables of interest taking into account intra-patient correlations. Databases often have unfilled data and measurement problems resulting in inevitable missing data. The objective of this thesis is to integrate missing data for variable selection in the presence of longitudinal data. We use mutiple imputation and introduce a new imputation function for the specific case of variables under detection limit. We provide a new variable selection method for correlated data that integrate missing data : the Multiple Imputation Penalized Generalized Estimating Equations (MI-PGEE). Our operator applies the group-LASSO penalty on the group of estimated regression coefficients of the same variable across multiply-imputed datasets. Our method provides a consistent selection across multiply-imputed datasets, where the optimal shrinkage parameter is chosen by minimizing a BIC-like criteria. We then present an application on knee osteoarthritis aiming to select the subset of biomarkers that best explain the differences in joint space width over time.
23

Analyse de sensibilité de l’effet d’un programme de prévention avec randomisation : application de trois techniques d’appariement pour balancer les groupes contrôle et expérimental : distance de Mahanalobis, score de propension et algorithme génétique

Maurice, François 03 1900 (has links)
Les analyses effectuées dans le cadre de ce mémoire ont été réalisées à l'aide du module MatchIt disponible sous l’environnent d'analyse statistique R. / Statistical analyzes of this thesis were performed using the MatchIt package available in the statistical analysis environment R. / L’estimation sans biais de l’effet causal d’une intervention nécessite la comparaison de deux groupes homogènes. Il est rare qu’une étude observationnelle dispose de groupes comparables et même une étude expérimentale peut se retrouver avec des groupes non comparables. Les chercheurs ont alors recours à des techniques de correction afin de rendre les deux groupes aussi semblables que possible. Le problème consiste alors à choisir la méthode de correction appropriée. En ce qui nous concerne, nous limiterons nos recherches à une famille de méthodes dites d’appariement. Il est reconnu que ce qui importe lors d’un appariement est l’équilibre des deux groupes sur les caractéristiques retenues. Autrement dit, il faut que les variables soient distribuées de façon similaire dans les deux groupes. Avant même de considérer la distribution des variables entre les deux groupes, il est nécessaire de savoir si les données en question permettent une inférence causale. Afin de présenter le problème de façon rigoureuse, le modèle causal contrefactuel sera exposé. Par la suite, les propriétés formelles de trois méthodes d’appariement seront présentées. Ces méthodes sont l’appariement par la distance de Mahalanobis, de l’appariement par le score de propension et de l’appariement génétique. Le choix de la technique d’appariement appropriée reposera sur quatre critères empiriques dont le plus important est la différence des moyennes standardisées. Les résultats obtenus à l’aide des données de l’Enquête longitudinale et expérimentale de Montréal (ÉLEM) indiquent que des trois techniques d’appariement, l’appariement génétique est celui qui équilibre mieux les variables entre les groupes sur tous les critères retenus. L’estimation de l’effet de l’intervention varie sensiblement d’une technique à l’autre, bien que dans tous les cas cet effet est non significatif. Ainsi, le choix d’une technique d’appariement influence l’estimation de l’effet d’une intervention. Il est donc impérieux de choisir la technique qui permet d’obtenir un équilibre optimal des variables selon les données à la disposition du chercheur. / The unbiased estimate of the causal effect of an intervention requires the comparison of two homogeneous groups. It is rare that an observational study has comparable groups and even an experiment may end up with non-comparable groups. The researchers then used correction techniques to make the two groups as similar as possible. The problem then is to choose the appropriate correction method. In our case, we will restrict our research to a family of so-called matching methods. It is recognized that what matters in a match is the balance between the two groups on selected characteristics. In other words, it is necessary that the variables are distributed similarly in both groups. Even before considering the distribution of variables between the two groups, it is necessary to know whether the data in question allow for causal inference. To present the problem rigorously, the counterfactual causal model will be exposed. Thereafter, the formal properties of three matching methods will be presented. Those methods are the Mahalanobis matching, the propensity score matching and genetic matching. The choice of the appropriate matching technique is based on four empirical criteria which the most important is the standardized mean difference. Results obtained using data from the Montréal Longitudinal and Experimental Study indicate that of the three matching techniques, genetic matching is the one that better balance the variables between groups on all criteria. The estimate of the effect of intervention varies substantially from one technique to another, although in all cases this effect is non significant. Thus, the selection of a matching technique influences the estimation of the effect of an intervention. Therefore, it is imperative to choose the technique that provides an optimal balance of the variables based on data available to the researcher.
24

Analyse statistique de données fonctionnelles à structures complexes

Adjogou, Adjobo Folly Dzigbodi 05 1900 (has links)
No description available.
25

Modélisation conjointe de trajectoire socioprofessionnelle individuelle et de la survie globale ou spécifique / Joint modeling of individual socio-professional trajectory and overall or cause-specific survival

Karimi, Maryam 06 June 2016 (has links)
Appartenir à une catégorie socio-économique moins élevée est généralement associé à une mortalité plus élevée pour de nombreuses causes de décès. De précédentes études ont déjà montré l’importance de la prise en compte des différentes dimensions des trajectoires socio-économiques au cours de la vie. L’analyse des trajectoires professionnelles constitue une étape importante pour mieux comprendre ces phénomènes. L’enjeu pour mesurer l’association entre les parcours de vie des trajectoires socio-économiques et la mortalité est de décomposer la part respective de ces facteurs dans l’explication du niveau de survie des individus. La complexité de l’interprétation de cette association réside dans la causalité bidirectionnelle qui la sous-tend: Les différentiels de mortalité sont-ils dus à des différentielsd’état de santé initial influençant conjointement la situation professionnelle et la mortalité, ou l’évolution professionnelle influence-t-elle directement l’état de santé puis la mortalité?Les méthodes usuelles ne tiennent pas compte de l’interdépendance des changements de situation professionnelle et de la bidirectionnalité de la causalité qui conduit à un biais important dans l’estimation du lien causale entre situation professionnelle et mortalité. Par conséquent, il est nécessaire de proposer des méthodes statistiques qui prennent en compte des mesures répétées (les professions) simultanément avec les variables de survie. Cette étude est motivée par la base de données Cosmop-DADS qui est un échantillon de la population salariée française.Le premier objectif de cette thèse était d’examiner l’ensemble des trajectoires professionnelles avec une classification professionnelle précise, au lieu d’utiliser un nombre limité d’états dans un parcours professionnel qui a été considéré précédemment. A cet effet, nous avons défini des variables dépendantes du temps afinde prendre en compte différentes dimensions des trajectoires professionnelles, à travers des modèles dits de "life-course", à savoir critical period, accumulation model et social mobility model, et nous avons mis en évidence l’association entre les trajectoires professionnelles et la mortalité par cause en utilisant ces variables dans un modèle de Cox.Le deuxième objectif a consisté à intégrer les épisodes professionnel comme un sous-modèle longitudinal dans le cadre des modèles conjoints pour réduire le biais issude l’inclusion des covariables dépendantes du temps endogènes dans le modèle de Cox. Nous avons proposé un modèle conjoint pour les données longitudinales nominaleset des données de risques concurrents dans une approche basée sur la vraisemblance. En outre, nous avons proposé une approche de type méta-analyse pour résoudre les problèmes liés au temps des calculs dans les modèles conjoints appliqués à l’analyse des grandes bases de données. Cette approche consiste à combiner les résultats issus d’analyses effectuées sur les échantillons stratifiés indépendants. Dans la même perspective de l’utilisation du modèle conjoint sur les grandes bases de données, nous avons proposé une procédure basée sur l’avantage computationnel de la régression de Poisson.Cette approche consiste à trouver les trajectoires typesà travers les méthodes de la classification, et d’appliquerle modèle conjoint sur ces trajectoires types. / Being in low socioeconomic position is associated with increased mortality risk from various causes of death. Previous studies have already shown the importance of considering different dimensions of socioeconomic trajectories across the life-course. Analyses of professional trajectories constitute a crucial step in order to better understand the association between socio-economic position and mortality. The main challenge in measuring this association is then to decompose the respectiveshare of these factors in explaining the survival level of individuals. The complexity lies in the bidirectional causality underlying the observed associations:Are mortality differentials due to differences in the initial health conditions that are jointly influencing employment status and mortality, or the professional trajectory influences directly health conditions and then mortality?Standard methods do not consider the interdependence of changes in occupational status and the bidirectional causal effect underlying the observed association and that leads to substantial bias in estimating the causal link between professional trajectory and mortality. Therefore, it is necessary to propose statistical methods that consider simultaneously repeated measurements (careers) and survivalvariables. This study was motivated by the Cosmop-DADS database, which is a sample of the French salaried population.The first aim of this dissertation was to consider the whole professional trajectories and an accurate occupational classification, instead of using limitednumber of stages during life course and a simple occupational classification that has been considered previously. For this purpose, we defined time-dependent variables to capture different life course dimensions, namely critical period, accumulation model and social mobility model, and we highlighted the association between professional trajectories and cause-specific mortality using the definedvariables in a Cox proportional hazards model.The second aim was to incorporate the employment episodes in a longitudinal sub-model within the joint model framework to reduce the bias resulting from the inclusion of internal time-dependent covariates in the Cox model. We proposed a joint model for longitudinal nominal outcomes and competing risks data in a likelihood-based approach. In addition, we proposed an approach mimicking meta-analysis to address the calculation problems in joint models and large datasets, by extracting independent stratified samples from the large dataset, applying the joint model on each sample and then combining the results. In the same objective, that is fitting joint model on large-scale data, we propose a procedure based on the appeal of the Poisson regression model. This approach consist of finding representativetrajectories by means of clustering methods and then applying the joint model on these representative trajectories.
26

Estimation en présence de données incohérentes : étude de l'impact des biais de déclaration d'âge à l'initiation de la consommation de substances psychoactives à partir de données longitudinales

Chagra, Djamila 12 1900 (has links)
Les données d’enquêtes jouent un rôle primordial dans la production scientifique en sciences sociales. Cependant, la présence de biais dans les données au moment de la collecte, y compris les erreurs de réponse et de non-réponse, pourrait affecter la fiabilité des résultats obtenus. Bien que le problème des erreurs de réponse et de non-réponse soit largement discuté, la littérature existante s’intéresse peu aux mécanismes par lesquels ces erreurs influencent les mesures estimées. Par conséquent, l’objectif principal de cette thèse est d’apporter une contribution méthodologique à la compréhension des estimations d’enquêtes en présence de données erronées et manquantes, en déterminant leur part explicative dans les modèles estimés. À l’aide de deux mesures répétées de l’âge de la première consommation de substances psychoactives recueillies par l’ELNEJ (1994-2009) auprès de jeunes Canadiens à l’âge de 12-13 ans, puis à l’âge de 14-15 ans, cette thèse par articles visait à étudier : (1) les types d’incohérences ou de biais imputés dans la deuxième mesure comparativement à la première (mesure de référence) et ainsi déduire les caractéristiques des répondants dont les déclarations sont incohérentes (Article 1); (2) l’impact de ces biais dans la détermination des prédicteurs de la consommation précoce, c’est-à-dire à l’âge de 13 ans ou moins (Article 2); et (3) leur impact sur la prédiction de la consommation à l’âge de 16-17 ans en fonction de l’âge d’initiation (Article 3). L’impact du biais est déterminé en corrigeant (1) le biais de sélection dû à la censure des répondants ayant des déclarations incohérentes de l’échantillon de l’étude, lorsque l’âge de l’initiation est la variable dépendante dans le modèle estimé (Article 2) ou (2) le biais d’endogénéité dû à la présence de valeurs erronées et manquantes dans l’âge d’initiation, lorsque l’âge d’initiation est une variable explicative dans le modèle estimé (Article 3). Le premier article révèle qu’au deuxième passage de l’enquête, les jeunes de 14-15 ans ne fournissent pas nécessairement des âges d’initiation cohérents avec ceux fournis lorsqu’ils avaient 12-13 ans. La proportion d’incohérence enregistrée n’est pas négligeable; elle est de 43 % pour l’alcool, 33 % pour le tabac et 32 % pour la drogue. Ces jeunes sont susceptibles de déclarer des âges d’initiation plus tardifs ou d’omettre l’expérimentation antérieure (biais télescopique vers l’avant: BTA), des âges d’initiation plus hâtifs (biais télescopique vers l’arrière: BTR), et peuvent également ne pas déclarer leur initiation à au moins un des deux cycles d’enquête (Biais non-déclaré : BND). Les résultats de la régression multinomiale montrent que le risque de détecter ces biais n’est pas le fruit du hasard; il varie en fonction des caractéristiques socio-démographiques et personnelles des répondants, notamment le genre, la structure de la famille et la région de résidence. En raison du biais dans la deuxième déclaration de l'âge d'initiation, le deuxième article démontre que l'identification des groupes à risque de consommation précoce est affectée par le potentiel de biais au sein de ces groupes. En utilisant l'approche de Heckman, il a été conclu que les âges d'initiation déclarés plus hâtifs (plus tardifs) génèrent une surestimation (sous-estimation) des risques de consommation précoce (à 13 ans et moins) dans les groupes les plus susceptibles de fournir des âges biaisés vers l'arrière BTR (biaisés vers l'avant BTA). Cependant, ces risques sont sous-estimés dans les groupes qui n’ont pas déclaré leur âge d’initiation lors du premier passage de l’enquête (BND). Ceci indique que pour ces groupes, l’âge d’initiation qui n’a pas été déclaré lors du premier passage est probablement un âge précoce (autour de 12-13 ans). Le troisième article conclut que les biais attribués à l'âge de l'initiation affectent l’estimation de la relation entre l’âge d’initiation et la fréquence de consommation à l'âge de 16-17 ans. Le fait que cette relation soit surestimée ou sous-estimée dépend spécifiquement du type de biais et de sa corrélation avec la consommation ultérieure. Enfin, cette thèse tente de fournir des preuves empiriques mettant en évidence le biais de réponse et de non-réponse comme une source d'information supplémentaire qui caractérise l'échantillon de l'étude et qui sa propre part explicative dans les modèles estimés. La validité des données d'enquête est donc d'une grande utilité pour la validité des résultats des études. / Survey data play an essential role in scientific production in the social sciences. However, the presence of bias in the data at the time of collection, including response and non-response errors, could affect the reliability of the results obtained. Although the problem of response and nonresponse errors is widely discussed, little attention has been paid in the existing literature to the mechanisms by which these errors influence the estimated measures. Therefore, the main objective of this thesis is to make a methodological contribution to the understanding of survey estimates in the presence of erroneous and missing data, by determining their explanatory part in the estimated models. Using two repeated measures of age at first substance use collected by the NLSCY (1994-2009) from Canadian youth, when they were 12-13 years old and again at 14-15 years old, this article-based dissertation aimed to investigate: (1) the types of inconsistencies or biases imputed in the second measure relative to the first (baseline) measure and thus infer the characteristics of respondents whose reports are inconsistent (Paper 1); (2) the impact of these biases in determining predictors of early use, i.e., at age 13 and younger (Paper 2); and (3) their impact on predicting use at age 16-17 as a function of age of initiation (Paper 3). The impact of bias is determined by correcting for (1) selection bias due to censoring of respondents with inconsistent reports from the sample, when age of initiation is the dependent variable in the estimated model (Paper 2) and (2) endogeneity bias due to the presence of erroneous and missing values in age of initiation, when age of initiation has an explanatory variable in the estimated model (Paper 3). The first article reveals that at the second survey round, 14–15 years old do not necessarily provide ages of initiation consistent with those provided when they were 12-13 years old. The proportion of inconsistency recorded is not negligible; it is 43% for alcohol, 33% for tobacco, and 32% for drugs. These youth are likely to report later ages of initiation or omit previous experimentation (telescopic forward bias: BTA), earlier ages of initiation (telescopic backward bias: BTR) and may also fail to report initiation on at least one of the two survey rounds (unreported bias: BND). Multinomial regression results show that the risk of detecting these biases is not random; it varies with respondents' socio-demographic and personal characteristics, including gender, family structure, and region of residence. Because of the bias in the second report on age of initiation, the second article demonstrates that the identification of groups at risk for early use is affected by the potential for bias within these groups. Using Heckman's approach, it was concluded that earlier (later) reported initiation ages generate an overestimation (underestimation) of the risks of early use (at age 13 and younger) in the groups most likely to provide backward-biased (forward-biased) ages. However, this risk is underestimated in groups that did not report their age of initiation at the first survey round (BND). This indicates that for these groups, the age of initiation that was not reported in the first round is likely to be an early age (around 12-13 years). The third paper concludes that biases attributed to age of initiation affect the estimate of the relationship between age of initiation and frequency of use at age 16-17. Whether this relationship is overestimated or underestimated depends specifically on the type of bias and its correlation with later use. Finally, this thesis attempts to provide empirical evidence highlighting response and nonresponse bias as an additional source of information that characterizes the study sample and has its own explanatory part in the estimated models. The validity of survey data is thus of great benefit to the validity of studies results.
27

Relations entre environnementaux bâtis, contexte social et bien-être : une étude par évaluation écologique momentané à Montréal

Khezri, Sadun 08 1900 (has links)
Cette thèse vise à expliquer les fluctuations du bien-être momentané tout au long de la journée et de la semaine, en tenant compte de l'influence de l'environnement construit et social sur ces variations. Cette étude a évalué l'impact du moment de la journée, des interactions sociales, de la météo et des environnements bâtis et sociaux, sur le bien-être momentané à l’aide d’un devis longitudinal par évaluation écologique momentanée géographique (GEMA). Un total de 899 participants résident dans le Grand Montréal, âgés de 18 à 80 ans (Âge : M = 41,71, md = 39 ; femmes = 55,7%) ont rempli une échelle brève de l'humeur trois fois par jour pendant sept jours consécutifs sur leurs téléphones intelligents (application EthicaData). Lors des réponses, la coordonnée GPS de leur localisation a également été captée, et a servi à mesurer diverses expositions environnementales dans un système d’information géographique. Un modèle à effets mixtes à trois niveaux avec des effets aléatoires a montré une corrélation positive entre le bien-être et l'âge, les après-midis, les week-ends et les interactions sociales impliquant la famille et les amis. En revanche, le bien-être était négativement associé aux soirées. Quelques variables de l’environnement bâti et social étaient significativement associées au bien-être. Ces liens ont persisté après contrôle des facteurs de confusion potentiels. De plus, un effet d'interaction a révélé que l'influence des interactions sociales momentanées différait entre les hommes et les femmes. Cette étude met en lumière le rôle des facteurs environnementaux et sociaux dans la compréhension du bien-être momentané. L'intégration de la technologie géospatiale et des évaluations écologiques momentanées offre des perspectives précieuses pour l'urbanisme et la santé publique dans l’exploration des liens entre contexte et santé. / This thesis aims to explain the fluctuations of momentary well-being throughout the day and week, taking into consideration how the built and social environment affects these variations. In this seven-day longitudinal study using GPS-enabled smartphones and EthicaData software with a geographic ecological momentary assessment (GEMA) approach, the real-time impact of built and social environments on self-reported momentary well-being of residents of Greater Montreal between 2018 and 2021 was investigated. A total of 889 participants aged 18–80 years (Age: M=41.71, md=39; females = 55.7%) completed the Short Mood Scale three times daily for seven consecutive days. A three-level mixed-effects model with random effects showed a positive correlation between well-being and age, afternoons, weekends, and social interactions involving family and friends. On the other hand, well-being was negatively associated with evenings. Only a few built and social environmental variables were found to be significantly associated with well-being. These links remained after controlling for potential confounding factors. Moreover, an interaction effect revealed that the influence of momentary social interactions differed for men and women. This study highlights the significance of environmental and social factors in comprehending momentary well-being, which has important implications for urban planning and public health initiatives. Integrating geospatial technology and EMA provides valuable insights into this intricate relationship.
28

Regression modeling with missing outcomes : competing risks and longitudinal data / Contributions aux modèles de régression avec réponses manquantes : risques concurrents et données longitudinales

Moreno Betancur, Margarita 05 December 2013 (has links)
Les données manquantes sont fréquentes dans les études médicales. Dans les modèles de régression, les réponses manquantes limitent notre capacité à faire des inférences sur les effets des covariables décrivant la distribution de la totalité des réponses prévues sur laquelle porte l'intérêt médical. Outre la perte de précision, toute inférence statistique requière qu'une hypothèse sur le mécanisme de manquement soit vérifiée. Rubin (1976, Biometrika, 63:581-592) a appelé le mécanisme de manquement MAR (pour les sigles en anglais de « manquant au hasard ») si la probabilité qu'une réponse soit manquante ne dépend pas des réponses manquantes conditionnellement aux données observées, et MNAR (pour les sigles en anglais de « manquant non au hasard ») autrement. Cette distinction a des implications importantes pour la modélisation, mais en général il n'est pas possible de déterminer si le mécanisme de manquement est MAR ou MNAR à partir des données disponibles. Par conséquent, il est indispensable d'effectuer des analyses de sensibilité pour évaluer la robustesse des inférences aux hypothèses de manquement.Pour les données multivariées incomplètes, c'est-à-dire, lorsque l'intérêt porte sur un vecteur de réponses dont certaines composantes peuvent être manquantes, plusieurs méthodes de modélisation sous l'hypothèse MAR et, dans une moindre mesure, sous l'hypothèse MNAR ont été proposées. En revanche, le développement de méthodes pour effectuer des analyses de sensibilité est un domaine actif de recherche. Le premier objectif de cette thèse était de développer une méthode d'analyse de sensibilité pour les données longitudinales continues avec des sorties d'étude, c'est-à-dire, pour les réponses continues, ordonnées dans le temps, qui sont complètement observées pour chaque individu jusqu'à la fin de l'étude ou jusqu'à ce qu'il sorte définitivement de l'étude. Dans l'approche proposée, on évalue les inférences obtenues à partir d'une famille de modèles MNAR dits « de mélange de profils », indexés par un paramètre qui quantifie le départ par rapport à l'hypothèse MAR. La méthode a été motivée par un essai clinique étudiant un traitement pour le trouble du maintien du sommeil, durant lequel 22% des individus sont sortis de l'étude avant la fin.Le second objectif était de développer des méthodes pour la modélisation de risques concurrents avec des causes d'évènement manquantes en s'appuyant sur la théorie existante pour les données multivariées incomplètes. Les risques concurrents apparaissent comme une extension du modèle standard de l'analyse de survie où l'on distingue le type d'évènement ou la cause l'ayant entrainé. Les méthodes pour modéliser le risque cause-spécifique et la fonction d'incidence cumulée supposent en général que la cause d'évènement est connue pour tous les individus, ce qui n'est pas toujours le cas. Certains auteurs ont proposé des méthodes de régression gérant les causes manquantes sous l'hypothèse MAR, notamment pour la modélisation semi-paramétrique du risque. Mais d'autres modèles n'ont pas été considérés, de même que la modélisation sous MNAR et les analyses de sensibilité. Nous proposons des estimateurs pondérés et une approche par imputation multiple pour la modélisation semi-paramétrique de l'incidence cumulée sous l'hypothèse MAR. En outre, nous étudions une approche par maximum de vraisemblance pour la modélisation paramétrique du risque et de l'incidence sous MAR. Enfin, nous considérons des modèles de mélange de profils dans le contexte des analyses de sensibilité. Un essai clinique étudiant un traitement pour le cancer du sein de stade II avec 23% des causes de décès manquantes sert à illustrer les méthodes proposées. / Missing data are a common occurrence in medical studies. In regression modeling, missing outcomes limit our capability to draw inferences about the covariate effects of medical interest, which are those describing the distribution of the entire set of planned outcomes. In addition to losing precision, the validity of any method used to draw inferences from the observed data will require that some assumption about the mechanism leading to missing outcomes holds. Rubin (1976, Biometrika, 63:581-592) called the missingness mechanism MAR (for “missing at random”) if the probability of an outcome being missing does not depend on missing outcomes when conditioning on the observed data, and MNAR (for “missing not at random”) otherwise. This distinction has important implications regarding the modeling requirements to draw valid inferences from the available data, but generally it is not possible to assess from these data whether the missingness mechanism is MAR or MNAR. Hence, sensitivity analyses should be routinely performed to assess the robustness of inferences to assumptions about the missingness mechanism. In the field of incomplete multivariate data, in which the outcomes are gathered in a vector for which some components may be missing, MAR methods are widely available and increasingly used, and several MNAR modeling strategies have also been proposed. On the other hand, although some sensitivity analysis methodology has been developed, this is still an active area of research. The first aim of this dissertation was to develop a sensitivity analysis approach for continuous longitudinal data with drop-outs, that is, continuous outcomes that are ordered in time and completely observed for each individual up to a certain time-point, at which the individual drops-out so that all the subsequent outcomes are missing. The proposed approach consists in assessing the inferences obtained across a family of MNAR pattern-mixture models indexed by a so-called sensitivity parameter that quantifies the departure from MAR. The approach was prompted by a randomized clinical trial investigating the benefits of a treatment for sleep-maintenance insomnia, from which 22% of the individuals had dropped-out before the study end. The second aim was to build on the existing theory for incomplete multivariate data to develop methods for competing risks data with missing causes of failure. The competing risks model is an extension of the standard survival analysis model in which failures from different causes are distinguished. Strategies for modeling competing risks functionals, such as the cause-specific hazards (CSH) and the cumulative incidence function (CIF), generally assume that the cause of failure is known for all patients, but this is not always the case. Some methods for regression with missing causes under the MAR assumption have already been proposed, especially for semi-parametric modeling of the CSH. But other useful models have received little attention, and MNAR modeling and sensitivity analysis approaches have never been considered in this setting. We propose a general framework for semi-parametric regression modeling of the CIF under MAR using inverse probability weighting and multiple imputation ideas. Also under MAR, we propose a direct likelihood approach for parametric regression modeling of the CSH and the CIF. Furthermore, we consider MNAR pattern-mixture models in the context of sensitivity analyses. In the competing risks literature, a starting point for methodological developments for handling missing causes was a stage II breast cancer randomized clinical trial in which 23% of the deceased women had missing cause of death. We use these data to illustrate the practical value of the proposed approaches.
29

Variations temporelles de l’injection de drogues et association avec le risque d’infection par le virus de l’hépatite C

Fortier, Emmanuel 01 1900 (has links)
La majorité des personnes utilisatrices de drogues par injection (PUDI) contracteront le virus de l’hépatite C (VHC), les mettant à risque accru de complications hépatiques graves et parfois mortelles. Les comportements les plus risqués pour l’acquisition du VHC incluent le partage de matériel d’injection et l’injection à haute fréquence. Un facteur jusqu’ici négligé dans l’évaluation du risque de VHC est l’aspect dynamique de l’injection, c.-à-d. la manière dont elle varie dans le temps, incluant l’effet des périodes sans injection et celui des changements dans la fréquence d’injection. On reconnaît également l’effet délétère que l’instabilité résidentielle peut avoir sur le risque de VHC, bien que les mécanismes sous-jacents soient mal compris. Cette thèse s’intéresse à l’effet des variations temporelles de l’injection sur le risque de VHC, et à la manière dont la fréquence d’injection évolue en concomitance avec les conditions résidentielles dans le temps, afin d’aider au développement de nouvelles stratégies de prévention du VHC. Les données ont été recueillies entre mars 2011 et juin 2016 dans la Hepatitis Cohort, une cohorte de PUDI suivies trimestriellement à Montréal, au Québec. Une première analyse a évalué l’effet des périodes sans injection de trois mois ou moins sur le risque de VHC sur 916 personnes-années de suivi, par régression de Cox (N=372). Celle-ci suggère que les PUDI présentant des périodes sans injection courtes (3/3 mois sans injection) et sporadiques (1/3 ou 2/3 mois sans injection) sont respectivement 76% et 44% moins à risque de VHC que celles s’injectant de manière persistante (0/3 mois sans injection). Une deuxième analyse a utilisé la modélisation de trajectoires fondée sur le groupement pour identifier cinq types distincts de trajectoires de fréquence d’injection suivies sur une année, lesquels ont ensuite été comparés en termes d’incidence du VHC sur des périodes de suivi allant de 71 à 355 personnes-années (N=386). Les résultats suggèrent que les PUDI dont la fréquence reste élevée (injection fréquente) ou change dans le temps (croissante, décroissante) sont à plus haut risque de VHC que celles s’injectant à basse fréquence (sporadique, peu fréquente). Une dernière analyse a identifié trois types de trajectoires de stabilité résidentielle suivies sur un an (persistance, déclin, amélioration; N=386), lesquels ont été évalués en association avec les trajectoires de fréquence d’injection suivies simultanément. Les résultats suggèrent qu’il existe un lien entre l’amélioration des conditions résidentielles et la diminution de la fréquence d’injection, mais aussi que la probabilité d’injection à fréquence croissante est plus élevée chez les PUDI maintenant des conditions résidentielles stables que celles chez qui elles s’améliorent. Collectivement, les résultats ont de nombreuses implications en termes de prévention du VHC. Cliniquement, l’instabilité de la fréquence d’injection semble être un facteur de risque à monitorer régulièrement. En termes de santé publique, les interventions favorisant l’engagement dans des périodes sans injection ou le maintien d’une basse fréquence d’injection pourraient être prometteuses. Enfin, les stratégies visant l’amélioration des conditions résidentielles pourraient éventuellement aider les PUDI à réduire leur fréquence d’injection, mais être insuffisantes pour maintenir celle-ci à basse fréquence une fois la stabilité atteinte. / The majority of people who inject drugs (PWID) will become infected with hepatitis C virus (HCV), placing them at risk of serious and sometimes fatal liver complications. Injecting behaviours with higher risk of HCV transmission include injecting equipment sharing and high frequency injecting. One factor that has been overlooked when assessing HCV acquisition risk is the dynamic aspect of drug injecting, i.e., how drug injecting varies over time, including the role of injecting cessation episodes and that of changes in injecting frequency. Moreover, there is growing recognition of the deleterious effect unstable housing can have on HCV acquisition risk, although the underlying mechanisms are not yet fully understood. This thesis examines how temporal variations in drug injecting relate to HCV acquisition risk and further explores how housing conditions and injecting frequency evolve together over time, for the purposes of contributing to the development of novel HCV prevention strategies. Data were collected between March 2011 and June 2016 in the Hepatitis Cohort, a prospective cohort study of PWID interviewed and tested for HCV infection at three-monthly intervals in Montréal, Québec. A first analysis examined the effect of injecting cessation episodes of three months or less on the risk of contracting HCV during 916 person-years of follow-up, using Cox regression (N=372). Results suggest that PWID with short injecting cessation episodes (3/3 months without injecting) or sporadic injecting cessation episodes (1/3 or 2/3 months without injecting) are 76% and 44% less at risk of contracting HCV than those with persistent injecting (0/3 months without injecting), respectively. A second analysis used group-based trajectory modeling to identify five distinct types of one-year injecting frequency trajectories and compared these in terms of HCV incidence over follow-up periods ranging from 71 to 355 person-years (N=386). Findings suggest that PWID injecting with consistently high frequencies (frequent) or time-varying frequencies (increasing, decreasing) are at greater HCV acquisition risk compared with those maintaining low injecting frequencies (sporadic, infrequent). Finally, a third analysis identified three types of one-year housing stability trajectories (sustained, declining, improving) and examined their associations with concomitant injecting frequency trajectories (N=386). Findings suggest an association between improving housing stability and decreasing injecting frequency, but also a higher probability of increasing injecting frequency among PWID who maintain housing stability compared to those that improve it. Collectively, these findings have numerous implications for HCV prevention. Clinically, instability in injecting frequency appears to be a risk factor that should be monitored regularly. From a public health perspective, interventions that promote engagement in injecting cessation episodes or maintenance of low injecting frequency may be promising. Finally, strategies aimed to improve housing stability may help PWID to decrease their injecting frequency but may not be sufficient to help them maintain low injecting frequencies once housing stability is achieved.

Page generated in 0.0755 seconds