Spelling suggestions: "subject:"connées dde recherche."" "subject:"connées dee recherche.""
1 |
Création d'un jeu de données synthétiques pour des données de santéOuffy, Oumaima 21 November 2023 (has links)
Les données récoltées sur des individus sont souvent difficiles à partager avec les chercheurs et à publier à cause des informations confidentielles qu'elles contiennent. Une solution qu'on peut faire pour faciliter l'accès à ces données est de créer un jeu de données synthétiques à partager avec les chercheurs. Ce jeu de données aurait les mêmes caractéristiques du jeu de données originales mais ne permettrait pas de révéler les informations confidentielles sur les participants. Nous étudions dans ce mémoire les enjeux techniques liés à la création des jeux de données synthétiques dans le domaine de la santé. Il faut notamment s'assurer que les modèles statistiques utilisés pour générer des données synthétiques soient assez flexibles pour bien modéliser les corrélations entre les variables collectées, tout en s'assurant de ne pas sur-ajuster ces modèles, ce qui pourrait nuire à la protection de la confidentialité. Le travail s'articulera autour de la création d'un jeu synthétique pour un sous-ensemble des données collectées par le Consortium d'identification précoce de la maladie d'Alzheimer - Québec (CIMA-Q), pour qui le partage des données à la communauté de recherche sur la maladie d'Alzheimer canadienne et internationale est un objectif important. / Data collected on individuals is often difficult to share with researchers and publish because of the confidential information it contains. A possible solution to facilitate the access to this data is to create a synthetic data set to share with researchers. This dataset would have the same characteristics of the original dataset but would not reveal the confidential information about the participants. We study here the technical issues related to the creation of such synthetic datasets in the health field. In particular, it must be ensured that the statistical models used are flexible enough to properly model the correlations between the variables collected, while making sure not to over-adjust them, which could harm the protection of confidentiality. The work will focus on the creation of a synthetic data for a subset of the data collected by the Consortium of Early Identification of Alzheimer's disease - Quebec (CIMA-Q), for whom the sharing of data with the community of Canadian and international Alzheimer's disease research is an important goal.
|
2 |
Inégalités socioéconomiques, contraintes psychosociales au travail et données administratives sur la dépression : résultats du PROspective QuébecBruno Pena Gralle, Ana Paula 13 December 2023 (has links)
Contexte : On estime à plus de 300 millions le nombre de personnes atteintes de troubles dépressifs dans le monde, ce qui en fait la principale source d'années vécues avec un trouble mental. Les mécanismes sous-jacents de la dépression sont mal compris, mais l'importance des facteurs socioéconomiques et psychosociaux est de plus en plus reconnue. Des études antérieures ont observé des risques plus élevés de dépression chez les personnes ayant un faible statut socioéconomique et chez celles exposées aux contraintes psychosociales au travail. Cependant, il y a plusieurs lacunes dans les connaissances sur : 1. la validité des données administratives pour mesurer la dépression chez les travailleurs; 2. les voies causales liant les inégalités socioéconomiques et les contraintes psychosociales au travail à l'incidence de la dépression; et 3. des études prospectives sur la proportion de cas de dépression attribuables à l'exposition à des contraintes psychosociales au travail. Objectifs :1. Évaluer la validité des mesures de dépression à partir des données administratives de la Régie d'assurance maladie du Québec. 2. Estimer les effets des indicateurs socioéconomiques (éducation, revenu familial et type d'occupation) et des contraintes psychosociales au travail (job strain et déséquilibre effort-reconnaissance) sur l'incidence de la dépression et la contribution de ces contraintes au gradient socioéconomique de la dépression. 3. Estimer les fractions populationnelles de cas de dépression attribuables à l'exposition aux contraintes psychosociales au travail. Les objectifs ont été investigués séparément chez les hommes et chez les femmes. Méthodes : Une étude prospective comportant initialement 9 188 cols blanc de Québec a été réalisée. La validité des données administratives a été évaluée par sa sensibilité, spécificité et concordance avec le Composite International Diagnostic Interview - Short Form (CIDI-SF). On a estimé des analogues interventionnels randomisés des effets directs des indicateurs socioéconomiques et des effets indirects médiés par les contraintes psychosociales au travail. Des fractions attribuables populationnelles ont été estimées à partir d'une méthode Kaplan-Meier pondérée. Résultats 1. Les données administratives de dépression ont une spécificité ≥ 96%, sensibilité de 19-32% et concordance (κ de Cohen) de 0,21-0,25 avec les données du questionnaire CIDI-SF. En analyse de groupes connus, les cas administratifs de dépression étaient comparables aux cas du CIDI-SF (risque relatif pour les femmes : 1,80 vs. 2,03 respectivement; âge < 58 ans: 1,53 vs 1,40; absence de formation universitaire : 1,52 vs 1,28; détresse psychologique : 2,21 vs 2,65). 2. L'incidence de la dépression chez les femmes était de 33,1 par 1000 personnes-années et de 16,8 chez les hommes. Parmi eux, un faible statut socioéconomique était un facteur de risque pour la dépression [faible éducation : rapport de taux 1,72, (intervalle de confiance à 95% 1,08-2,73); faible revenu familial : 1,67 (1,04-2,67); type d'occupation moins prestigieuse: 2,13 (1,08-4,19). Pour la population entière, l'exposition aux contraintes psychosociales au travail était associée à un risque accru de dépression [job strain : 1,42 (1,14-1,78); déséquilibre effort-reconnaissance (DER) : 1,73 (1,41-2,12)]. Les effets indirects estimés des indicateurs socioéconomiques sur la dépression médiée par le job strain variaient de 1,01 (0,99-1,03) à 1,04 (0,98 - 1,10). 3. La fraction populationnelle estimée de cas de dépression attribuables au job strain était de 15,9% (3,8-28,0%) et au DER de 21,9% (9,5-34,3%). Conclusion 1. Bien que les algorithmes de cas administratifs saisissent une dimension différente de la dépression que les cas CIDI-SF, aucune des deux sources de données est supérieure à l'autre pour identifier et quantifier les facteurs de risque de dépression dans de grandes études épidémiologiques. 2. Chez les hommes, un faible niveau de scolarité, un faible revenu familial et une occupation moins prestigieuse étaient des facteurs de risque notables pour l'incidence de la dépression. Les contraintes psychosociales au travail étaient aussi associées à une incidence plus élevée de dépression chez les hommes et les femmes. Cependant, les indicateurs de statut socioéconomique et les contraintes psychosociales au travail ne semblent pas fonctionner sur une voie causale commune vers la dépression, ce qui suggère plutôt une indépendance de leurs effets. Seul le job strain a montré une légère tendance à médier le gradient socio-économiquede la dépression. 3. Les contraintes psychosociales au travail, principalement le DER, pourraient être responsables de plus de 20 % de tous les cas de dépression survenus dans notre cohorte au cours d'un suivi de 3 ans. / Background: The number of people afflicted with depressive disorders is estimated to be over 300 million people worldwide, which makes them the largest contributor to years lived with a mental disorder. The underlying mechanisms of depression are poorly understood, but recognition of the importance of socioeconomic and psychosocial factors is growing. Previous studies have observed higher risks of depression in people with low socioeconomic status and in those exposed to psychosocial stressors at work. However, there are several knowledge gaps regarding: 1. the validity of administrative data to measure depression in working populations; 2. the causal pathways linking socioeconomic inequality and psychosocial stressors at work to the incidence of depression; and 3. prospective studies on the proportion of cases of depression due to exposure to psychosocial stressors at work. Objectives: 1. Assess the validity of depression measures based on administrative data from the Régie d'Assurance Maladie du Québec. 2. Estimate the effects of socioeconomic indicators (education, family income and type of occupation) and psychosocial stressors at work (job strain and effort-reward imbalance) on the incidence of depression, and the contribution of the stressors to the socioeconomic gradient of depression. 3. Estimate the population fractions of cases of depression attributable to exposure to psychosocial stressors at work. The objectives were investigated separately for men and women. Methods: A prospective study was realized with initially 9 188 white-collar workers from Quebec. The validity of the administrative data was assessed by its sensitivity, specificity, and concordance with data from the Composite International Diagnostic Interview - Short Form. Randomized interventional analogues of the direct effects of socioeconomic indicators and of their indirect effects mediated by psychosocial stressors at work were estimated. Population attributable fractions were estimated using a weighted Kaplan-Meier method. Results: 1. Administrative depression data have specificity ≥ 96%, sensitivity of 19-32%, and concordance (Cohen's κ) of 0.21-0.25 with CIDI-SF questionnaire data. In known groups analysis, administrative cases of depression were comparable to CIDI-SF cases (relative risk for women: 1.80 vs. 2.03, respectively; age < 58 years: 1.53 vs. 1.40; no university degree: 1.52 vs 1.28, psychological distress: 2.21 vs 2.65). 2. The incidence of depression in women was 33.1 per 1000 person-years, and in men, 16.8. In men, [low education: hazard ratio 1.72, (95% confidence interval: 1.08-2.73); low family income: 1.67 (1.04-2.67); less prestigious occupation: 2.13 (1.08-4.19)]. In the entire population, exposure to psychosocial stressors at work was associated with increased risk of depression [job strain: 1.42 (1.14-1.78); effort-reward imbalance (ERI) 1.73 (1.41-2.12)]. The estimated indirect effects of socioeconomic indicators on depression mediated through job strain ranged from 1.01 (0.99-1.03) to 1.04 (0.98-1.10). 3. The estimated population fraction of cases of depression attributable to job strain was 15.9% (3.8-28.0%) and to ERI 21.9% (9.5-34.3%). Conclusion 1. Although administrative case algorithms capture a different dimension of depression than do CIDI-SF cases, neither of these data sources is superior to the other in the context of large epidemiological studies aiming to identify and quantify risk factors for depression. 2. Among men, low education, low family income and less prestigious occupation were notable risk factors for the incidence of depression. Psychosocial stressors at work were also associated with a higher incidence of depression in both men and women. However, indicators of socioeconomic status and psychosocial stressors at work do not seem to lie on a common causal path towards depression, which suggests rather that their effects are independent. Only job strain showed a slight tendency to mediate the socioeconomic gradient of depression. 3. Psychosocial stressors at work, mainly ERI, may be responsible for more than 20% of all cases of depression occurring in our cohort during a 3-year follow-up.
|
3 |
Génération de données synthétiques pour des variables continues : étude de différentes méthodes utilisant les copulesDesbois-Bédard, Laurence 24 April 2018 (has links)
L’intérêt des agences statistiques à permettre l’accès aux microdonnées d’enquête est grandissant. À cette fin, plusieurs méthodes permettant de publier les microdonnées tout en protégeant la confidentialité des répondants ont été proposées ; ce mémoire se penche sur l’une d’entre-elles : la génération de données synthétiques. Deux approches sont présentées, GADP et C-GADP, et une nouvelle est proposée. La méthode GADP suppose que les variables des données originales et synthétiques sont de loi normale, alors que la méthode C-GADP suppose qu’elles sont jointes par une copule normale. La nouvelle méthode est basée sur les modèles de copules en vigne. Ces modèles sont employés dans l’espoir de mieux modéliser les liens entre les variables. Les trois approches sont évaluées selon les concepts d’utilité et de risque. L’utilité de données confidentielles s’apprécie selon la similitude qu’elles ont avec les données originales et le risque, par la possibilité d’une violation de la confidentialité des répondants. Le risque peut survenir par identification ou par inférence. Seul le risque d’inférence est possible dans le cadre de ce mémoire. Précisément, l’utilité est évaluée avec quelques mesures faites à partir d’analyses spécifiques et une mesure globale basée sur les scores de propension calculés avec une régression logistique. Quant au risque, il est évalué avec une prévision basée sur la distance. / Statistical agencies face a growing demand for releasing microdata to the public. To this end, many techniques have been proposed for publishing microdata while providing confidentiality : synthetic data generation in particular. This thesis focuses on such technique by presenting two existing methods, GAPD and C-GADP, as well as suggesting one based on vine copula models. GADP assumes that the variables of original and synthetic data are normally distributed, while C-GADP assumes that they have a normal copula distribution. Vine copula models are proposed due to their flexibility. These three methods are then assessed according to utility and risk. Data utility depends on maintaining certain similarities between the original and confidential data, while risk can be observed in two types : reidentification and inference. This work will focus on the utility examined with different analysis-specific measures, a global measure based on propensity scores and the risk of inference evaluated with a distance-based prediction.
|
4 |
Inégalités socioéconomiques, contraintes psychosociales au travail et données administratives sur la dépression : résultats du PROspective QuébecBruno Pena Gralle, Ana Paula 30 August 2022 (has links)
No description available.
|
Page generated in 0.0813 seconds