• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • 1
  • 1
  • Tagged with
  • 5
  • 5
  • 4
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modélisation des données d'enquêtes cas-cohorte par imputation multiple : application en épidémiologie cardio-vasculaire / Modeling of case-cohort data by multiple imputation : application to cardio-vascular epidemiology

Marti soler, Helena 04 May 2012 (has links)
Les estimateurs pondérés généralement utilisés pour analyser les enquêtes cas-cohorte ne sont pas pleinement efficaces. Or, les enquêtes cas-cohorte sont un cas particulier de données incomplètes où le processus d'observation est contrôlé par les organisateurs de l'étude. Ainsi, des méthodes d'analyse pour données manquant au hasard (MA) peuvent être pertinentes, en particulier, l'imputation multiple, qui utilise toute l'information disponible et permet d'approcher l'estimateur du maximum de vraisemblance partielle.Cette méthode est fondée sur la génération de plusieurs jeux plausibles de données complétées prenant en compte les différents niveaux d'incertitude sur les données manquantes. Elle permet d'adapter facilement n'importe quel outil statistique disponible pour les données de cohorte, par exemple, l'estimation de la capacité prédictive d'un modèle ou d'une variable additionnelle qui pose des problèmes spécifiques dans les enquêtes cas-cohorte. Nous avons montré que le modèle d'imputation doit être estimé à partir de tous les sujets complètement observés (cas et non-cas) en incluant l'indicatrice de statut parmi les variables explicatives. Nous avons validé cette approche à l'aide de plusieurs séries de simulations: 1) données complètement simulées, où nous connaissions les vraies valeurs des paramètres, 2) enquêtes cas-cohorte simulées à partir de la cohorte PRIME, où nous ne disposions pas d'une variable de phase-1 (observée sur tous les sujets) fortement prédictive de la variable de phase-2 (incomplètement observée), 3) enquêtes cas-cohorte simulées à partir de la cohorte NWTS, où une variable de phase-1 fortement prédictive de la variable de phase-2 était disponible. Ces simulations ont montré que l'imputation multiple fournissait généralement des estimateurs sans biais des risques relatifs. Pour les variables de phase-1, ils approchaient la précision obtenue par l'analyse de la cohorte complète, ils étaient légèrement plus précis que l'estimateur calibré de Breslow et coll. et surtout que les estimateurs pondérés classiques. Pour les variables de phase-2, l'estimateur de l'imputation multiple était généralement sans biais et d'une précision supérieure à celle des estimateurs pondérés classiques et analogue à celle de l'estimateur calibré. Les résultats des simulations réalisées à partir des données de la cohorte NWTS étaient cependant moins bons pour les effets impliquant la variable de phase-2 : les estimateurs de l'imputation multiple étaient légèrement biaisés et moins précis que les estimateurs pondérés. Cela s'explique par la présence de termes d'interaction impliquant la variable de phase-2 dans le modèle d'analyse, d'où la nécessité d'estimer des modèles d'imputation spécifiques à différentes strates de la cohorte incluant parfois trop peu de cas pour que les conditions asymptotiques soient réunies.Nous recommandons d'utiliser l'imputation multiple pour obtenir des estimations plus précises des risques relatifs, tout en s'assurant qu'elles sont analogues à celles fournies par les analyses pondérées. Nos simulations ont également montré que l'imputation multiple fournissait des estimations de la valeur prédictive d'un modèle (C de Harrell) ou d'une variable additionnelle (différence des indices C, NRI ou IDI) analogues à celles fournies par la cohorte complète / The weighted estimators generally used for analyzing case-cohort studies are not fully efficient. However, case-cohort surveys are a special type of incomplete data in which the observation process is controlled by the study organizers. So, methods for analyzing Missing At Random (MAR) data could be appropriate, in particular, multiple imputation, which uses all the available information and allows to approximate the partial maximum likelihood estimator.This approach is based on the generation of several plausible complete data sets, taking into account all the uncertainty about the missing values. It allows adapting any statistical tool available for cohort data, for instance, estimators of the predictive ability of a model or of an additional variable, which meet specific problems with case-cohort data. We have shown that the imputation model must be estimated on all the completely observed subjects (cases and non-cases) including the case indicator among the explanatory variables. We validated this approach with several sets of simulations: 1) completely simulated data where the true parameter values were known, 2) case-cohort data simulated from the PRIME cohort, without any phase-1 variable (completely observed) strongly predictive of the phase-2 variable (incompletely observed), 3) case-cohort data simulated from de NWTS cohort, where a phase-1 variable strongly predictive of the phase-2 variable was available. These simulations showed that multiple imputation generally provided unbiased estimates of the risk ratios. For the phase-1 variables, they were almost as precise as the estimates provided by the full cohort, slightly more precise than Breslow et al. calibrated estimator and still more precise than classical weighted estimators. For the phase-2 variables, the multiple imputation estimator was generally unbiased, with a precision better than classical weighted estimators and similar to Breslow et al. calibrated estimator. The simulations performed with the NWTS cohort data provided less satisfactory results for the effects where the phase-2 variable was involved: the multiple imputation estimators were slightly biased and less precise than the weighted estimators. This can be explained by the interactions terms involving the phase-2 variable in the analysis model and the necessity of estimating specific imputation models in different strata not including sometimes enough cases to satisfy the asymptotic conditions. We advocate the use of multiple imputation for improving the precision of the risk ratios estimates while making sure they are similar to the weighted estimates.Our simulations also showed that multiple imputation provided estimates of a model predictive value (Harrell's C) or of an additional variable (difference of C indices, NRI or IDI) similar to those obtained from the full cohort.
2

Modélisation des données d'enquêtes cas-cohorte par imputation multiple : Application en épidémiologie cardio-vasculaire.

Marti soler, Helena 04 May 2012 (has links) (PDF)
Les estimateurs pondérés généralement utilisés pour analyser les enquêtes cas-cohorte ne sont pas pleinement efficaces. Or, les enquêtes cas-cohorte sont un cas particulier de données incomplètes où le processus d'observation est contrôlé par les organisateurs de l'étude. Ainsi, des méthodes d'analyse pour données manquant au hasard (MA) peuvent être pertinentes, en particulier, l'imputation multiple, qui utilise toute l'information disponible et permet d'approcher l'estimateur du maximum de vraisemblance partielle.Cette méthode est fondée sur la génération de plusieurs jeux plausibles de données complétées prenant en compte les différents niveaux d'incertitude sur les données manquantes. Elle permet d'adapter facilement n'importe quel outil statistique disponible pour les données de cohorte, par exemple, l'estimation de la capacité prédictive d'un modèle ou d'une variable additionnelle qui pose des problèmes spécifiques dans les enquêtes cas-cohorte. Nous avons montré que le modèle d'imputation doit être estimé à partir de tous les sujets complètement observés (cas et non-cas) en incluant l'indicatrice de statut parmi les variables explicatives. Nous avons validé cette approche à l'aide de plusieurs séries de simulations: 1) données complètement simulées, où nous connaissions les vraies valeurs des paramètres, 2) enquêtes cas-cohorte simulées à partir de la cohorte PRIME, où nous ne disposions pas d'une variable de phase-1 (observée sur tous les sujets) fortement prédictive de la variable de phase-2 (incomplètement observée), 3) enquêtes cas-cohorte simulées à partir de la cohorte NWTS, où une variable de phase-1 fortement prédictive de la variable de phase-2 était disponible. Ces simulations ont montré que l'imputation multiple fournissait généralement des estimateurs sans biais des risques relatifs. Pour les variables de phase-1, ils approchaient la précision obtenue par l'analyse de la cohorte complète, ils étaient légèrement plus précis que l'estimateur calibré de Breslow et coll. et surtout que les estimateurs pondérés classiques. Pour les variables de phase-2, l'estimateur de l'imputation multiple était généralement sans biais et d'une précision supérieure à celle des estimateurs pondérés classiques et analogue à celle de l'estimateur calibré. Les résultats des simulations réalisées à partir des données de la cohorte NWTS étaient cependant moins bons pour les effets impliquant la variable de phase-2 : les estimateurs de l'imputation multiple étaient légèrement biaisés et moins précis que les estimateurs pondérés. Cela s'explique par la présence de termes d'interaction impliquant la variable de phase-2 dans le modèle d'analyse, d'où la nécessité d'estimer des modèles d'imputation spécifiques à différentes strates de la cohorte incluant parfois trop peu de cas pour que les conditions asymptotiques soient réunies.Nous recommandons d'utiliser l'imputation multiple pour obtenir des estimations plus précises des risques relatifs, tout en s'assurant qu'elles sont analogues à celles fournies par les analyses pondérées. Nos simulations ont également montré que l'imputation multiple fournissait des estimations de la valeur prédictive d'un modèle (C de Harrell) ou d'une variable additionnelle (différence des indices C, NRI ou IDI) analogues à celles fournies par la cohorte complète
3

L'activité prédictives des sciences empirique : analyse d'un succès scientifique et de sa portée / The Predictive activity of empirical sciences : structure and consequences of a scientific success

Leconte, Gauvain 06 December 2017 (has links)
La réalisation de prédictions précises et surprenantes est une pratique essentielle des sciences empiriques et la confirmation de ces prédictions semble représenter l’un de leurs principaux succès théoriques et pratiques. Ainsi de nombreux scientifiques et épistémologues attribuent-ils aux succès prédictifs le pouvoir de confirmer des hypothèses, d’influencer le cours de l’histoire scientifique, voire de révéler quelles théories reflètent la réalité. Pourtant les prédictions s’appuient souvent sur des représentations simplifiées, idéalisées ou fictionnelles de la réalité. L’objectif de cette thèse est d’analyser l’activité prédictive pour comprendre en quoi consistent les succès prédictifs et quelle portée on peut légitimement leur conférer. L’enjeu de cette analyse est notamment de savoir si une théorie ayant engendré un succès prédictif peut être considérée comme vraie ou partiellement vraie.La première partie de la thèse est consacrée à l’analyse de l’activité prédictive et conclut qu’il existe une pluralité de raisonnements et de succès prédictifs. La deuxième partie étudie l’influence de ces succès sur l’évolution d’une discipline, la cosmologie, de 1917 à nos jours et montre que les scientifiques attribuent de l’importance aux prédictions qui indiquent la capacité prédictive d’une hypothèse ou d’une théorie. Dans la troisième partie, je soutiens que le rôle des prédictions dans le choix rationnel des hypothèses est de permettre de juger de leur fécondité. La quatrième partie étudie les limites de la portée des succès prédictifs en montrant qu’ils ne permettent pas de savoir quels aspects des théories dont ils sont issus reflètent la réalité. / Deriving precise and surprising predictions is a key feature of scientific activity. The confirmation of these predictions by severe tests seems to represent major theoretical and practical successes in the field of empirical sciences. Therefore, many scientists and philosophers of science view predictive successes as having an important weight in scientific change, theory choice and for the identification of true claims about reality. However, predictions are often derived from simplified or idealised representations of real-world systems. The aim of this dissertation is to analyse the predictive activity of empirical sciences in order to circumscribe the scope of predictive success. First, I claim that predictive successes come in many forms and structures. In the second part, I investigate the impact of successful predictions in the history of modern cosmology since 1917 and argue that scientists value predictions attesting the predictive capacity of new hypotheses. In a third part, I examine the weight of successful predictions in the confirmation of hypotheses and claim that they serve as a proxy for one of the most important virtues of theories: fruitfulness. The last part is dedicated to the limits of scientific successes and shows that novel predictions cannot help us to circumscribe which posits of scientific theories are worthy of belief.
4

Associations entre la dépression et le décrochage scolaire en fonction du sexe : une étude longitudinale

Allard, Francis 12 1900 (has links)
Les résultats des quelques études examinant le lien entre la présence de symptômes dépressifs et le décrochage divergent. De telles divergences pourraient s’expliquer par certaines caractéristiques individuelles clés comme le sexe ou l’âge, qui pourraient modérer le lien entre les symptômes dépressifs et le décrochage. Cette étude a pour double objectif 1) d’évaluer le lien entre la présence de symptômes dépressifs mesurés à différents moments au secondaire et le décrochage scolaire, et 2) d’examiner les variations possibles en fonction du sexe. Des données auto-rapportées (sur la présence de symptômes dépressifs en secondaire 1, 2 et 3) et administratives (sur le décrochage scolaire) obtenues auprès d’une cohorte composée de 6272 jeunes du secondaire ont été utilisées. Les résultats révèlent qu’après l’inclusion de variables de contrôles importantes, il n’y a pas d’association entre la dépression et le décrochage scolaire. De plus, ils indiquent que le sexe ne joue pas de rôle modérateur, c’est-à-dire qu’il n’y a pas de lien entre la dépression et le décrochage ni chez les filles, ni chez les garçons. Ces résultats suggèrent que les conclusions divergentes des études précédentes sur le sujet pourraient refléter le manque de considération d’une variété, mais surtout d’un nombre suffisants de facteurs confondants. Ils réitèrent aussi l’importance des facteurs de risque déjà connus du décrochage et suggèrent que les interventions se centrant l’humeur dépressive doivent faire partie de programmes visant en parallèle d’autres problématiques plus étroitement associées au décrochage. / Studies examining potential links between depressive symptoms and dropout have yielded inconsistent results. These inconsistencies could be explained by potential moderating effects of key individual characteristics, such as gender or age. This study has two main objectives: 1) to measure the association between depressive symptoms as measured at different grades during high school and dropout, and 2) to examine the possible impact of gender as a moderator variable. We used self-reported data to assess depressive symptoms in 7th, 8th and 9th grade and official administrative data to determine dropout status among a cohort of 6,272 high-school students. Results indicate that after controlling for a variety of potentially confounding variables, the association between depression and dropout was no longer significant. Furthermore, the analysis indicate that gender does not play a moderating role, meaning that there is no link between depression and dropping out among girls, nor boys. These results suggest that the conflicting results observed in the literature may reflect a difference in the variety and, more importantly, the number of variables used to control for confounding effect. Furthermore, the results reiterate the importance of known dropout risk factors for dropout and suggest that preventive interventions focusing on depressive symptoms should be part of larger programs also aiming at other factors more closely related to school dropout.
5

Consideration of multiple events for the analysis and prediction of a cancer evolution / Prise en compte d'événements multiples pour analyser et prédire l'évolution d'un cancer

Krol, Agnieszka 23 November 2016 (has links)
Le nombre croissant d’essais cliniques pour le traitement du cancer a conduit à la standardisation de l’évaluation de la réponse tumorale. Dans les essais cliniques de phase III des cancers avancés, la survie sans progression est souvent appliquée comme un critère de substitution pour la survie globale. Pour les tumeurs solides, la progression est généralement définie par les critères RECIST qui utilisent l’information sur le changement de taille des lésions cibles et les progressions de la maladie non-cible. Malgré leurs limites, les critères RECIST restent l’outil standard pour l’évaluation des traitements. En particulier, la taille tumorale mesurée au cours de temps est utilisée comme variable ponctuelle catégorisée pour identifier l’état d’un patient. L’approche statistique de la modélisation conjointe permet une analyse plus précise des marqueurs de réponse tumorale et de la survie. En outre, les modèles conjoints sont utiles pour les prédictions dynamiques individuelles. Dans ce travail, nous avons proposé d’appliquer un modèle conjoint trivarié pour des données longitudinales (taille tumorale), des évènements récurrents (les progressions de la maladie non-cible) et la survie. En utilisant des mesures de capacité prédictive, nous avons comparé le modèle proposé avec un modèle pour les progressions tumorales, définies selon les critères standards et la survie. Pour un essai clinique randomisé porté sur le cancer colorectal, nous avons trouvé une meilleure capacité prédictive du modèle proposé. Dans la deuxième partie, nous avons développé un logiciel en libre accès pour l’application de l’approche de modélisation conjointe proposée et les prédictions. Enfin, nous avons étendu le modèle à une analyse plus sophistiquée de l’évolution tumorale à l’aide d’un modèle mécaniste. Une équation différentielle ordinaire a été mise en œuvre pour décrire la trajectoire du marqueur biologique en tenant compte les caractéristiques biologiques de la croissance tumorale. Cette nouvelle approche contribue à la recherche clinique sur l’évaluation d’un traitement dans les essais cliniques grâce à une meilleure compréhension de la relation entre la réponse tumorale et la survie. / The increasing number of clinical trials for cancer treatments has led to standardization of guidelines for evaluation of tumor response. In phase III clinical trials of advanced cancer, progression-free survival is often applied as a surrogate endpoint for overall survival (OS). For solid tumors, progression is usually defined using the RECIST criteria that use information on the change of size of target lesions and progressions of non-target disease. The criteria remain the standard tool for treatment evaluation despite their limitations. In particular, repeatedly measured tumor size is used as a pointwise categorized variable to identify a patient’s status. Statistical approach of joint modeling allows for more accurate analysis of the tumor response markers and survival. Moreover, joint models are useful for individual dynamic predictions of death using patient’s history. In this work, we proposed to apply a trivariate joint model for a longitudinal outcome (tumor size), recurrent events (progressions of non-target disease) and survival. Using adapted measures of predictive accuracy we compared the proposed joint model with a model that considered tumor progressions defined within standard criteria and OS. For a randomized clinical trial for colorectal cancer patients, we found better predictive accuracy of the proposed joint model. In the second part, we developed freely available software for application of the proposed joint modeling and dynamic predictions approach. Finally, we extended the model to a more sophisticated analysis of tumor size evolution using a mechanistic model. An ordinary differential equation was implemented to describe the trajectory of the biomarker regarding the biological characteristics of tumor size under a treatment. This new approach contributes to clinical research on treatment evaluation in clinical trials by better understanding of the relationship between the markers of tumor response with OS.

Page generated in 0.0524 seconds