• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 17
  • 5
  • 1
  • Tagged with
  • 24
  • 24
  • 16
  • 9
  • 9
  • 9
  • 8
  • 7
  • 7
  • 7
  • 7
  • 5
  • 5
  • 5
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Estimation for counting processes with high-dimensional covariates / Estimation pour les processus de comptage avec beaucoup de covariables

Lemler, Sarah 09 December 2014 (has links)
Nous cherchons à estimer l’intensité de sauts d’un processus de comptage en présence d’un grand nombre de covariables. Nous proposons deux approches. D’abord, nous considérons une intensité non-paramétrique et nous l’estimons par le meilleur modèle de Cox étant donné deux dictionnaires de fonctions. Le premier dictionnaire est utilisé pour construire une approximation du logarithme du risque de base et le second pour approximer le risque relatif. Nous considérons une procédure Lasso, spécifique à la grande dimension, pour estimer simultanément les deux paramètres inconnus du meilleur modèle de Cox approximant l’intensité. Nous prouvons des inégalités oracles non-asymptotiques pour l’estimateur Lasso obtenu. Dans une seconde partie, nous supposons que l’intensité satisfait un modèle de Cox. Nous proposons deux procédures en deux étapes pour estimer les paramètres inconnus du modèle de Cox. La première étape est commune aux deux procédures, il s’agit d’estimer le paramètre de régression en grande dimension via une procédure Lasso. Le risque de base est ensuite estimé soit par sélection de modèles, soit par un estimateur à noyau avec une fenêtre choisie par la méthode de Goldenshluger et Lepski. Nous établissons des inégalités oracles non-asymptotiques pour les deux estimateurs du risque de base ainsi obtenus. Nous menons une étude comparative de ces estimateurs sur des données simulées, et enfin, nous appliquons les procédures implémentées à une base de données sur le cancer du sein. / We consider the problem of estimating the intensity of a counting process adjusted on high-dimensional covariates. We propose two different approaches. First, we consider a non-parametric intensity function and estimate it by the best Cox proportional hazards model given two dictionaries of functions. The first dictionary is used to construct an approximation of the logarithm of the baseline hazard function and the second to approximate the relative risk. In this high-dimensional setting, we consider the Lasso procedure to estimate simultaneously the unknown parameters of the best Cox model approximating the intensity. We provide non-asymptotic oracle inequalities for the resulting Lasso estimator. In a second part, we consider an intensity that rely on the Cox model. We propose two two-step procedures to estimate the unknown parameters of the Cox model. Both procedures rely on a first step which consists in estimating the regression parameter in high-dimension via a Lasso procedure. The baseline function is then estimated either via model selection or by a kernel estimator with a bandwidth selected by the Goldenshluger and Lepski method. We establish non-asymptotic oracle inequalities for the two resulting estimators of the baseline function. We conduct a comparative study of these estimators on simulated data, and finally, we apply the implemented procedure to a real dataset on breast cancer.
2

Dynamiques épidémiques, risques et copules / Epidemic dynamics, risk and copulas

Ghassani, Mohamad 30 November 2012 (has links)
Les modèles stochastiques classiques comportent des copules d'interactions linéaires, exprimant en général des interactions de paire. Il sera envisagé d'étendre ces modèles à des interactions non linéaires de type saturation ou de type triplet, en vue de traiter des applications réalistes, comme les diffusions épidémiques.Le but de cette thèse est d'introduire les fonctions copules en épidémiologie, et surtout d'appliquer ces fonctions sur le système de transmission de la Malaria afin de constater la dépendance entre les différents compartiments du système. Nous étudierons quelques modèles compartimentaux, qui sont une généralisation du modèle de Ross-Macdonald, en supposant que la population n'est pas constante et en prenant en compte des paramètres de transmission comme la fécondité, la mortalité et autres. Aussi, nous introduirons les classes d'âges dans certains de ces modèles compartimentaux, afin de trouver une relation entre les individus de ces classes d'âges à l'aide du modèle de Cox et des fonctions copules. Nous donnerons ensuite, deux exemples sur ces modèles : la Malaria au Mali et la peste en Europe au moyen-âge. Nous introduirons aussi les quantiles conditionnels et les fonctions copules archimédiennes, ce qui nous mènera à trouver une dépendance entre les différents compartiments des hôtes et des vecteurs. / The stochastic classical models include linear interactions copulas, expressing in general pair interactions. It is planned to extend these models to nonlinear interactions of saturation type or triplet type, to treat realistic applications, as the epidemics diffusions.The aim of this thesis is to apply the copulas functions in epidemiology, and especially to apply these functions in the transmission system of malaria to detect the dependence existing between compartments of the epidemic system. We will study some compartmental models, which are a generalization of the Ross-Macdonald model, assuming that the population is not constant and taking into account the transmission parameters such as fertility, mortality, etc. Also, we will introduce the age classes in some of these compartmental models, and study the relationships between individuals of these age classes, using the Cox model and the copulas functions. Then, we will give two examples of these models: the Malaria in Mali and the plague in Europe during the Middle Ages. We will introduce also the conditional quantiles and the Archimedean copulas functions, that will lead us to find dependencies between the different compartments of hosts and vectors.
3

RÉGRESSION PLS ET DONNÉES CENSURÉES

Bastien, Philippe 18 March 2008 (has links) (PDF)
Les modèles de régression dans le cadre des données censurées supposent comme pour tous modèles de régression que l'on ait plus d'observations que de descripteurs et des descripteurs pas trop corrélés entre eux. Ces hypothèses ne sont pas souvent vérifiées dans la pratique et les approches classiques deviennent caduques. C'est le cas par exemple en pharmacogénomique lorsque l'on cherche à prédire la probabilité de survie de patients à partir de profiles, ou signatures transcriptomiques, construits à partir de l'expression de milliers de gènes. L'objectif de cette thèse est d'apporter une solution à ce problème en utilisant les principes de la régression PLS. Le modèle PLS-Cox qui est proposé est issu d'une généralisation de la régression PLS à tous modèles de régression. Il fournit une alternative régularisée aux modèles de survie en grande dimension (p>>n). L'utilisation d'une reparamétrisation de type « Kernel » des algorithmes PLS a permis en outre de développer des solutions à la fois très rapides et particulièrement utiles en très grande dimension, mais aussi adaptées pour l'analyse de structures non-linéaires des données. Une autre solution à ce problème, rapide et simple à mettre en œuvre, a été développée à partir des résidus de la déviance. Une alternative à PLS-NIPALS a été proposée pour la gestion des valeurs manquantes en introduisant le concept d'imputation multiple en régression PLS simple et généralisée. Finalement, on s'est intéressé à la recherche de modèles plus parcimonieux en proposant une approche de type « Thresholding PLS » qui opère implicitement par sélection des variables.
4

Analyse de durées de vie : analyse séquentielle du modèle des risques proportionnels et tests d'homogénéité

Breuils, Christelle 15 December 2003 (has links) (PDF)
La première partie concerne l'estimation séquentielle du paramètre de régression pour le modèle de Cox pour des données censurées à droite. Il est ainsi possible de définir des règles d'arrêt garantissant une bonne estimation. Celles-ci conduisent alors à des estimateurs dépendant de tailles d'échantillons aléatoires pour lesquels le comportement asymptotique est le même que celui des estimateurs non séquentiels. Les propriétés démontrées sont étendues au cadre multidimensionnel et illustrées par des simulations. Cette première partie s'achève par l'étude théorique du comportement de la variable d'arrêt dans le cadre d'intervalles de confiance séquentiels. La règle d'arrêt normalisée est alors asymptotiquement normale. La seconde partie porte sur la construction de tests d'homogénéité dans le cadre d'un modèle de durées de vie non paramétrique incluant des covariables ainsi que la censure à droite. Une statistique de test est proposée et son comportement asymptotique est établi.
5

Modèles de regression en présence de compétition

Latouche, Aurélien 20 December 2004 (has links) (PDF)
L'analyse de survie concerne la modélisation des délais de réalisation d'un unique événement. Dans de nombreuses situations cependant, les individus sont soumis à plusieurs causes d'événement exclusives, définissant un cadre dit de risques concurrents ou compétitifs. <br />Ce travail de thèse a porté sur l'étude de modèles de régression dans ce cadre. Deux approches ont été envisagéés, l'une basée sur la fonction de risque instantané cause-spécifique et l'autre sur la <br />fonction de risque instantané associée à la fonction d'incidence cumulée (ou fonction de risque de sous-répartition). Dans les deux cas, nous avons considéré une formulation à risques proportionnels, c'est à dire un modèle de Cox dans le premier cas, et un modèle de Fine & Gray dans le second cas. <br />Dans un premier temps, l'implication d'un choix de modélisation a été étudiée dans le cadre de la planification d'un essai clinique ou d'une étude pronostique. Nous avons alors developpé<br />une formule de calcul du nombre de sujets nécessaire pour le modèle de Fine & Gray. <br />Puis, les conséquences d'un modèle mal spécifié pour la fonction de risque de sous répartition ont été evaluées, en étudiant l'influence sur l'estimation du paramètre de régression dans le modèle de Fine & Gray quand le vrai modèle est un modèle à risques proportionnels pour la fonction de risque cause- <br />spécifique. Nous avons ensuite étudié les implications de l'inclusion de covariables dépendantes du <br />temps dans le modèle de Fine & Gray. <br />Enfin, nous avons présenté une synthèse didactique sur la <br />stratégie d'utilisation des approches présentées dans ce travail de thèse.
6

Test des effets centre en épidémiologie clinique / Testing for centre effects in clinical epidemiology

Biard, Lucie 25 November 2016 (has links)
La modélisation des effets centre dans le cadre des données de survie repose souvent sur l'utilisation de modèles de Cox à effets mixtes. Tester un effet centre revient alors à tester à zéro la variance de l'effet aléatoire correspondant. La distribution sous l'hypothèse nulle des statistiques des tests paramétriques usuels n'est alors pas toujours connue. Les procédures de permutation ont été proposées comme alternative, pour les modèles linéaires généralisés mixtes.L'objectif est de développer, pour l'analyse des effets centre dans un modèle de survie de Cox à effets mixtes, une procédure de test de permutation pour les effets aléatoires.La première partie du travail présente la procédure de permutation développée pour le test d'un unique effet centre sur le risque de base, avec une application à la recherche d'un effet centre dans un essai clinique chez des patients atteints de leucémie myéloïde aiguë. La seconde partie porte sur l'extension de la procédure au test d'effets aléatoires multiples afin d’étudier à la fois des effets centre sur le risque de base et sur l'effet de variables, avec des illustrations sur deux cohortes de patients atteints de leucémie aiguë. Dans une troisième partie, les méthodes proposées sont appliquées à une cohorte multicentrique de patients en réanimation atteints d'hémopathies malignes, pour étudier les facteurs déterminant les effets centre sur la mortalité hospitalière. Les procédures de permutation proposées constituent une approche robuste et d'implémentation relativement aisée pour le test, en routine, d'effets aléatoires, donc un outil adapté pour l'analyse d'effets centre en épidémiologie clinique, afin de comprendre leur origine. / Centre effects modelling within the framework of survival data often relies on the estimation of Cox mixed effects models. Testing for a centre effect consists in testing to zero the variance component of the corresponding random effect. In this framework, the identification of the null distribution of usual tests statistics is not always straightforward. Permutation procedures have been proposed as an alternative, for generalised linear mixed models.The objective was to develop a permutation test procedure for random effects in a Cox mixed effects model, for the test of centre effects.We first developed and evaluated permutation procedures for the test of a single centre effect on the baseline risk. The test was used to investigate a centre effect in a clinical trial of induction chemotherapy for patients with acute myeloid leukaemia.The second part consisted in extending the procedure for the test of multiple random effects, in survival models. The aim was to be able to examine both center effects on the baseline risk and centre effects on the effect of covariates. The procedure was illustrated on two cohorts of acute leukaemia patients. In a third part, the permutation approach was applied to a cohort of critically ill patients with hematologic malignancies, to investigate centre effects on the hospital mortality.The proposed permutation procedures appear to be robust approaches, easily implemented for the test of random centre effect in routine practice. They are an appropriate tool for the analysis of centre effects in clinical epidemiology, with the purpose of understanding their sources.
7

Modélisation conjointe de données longitudinales et de durées de vie

Dupuy, Jean-François 19 November 2002 (has links) (PDF)
Le modèle de régression semiparamétrique de Cox est l'un des plus utilisés pour l'analyse statistique des durées de vie issues du domaine médical ou de la fiabilité. Ses paramètres sont un paramètre de régression et une fonction de risque de base positive et inconnue. L'inférence statistique pour ce modèle, basée sur la vraisemblance partielle de Cox, est souvent compliquée par la présence de données manquantes des covariables. Dans cette thèse, nous proposons une méthode d'estimation des paramètres du modèle de Cox adaptée à cette situation, et nous étudions les propriétés asymptotiques des estimateurs obtenus. La méthode proposée consiste à modéliser conjointement les durées censurées et le processus de covariable afin d'en déduire, par intégration sur les valeurs manquantes de cette covariable, une vraisemblance conjointe permettant d'estimer les paramètres du modèle de Cox au vu des données incomplètes. Dans un premier temps, nous proposons et formalisons un modèle conjoint pour les durées de vie et la covariable longitudinale. Ce modèle est construit à partir du modèle de Cox et d'un modèle de covariable choisi comme étant une fonction en escalier. Nous établissons ensuite l'identifiabilité de ce modèle sous des conditions de régularité peu contraignantes. Puis, nous adaptons au modèle conjoint la méthode du maximum de vraisemblance semiparamétrique. Nous montrons l'existence d'estimateurs semiparamétriques de ses paramètres, et en particulier de ses paramètres d'intérêt, qui sont les paramètres du modèle de Cox. L'expression compliquée de la vraisemblance conjointe ne permet pas d'obtenir analytiquement ces estimateurs. Nous mettons alors en oeuvre l'estimation à l'aide d'un algorithme EM. Nous montrons ensuite la consistance et la normalité asymptotique de nos estimateurs. Puis, nous proposons un estimateur consistant de leur variance asymptotique. Dans une dernière partie, nous appliquons la méthode proposée sur un jeu de données réelles, et nous comparons nos résultats avec deux autres méthodes d'estimation du modèle de Cox avec covariable manquante proposées dans la littérature.
8

Dynamiques épidémiques, risques et copules

Ghassani, Mohamad, Ghassani, Mohamad 30 November 2012 (has links) (PDF)
Les modèles stochastiques classiques comportent des copules d'interactions linéaires, exprimant en général des interactions de paire. Il sera envisagé d'étendre ces modèles à des interactions non linéaires de type saturation ou de type triplet, en vue de traiter des applications réalistes, comme les diffusions épidémiques.Le but de cette thèse est d'introduire les fonctions copules en épidémiologie, et surtout d'appliquer ces fonctions sur le système de transmission de la Malaria afin de constater la dépendance entre les différents compartiments du système. Nous étudierons quelques modèles compartimentaux, qui sont une généralisation du modèle de Ross-Macdonald, en supposant que la population n'est pas constante et en prenant en compte des paramètres de transmission comme la fécondité, la mortalité et autres. Aussi, nous introduirons les classes d'âges dans certains de ces modèles compartimentaux, afin de trouver une relation entre les individus de ces classes d'âges à l'aide du modèle de Cox et des fonctions copules. Nous donnerons ensuite, deux exemples sur ces modèles : la Malaria au Mali et la peste en Europe au moyen-âge. Nous introduirons aussi les quantiles conditionnels et les fonctions copules archimédiennes, ce qui nous mènera à trouver une dépendance entre les différents compartiments des hôtes et des vecteurs.
9

L’épidémiologie de l’infection VIH chez l’adulte en Guadeloupe : étude à partir de la base de données hospitalière sur l’infection VIH (1988-2009) / The epidemiology of HIV among adults in Guadeloupe : a study from the guadeloupean hospital database of HIV (1988-2009)

Elenga, Narcisse 10 November 2014 (has links)
Avec un taux d’incidence cumulée de 56 cas pour 100 000 habitants, la Guadeloupe est la deuxième région de France la plus touchée par le VIH. La plupart des publications sur le VIH/Sida en Guadeloupe sont essentiellement descriptives, issues de rapports d’activité. La base hospitalière, alimentant la Base de données Hospitalière française sur l’infection à VIH, n’a été que très peu exploitée pour la recherche. L’objectif de ce travail est d’évaluer les aspects fondamentaux de la prise en charge de l’infection VIH. Ainsi le dépistage tardif, le retard à la prise en charge spécialisée, l’interruption du suivi, les infections opportunistes et les décès sont étudiés ainsi que leurs facteurs prédictifs.Dans ce travail articulé autour de six publications, nous avons mis en évidence les points suivants : tout d’abord, le diagnostic très tardif (CD4<200/mm3) concernait 40,12 % des adultes infectés par le VIH suivis en Guadeloupe. Comparé à la France métropolitaine, ce taux est encore très élevé et souligne l’importance de poursuivre les efforts de dépistage. Pour pouvoir bénéficier d’une prise en charge précoce, le patient doit être dirigé dans un centre de traitement de l’infection par le VIH sans tarder. Or, le retard dans cette prise en charge spécialisée touchait 36 % des patients. L’analyse des éléments associés à ce retard a permis d’en identifier les facteurs de risque.Pour optimiser les résultats thérapeutiques, les patients nécessitent un suivi régulier. Ainsi, le système de santé devrait avoir comme objectif, entre autres, la rétention des patients dans le circuit de soins. Or, plus de 22 % des patients de cette cohorte étaient perdus de vue et jamais revus. Les patients plus jeunes, ceux au stade B de la classification CDC et ceux non traités par TTARV étaient plus à risque d’interruption de suivi, dès la première année suivant le diagnostic de l’infection VIH.Bien que la proportion des patients suivis sous ARV soit proche de 100 %, il en existe toujours développant un Sida. La comparaison avec la Guyane et la France métropolitaine montre que les trois premières affections classantes en Guadeloupe étaient la candidose oesophagienne, le syndrome de cachexie liée au VIH et la pneumocystose. Il existait des différences notables avec la métropole, mais aussi avec la Guyane. Ce taux élevé de syndrome de cachexie liée au VIH pose question. Derrière ce diagnostic, pourraient se cacher d’autres maladies opportunistes non diagnostiquées, mais également des différences de codage. Le recul de la mortalité avec le temps a entraîné une modification qualitative des causes de décès. Celles rapportées dans la littérature étaient les mêmes que celles observées dans notre étude. Contrairement à la métropole où le cancer représentait la première cause de mortalité, en Guadeloupe, les infections liées au Sida constituaient la première cause de décès.Ce travail de thèse s’est donc efforcé de dégager, pour l’une des régions de France les plus affectées par le VIH, quelques grands indicateurs à partir de la Base Hospitalière FHDH. Cette base ne comportait pas toujours toutes les informations souhaitées, mais le nombre substantiel d’observations donnait une puissance importante aux variables étudiées. Ces résultats, bien que confirmant souvent les connaissances empiriques des cliniciens, aura pu aider à mieux appréhender l’épidémie du VIH en Guadeloupe. / With an accumulated incidence rate of 56 cases per 100 000 inhabitants, Guadeloupe is the second French region most affected by HIV. Most of the publications on HIV/AIDS were essentially descriptive, stemming from annual reports. The Guadeloupean Hospital Database on HIV was scarcely exploited for research. The objective of this work was to estimate the fundamental aspects of HIV/AIDS in Guadeloupe. So late presentation for care, delay between HIV diagnosis and first specialised consultation, follow-up interruption, incidence of depression, opportunistic infections and deaths were studied as well as their predictive factors. We were able to highlight the following points: first, the very late HIV diagnosis (CD4< 200 / mm3) concerned 40, 12 % of HIV- infected adults followed in Guadeloupe. 36 % of patients had delays between HIV diagnosis and first specialised consultation. However, more than 22 % of patients were permanently lost to follow-up and never seen again. The first three classifying affections were oesophageal candidiasis, HIV-wasting syndrome and pneumocystosis. The causes of deaths reported in the literature were similar to those observed in our study. AIDS-related infections were the first cause of deaths.This thesis work thus tried to generate, in one of the most HIV-affected French regions, some indicators from the French Hospital Database on HIV. This database often did not contain all the desired informations, but the important number of observations allowed to have high power for the studied variables. These results, although often confirming the clinicians' empirical knowledge, may help understand some aspects of the HIV epidemic in Guadeloupe.
10

Validation des modèles statistiques tenant compte des variables dépendantes du temps en prévention primaire des maladies cérébrovasculaires

Kis, Loredana 07 1900 (has links)
L’intérêt principal de cette recherche porte sur la validation d’une méthode statistique en pharmaco-épidémiologie. Plus précisément, nous allons comparer les résultats d’une étude précédente réalisée avec un devis cas-témoins niché dans la cohorte utilisé pour tenir compte de l’exposition moyenne au traitement : – aux résultats obtenus dans un devis cohorte, en utilisant la variable exposition variant dans le temps, sans faire d’ajustement pour le temps passé depuis l’exposition ; – aux résultats obtenus en utilisant l’exposition cumulative pondérée par le passé récent ; – aux résultats obtenus selon la méthode bayésienne. Les covariables seront estimées par l’approche classique ainsi qu’en utilisant l’approche non paramétrique bayésienne. Pour la deuxième le moyennage bayésien des modèles sera utilisé pour modéliser l’incertitude face au choix des modèles. La technique utilisée dans l’approche bayésienne a été proposée en 1997 mais selon notre connaissance elle n’a pas été utilisée avec une variable dépendante du temps. Afin de modéliser l’effet cumulatif de l’exposition variant dans le temps, dans l’approche classique la fonction assignant les poids selon le passé récent sera estimée en utilisant des splines de régression. Afin de pouvoir comparer les résultats avec une étude précédemment réalisée, une cohorte de personnes ayant un diagnostique d’hypertension sera construite en utilisant les bases des données de la RAMQ et de Med-Echo. Le modèle de Cox incluant deux variables qui varient dans le temps sera utilisé. Les variables qui varient dans le temps considérées dans ce mémoire sont iv la variable dépendante (premier évènement cérébrovasculaire) et une des variables indépendantes, notamment l’exposition / The main interest of this research is the validation of a statistical method in pharmacoepidemiology. Specifically, we will compare the results of a previous study performed with a nested case-control which took into account the average exposure to treatment to : – results obtained in a cohort study, using the time-dependent exposure, with no adjustment for time since exposure ; – results obtained using the cumulative exposure weighted by the recent past ; – results obtained using the Bayesian model averaging. Covariates are estimated by the classical approach and by using a nonparametric Bayesian approach. In the later, the Bayesian model averaging will be used to model the uncertainty in the choice of models. To model the cumulative effect of exposure which varies over time, in the classical approach the function assigning weights according to recency will be estimated using regression splines. In order to compare the results with previous studies, a cohort of people diagnosed with hypertension will be constructed using the databases of the RAMQ and Med-Echo. The Cox model including two variables which vary in time will be used. The time-dependent variables considered in this paper are the dependent variable (first stroke event) and one of the independent variables, namely the exposure.

Page generated in 0.0625 seconds