• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 38
  • 15
  • 3
  • Tagged with
  • 54
  • 54
  • 32
  • 29
  • 13
  • 12
  • 11
  • 11
  • 11
  • 10
  • 10
  • 10
  • 9
  • 9
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Sélection de modèle d'imputation à partir de modèles bayésiens hiérarchiques linéaires multivariés

Chagra, Djamila 06 1900 (has links)
Résumé La technique connue comme l'imputation multiple semble être la technique la plus appropriée pour résoudre le problème de non-réponse. La littérature mentionne des méthodes qui modélisent la nature et la structure des valeurs manquantes. Une des méthodes les plus populaires est l'algorithme « Pan » de (Schafer & Yucel, 2002). Les imputations rapportées par cette méthode sont basées sur un modèle linéaire multivarié à effets mixtes pour la variable réponse. La méthode « BHLC » de (Murua et al, 2005) est une extension de « Pan » dont le modèle est bayésien hiérarchique avec groupes. Le but principal de ce travail est d'étudier le problème de sélection du modèle pour l'imputation multiple en termes d'efficacité et d'exactitude des prédictions des valeurs manquantes. Nous proposons une mesure de performance liée à la prédiction des valeurs manquantes. La mesure est une erreur quadratique moyenne reflétant la variance associée aux imputations multiples et le biais de prédiction. Nous montrons que cette mesure est plus objective que la mesure de variance de Rubin. Notre mesure est calculée en augmentant par une faible proportion le nombre de valeurs manquantes dans les données. La performance du modèle d'imputation est alors évaluée par l'erreur de prédiction associée aux valeurs manquantes. Pour étudier le problème objectivement, nous avons effectué plusieurs simulations. Les données ont été produites selon des modèles explicites différents avec des hypothèses particulières sur la structure des erreurs et la distribution a priori des valeurs manquantes. Notre étude examine si la vraie structure d'erreur des données a un effet sur la performance du choix des différentes hypothèses formulées pour le modèle d'imputation. Nous avons conclu que la réponse est oui. De plus, le choix de la distribution des valeurs manquantes semble être le facteur le plus important pour l'exactitude des prédictions. En général, les choix les plus efficaces pour de bonnes imputations sont une distribution de student avec inégalité des variances dans les groupes pour la structure des erreurs et une loi a priori choisie pour les valeurs manquantes est la loi normale avec moyenne et variance empirique des données observées, ou celle régularisé avec grande variabilité. Finalement, nous avons appliqué nos idées à un cas réel traitant un problème de santé. Mots clés : valeurs manquantes, imputations multiples, modèle linéaire bayésien hiérarchique, modèle à effets mixtes. / Abstract The technique known as multiple imputation seems to be the most suitable technique for solving the problem of non-response. The literature mentions methods that models the nature and structure of missing values. One of the most popular methods is the PAN algorithm of Schafer and Yucel (2002). The imputations yielded by this method are based on a multivariate linear mixed-effects model for the response variable. A Bayesian hierarchical clustered and more flexible extension of PAN is given by the BHLC model of Murua et al. (2005). The main goal of this work is to study the problem of model selection for multiple imputation in terms of efficiency and accuracy of missing-value predictions. We propose a measure of performance linked to the prediction of missing values. The measure is a mean squared error, and hence in addition to the variance associated to the multiple imputations, it includes a measure of bias in the prediction. We show that this measure is more objective than the most common variance measure of Rubin. Our measure is computed by incrementing by a small proportion the number of missing values in the data and supposing that those values are also missing. The performance of the imputation model is then assessed through the prediction error associated to these pseudo missing values. In order to study the problem objectively, we have devised several simulations. Data were generated according to different explicit models that assumed particular error structures. Several missing-value prior distributions as well as error-term distributions are then hypothesized. Our study investigates if the true error structure of the data has an effect on the performance of the different hypothesized choices for the imputation model. We concluded that the answer is yes. Moreover, the choice of missing-value prior distribution seems to be the most important factor for accuracy of predictions. In general, the most effective choices for good imputations are a t-Student distribution with different cluster variances for the error-term, and a missing-value Normal prior with data-driven mean and variance, or a missing-value regularizing Normal prior with large variance (a ridge-regression-like prior). Finally, we have applied our ideas to a real problem dealing with health outcome observations associated to a large number of countries around the world. Keywords: Missing values, multiple imputation, Bayesian hierarchical linear model, mixed effects model. / Les logiciels utilisés sont Splus et R.
32

Contributions à l'estimation paramétrique des modèles décrits par les équations aux dérivées partielles

Schorsch, Julien 25 November 2013 (has links) (PDF)
Les systèmes décrits par les équations aux dérivées partielles, appartiennent à la classe des systèmes dynamiques impliquant des fonctions dépendantes de plusieurs variables, comme le temps et l'espace. Déjà fortement répandus pour la modélisation mathématique de phénomènes physiques et environnementaux, ces systèmes ont un rôle croissant dans les domaines de l'automatique. Cette expansion, provoquée par les avancées technologiques au niveau des capteurs facilitant l'acquisition de données et par les nouveaux enjeux environnementaux, incite au développement de nouvelles thématiques de recherche. L'une de ces thématiques, est l'étude des problèmes inverses et plus particulièrement l'identification paramétrique des équations aux dérivées partielles. Tout abord, une description détaillée des différentes classes de systèmes décrits par ces équations est présentée puis les problèmes d'identification qui leur sont associés sont soulevés. L'accent est mis sur l'estimation paramétrique des équations linéaires, homogènes ou non, et sur les équations linéaires à paramètres variant. Un point commun à ces problèmes d'identification réside dans le caractère bruité et échantillonné des mesures de la sortie. Pour ce faire, deux types d'outils principaux ont été élaborés. Certaines techniques de discrétisation spatio-temporelle ont été utilisées pour faire face au caractère échantillonné des données; les méthodes de variable instrumentale, pour traiter le problème lié à la présence de bruit de mesure. Les performances de ces méthodes ont été évaluées selon des protocoles de simulation numérique reproduisant des situations réalistes de phénomènes physique et environnementaux, comme la diffusion de polluant dans une rivière.
33

L’arbre de régression multivariable et les modèles linéaires généralisés revisités : applications à l’étude de la diversité bêta et à l’estimation de la biomasse d’arbres tropicaux

Ouellette, Marie-Hélène 04 1900 (has links)
En écologie, dans le cadre par exemple d’études des services fournis par les écosystèmes, les modélisations descriptive, explicative et prédictive ont toutes trois leur place distincte. Certaines situations bien précises requièrent soit l’un soit l’autre de ces types de modélisation ; le bon choix s’impose afin de pouvoir faire du modèle un usage conforme aux objectifs de l’étude. Dans le cadre de ce travail, nous explorons dans un premier temps le pouvoir explicatif de l’arbre de régression multivariable (ARM). Cette méthode de modélisation est basée sur un algorithme récursif de bipartition et une méthode de rééchantillonage permettant l’élagage du modèle final, qui est un arbre, afin d’obtenir le modèle produisant les meilleures prédictions. Cette analyse asymétrique à deux tableaux permet l’obtention de groupes homogènes d’objets du tableau réponse, les divisions entre les groupes correspondant à des points de coupure des variables du tableau explicatif marquant les changements les plus abrupts de la réponse. Nous démontrons qu’afin de calculer le pouvoir explicatif de l’ARM, on doit définir un coefficient de détermination ajusté dans lequel les degrés de liberté du modèle sont estimés à l’aide d’un algorithme. Cette estimation du coefficient de détermination de la population est pratiquement non biaisée. Puisque l’ARM sous-tend des prémisses de discontinuité alors que l’analyse canonique de redondance (ACR) modélise des gradients linéaires continus, la comparaison de leur pouvoir explicatif respectif permet entre autres de distinguer quel type de patron la réponse suit en fonction des variables explicatives. La comparaison du pouvoir explicatif entre l’ACR et l’ARM a été motivée par l’utilisation extensive de l’ACR afin d’étudier la diversité bêta. Toujours dans une optique explicative, nous définissons une nouvelle procédure appelée l’arbre de régression multivariable en cascade (ARMC) qui permet de construire un modèle tout en imposant un ordre hiérarchique aux hypothèses à l’étude. Cette nouvelle procédure permet d’entreprendre l’étude de l’effet hiérarchisé de deux jeux de variables explicatives, principal et subordonné, puis de calculer leur pouvoir explicatif. L’interprétation du modèle final se fait comme dans une MANOVA hiérarchique. On peut trouver dans les résultats de cette analyse des informations supplémentaires quant aux liens qui existent entre la réponse et les variables explicatives, par exemple des interactions entres les deux jeux explicatifs qui n’étaient pas mises en évidence par l’analyse ARM usuelle. D’autre part, on étudie le pouvoir prédictif des modèles linéaires généralisés en modélisant la biomasse de différentes espèces d’arbre tropicaux en fonction de certaines de leurs mesures allométriques. Plus particulièrement, nous examinons la capacité des structures d’erreur gaussienne et gamma à fournir les prédictions les plus précises. Nous montrons que pour une espèce en particulier, le pouvoir prédictif d’un modèle faisant usage de la structure d’erreur gamma est supérieur. Cette étude s’insère dans un cadre pratique et se veut un exemple pour les gestionnaires voulant estimer précisément la capture du carbone par des plantations d’arbres tropicaux. Nos conclusions pourraient faire partie intégrante d’un programme de réduction des émissions de carbone par les changements d’utilisation des terres. / In ecology, in ecosystem services studies for example, descriptive, explanatory and predictive modelling all have relevance in different situations. Precise circumstances may require one or the other type of modelling; it is important to choose the method properly to insure that the final model fits the study’s goal. In this thesis, we first explore the explanatory power of the multivariate regression tree (MRT). This modelling technique is based on a recursive bipartitionning algorithm. The tree is fully grown by successive bipartitions and then it is pruned by resampling in order to reveal the tree providing the best predictions. This asymmetric analysis of two tables produces homogeneous groups in terms of the response that are constrained by splitting levels in the values of some of the most important explanatory variables. We show that to calculate the explanatory power of an MRT, an appropriate adjusted coefficient of determination must include an estimation of the degrees of freedom of the MRT model through an algorithm. This estimation of the population coefficient of determination is practically unbiased. Since MRT is based upon discontinuity premises whereas canonical redundancy analysis (RDA) models continuous linear gradients, the comparison of their explanatory powers enables one to distinguish between those two patterns of species distributions along the explanatory variables. The extensive use of RDA for the study of beta diversity motivated the comparison between its explanatory power and that of MRT. In an explanatory perspective again, we define a new procedure called a cascade of multivariate regression trees (CMRT). This procedure provides the possibility of computing an MRT model where an order is imposed to nested explanatory hypotheses. CMRT provides a framework to study the exclusive effect of a main and a subordinate set of explanatory variables by calculating their explanatory powers. The interpretation of the final model is done as in nested MANOVA. New information may arise from this analysis about the relationship between the response and the explanatory variables, for example interaction effects between the two explanatory data sets that were not evidenced by the usual MRT model. On the other hand, we study the predictive power of generalized linear models (GLM) to predict individual tropical tree biomass as a function of allometric shape variables. Particularly, we examine the capacity of gaussian and gamma error structures to provide the most precise predictions. We show that for a particular species, gamma error structure is superior in terms of predictive power. This study is part of a practical framework; it is meant to be used as a tool for managers who need to precisely estimate the amount of carbon recaptured by tropical tree plantations. Our conclusions could be integrated within a program of carbon emission reduction by land use changes.
34

Imagerie des faisceaux de fibres et des réseaux fonctionnels du cerveau : application à l'étude du syndrome de Gilles de la Tourette

Malherbe, Caroline 28 March 2012 (has links) (PDF)
L'objectif de cette thèse est d'identifier et caractériser les boucles anatomiques et fonctionnelles cortico-sous-corticales chez l'Homme, à partir de données d'imagerie par résonance magnétique fonctionnelle (IRMf) au repos et de diffusion. Une boucle est un ensemble de régions corticales, sous-corticales et cérébelleuses, qui interagissent afin d'effectuer ou de préparer une tâche.Le premier axe de ce travail vise à identifier les réseaux fonctionnels cortico-sous-corticaux en IRMf au repos. Nous proposons une méthode statistique robuste séparant l'analyse corticale de l'analyse sous-corticale. Une analyse en composantes indépendantes spatiales est d'abord réalisée individuellement sur les régions corticales, et suivie d'une classification hiérarchique. Les régions sous-corticales associées sont ensuite extraites par un modèle linéaire général dont les régresseurs comportent la dynamique des régions corticales, suivi d'une analyse de groupe à effets aléatoires. La méthode est validée sur deux jeux de données différents. Un atlas immunohistochimique des structures sous-corticales permet ensuite de déterminer la fonction sensorimotrice, associative ou limbique des réseaux obtenus. Nous montrons enfin que l'anatomie est un support pour la fonction chez des sujets sains.Le dernier axe étudie le syndrome de Gilles de la Tourette, qu'on pense être dû à un dysfonctionnement des boucles cortico-sous-corticales. Nous caractérisons d'abord les boucles cortico-sous-corticales fonctionnelles grâce à des métriques d'intégration et de théorie des graphes, et des différences en termes de connectivité sont mises en évidence entre patients adultes et volontaires sains. Nous montrons également que les boucles cortico-sous-corticales fonctionnelles chez les patients sont soutenues par l'anatomie sous-jacente.
35

Observateurs adaptatifs pour l'identification en ligne et l'observation des systèmes linéaires / Adaptive observers for online identification and state observation of linear systems

Afri, Chouaib 13 December 2016 (has links)
Dans cette thèse, nous étudions le problème de l'identification d'un système à dynamique linéaire. Dans un premier temps, nous répertorions les différentes méthodes qui ont été développées dans la littérature en nous concentrant plus particulièrement sur les méthodes des observateurs adaptatifs. Dans un second temps nous présentons un premier algorithme qui est une approche mixant les méthodes des sous-espaces et celles des observateurs adaptatifs. Ce nouvel algorithme est d'autant plus intéressant qu'il nous permet d'identifier des réalisations de systèmes MIMO dans une base d'état arbitraire. La convergence de cet algorithme est démontrée en utilisant les notions d'excitation persistantes. Dans un troisième chapitre nous introduisons une nouvelle méthode qui s'appuie sur le concept des observateurs de Luenberger non linéaires développés ces dernières années. Ce nouvel algorithme se différencie des algorithmes existants par sa capacité à produire une estimation simultanée des paramètres et de l'état du système. Nous démontrons alors sa robustesse à des perturbations affectant la dynamique interne ou les mesures. La convergence de cet algorithme est obtenue si les entrées du système satisfont une hypothèse d'excitation différentielle. Tous ces algorithmes sont alors évalués et implémentés sur un banc d'expérimentation / In this thesis, we study the problem of identification of a linear dynamical system. First, we survey various methods that have been developed in the literature. We focus more particularly on methods named adaptive observers. Secondly we present an approach which combines subspace identification methods and adaptive observers. This new method is interesting since it allows us to identify MIMO systems in an arbitrary basis. The convergence of this algorithm is demonstrated using the persistent excitation notions. In the third chapter we introduce a new method that is inspired from nonlinear Luenberger observers developed in recent years. This new algorithm is different from the existing algorithms since the parameters and the systemstatus are estimated simultaneously. We demonstrate the robustness of this approach. The convergence of the algorithm is obtained if the system inputs satisfy a differential excitation hypothesis. All these algorithms are evaluated and implemented on an experimental bench
36

Semiparametric estimation for extreme values

Bouquiaux, Christel 05 September 2005 (has links)
Nous appliquons la théorie asymptotique des expériences statistiques à des problèmes liés aux valeurs extrêmes. Quatre modèles semi-paramétriques sont envisagés. Tout d'abord le modèle d'échantillonnage de fonction de répartition de type Pareto. L'index de Pareto est le paramètre d'intérêt tandis que la fonction à variation lente, qui intervient dans la décomposition de la fonction de survie, joue le rôle de nuisance. Nous considérons ensuite des observations i.i.d. de fonction de répartition de type Weibull. Le troisième modèle étudié est un modèle de régression. On considère des couples d'observations $(Y_i,X_i)$ indépendants, les v.a. $X_i$ sont i.i.d. de loi connue et on suppose que la fonction de répartition de la loi de $Y$ conditionnellement à $X$ est de type Pareto, avec une fonction à variation lente et un index $gamma$ qui dépendent de $X$. On fait l'hypothèse que la fonction $gamma$ a une forme quelconque mais connue, qui dépend d'un paramètre $\ / Doctorat en sciences, Orientation statistique / info:eu-repo/semantics/nonPublished
37

Modèles de régression multivariés pour la comparaison de populations en IRM de diffusion / Multivariate regression models for group comparison in diffusion tensor MRI

Bouchon, Alix 28 September 2016 (has links)
L'IRM de diffusion (IRMd) est une modalité d'imagerie qui permet d'étudier in vivo la structure des faisceaux de la substance blanche grâce à la caractérisation des propriétés de diffusion des molécules d'eau dans le cerveau. Les travaux de cette thèse se sont concentrés sur la comparaison de groupes d'individus en IRMd. Le but est d'identifier les zones de la substance blanche dont les propriétés structurelles sont statistiquement différentes entre les deux populations ou significativement corrélées avec certaines variables explicatives. L’enjeu est de pouvoir localiser et caractériser les lésions causées par une pathologie et de comprendre les mécanismes sous-jacents. Pour ce faire, nous avons proposé dans cette thèse des méthodes d'analyse basées voxel reposant sur le Modèle Linéaire Général (MLG) et ses extensions multivariées et sur des variétés, qui permettent d'effectuer des tests statistiques intégrant explicitement des variables explicatives. En IRMd, la diffusion des molécules d'eau peut être modélisée par un tenseur d'ordre deux représenté par une matrice symétrique définie-positive de dimension trois. La principale contribution de cette thèse a été de montrer la plus-value de considérer, dans le MLG, l'information complète du tenseur par rapport à un unique descripteur scalaire caractérisant la diffusion (fraction d’anisotropie ou diffusion moyenne), comme cela est généralement fait dans les études en neuro-imagerie. Plusieurs stratégies d’extension du MLG aux tenseurs ont été comparées, que ce soit en termes d’hypothèse statistique (homoscédasticité vs hétéroscédasticité), de métrique utilisée pour l’estimation des paramètres (Euclidienne, Log-Euclidienne et Riemannienne), ou de prise en compte de l’information du voisinage spatial. Nous avons également étudié l'influence de certains prétraitements comme le filtrage et le recalage. Enfin, nous avons proposé une méthode de caractérisation des zones détectées afin d’en faciliter l’interprétation physiopathologique. Les validations ont été menées sur données synthétiques ainsi que sur une base d’images issues d’une cohorte de patients atteints de Neuromyélite optique de Devic. / Diffusion Tensor MRI (DT-MRI) is an imaging modality that allows to study in vivo the structure of white matter fibers through the characterization of diffusion properties of water molecules in the brain. This work focused on group comparison in DT-MRI. The aim is to identify white matter regions whose structural properties are statistically different between two populations or significantly correlated with some explanatory variables. The challenge is to locate and characterize lesions caused by a disease and to understand the underlying mechanisms. To this end, we proposed several voxel-based strategies that rely on the General Linear Model (GLM) and its multivariate and manifold-based extensions, to perform statistical tests that explicitly incorporate explanatory variables. In DT-MRI, diffusion of water molecules can be modeled by a second order tensor represented by a three dimensional symmetric and positive definite matrix. The main contribution of this thesis was to demonstrate the added value of considering the full tensor information as compared to a single scalar index characterizing some diffusion properties (fractional anisotropy or mean diffusion) in the GLM, as it is usually done in neuroimaging studies. Several strategies for extending the GLM to tensor were compared, either in terms of statistical hypothesis (homoscedasticity vs heteroscedasticity), or metrics used for parameter estimation (Euclidean, Log-Euclidean and Riemannian), or the way to take into account the spatial neighborhood information. We also studied the influence of some pre-processing such as filtering and registration. Finally, we proposed a method for characterizing the detected regions in order to facilitate their physiopathological interpretation. Validations have been conducted on synthetic data as well as on a cohort of patients suffering from Neuromyelitis Optica.
38

Identification des indices acoustiques utilisés lors de la compréhension de la parole dégradée / Identification of acoustic cues involved in degraded speech comprehension

Varnet, Léo 18 November 2015 (has links)
Bien qu’il existe un large consensus de la communauté scientifique quant au rôle des indices acoustiques dans la compréhension de la parole, les mécanismes exacts permettant la transformation d’un flux acoustique continu en unités linguistiques élémentaires demeurent aujourd’hui largement méconnus. Ceci est en partie dû à l’absence d’une méthodologie efficace pour l’identification et la caractérisation des primitives auditives de la parole. Depuis les premières études de l’interface acoustico-phonétique par les Haskins Laboratories dans les années 50, différentes approches ont été proposées ; cependant, toutes sont fondamentalement limitées par l’artificialité des stimuli utilisés, les contraintes du protocole expérimental et le poids des connaissances a priori nécessaires. Le présent travail de thèse s’est intéressé { la mise en oeuvre d’une nouvelle méthode tirant parti de la situation de compréhension de parole dégradée pour mettre en évidence les indices acoustiques utilisés par l’auditeur.Dans un premier temps, nous nous sommes appuyés sur la littérature dans le domaine visuel en adaptant la méthode des Images de Classification à une tâche auditive de catégorisation de phonèmes dans le bruit. En reliant la réponse de l’auditeur { chaque essai à la configuration précise du bruit lors de cet essai, au moyen d’un Modèle Linéaire Généralisé, il est possible d’estimer le poids des différentes régions temps-fréquence dans la décision. Nous avons illustré l’efficacité de notre méthode, appelée Image de Classification Auditive, à travers deux exemples : une catégorisation /aba/-/ada/, et une catégorisation /da/-/ga/ en contexte /al/ ou /aʁ/. Notre analyse a confirmé l’implication des attaques des formants F2 et F3, déjà suggérée par de précédentes études, mais a également permis de révéler des indices inattendus. Dans un second temps, nous avons employé cette technique pour comparer les résultats de participants musiciens experts (N=19) ou dyslexiques (N=18) avec ceux de participants contrôles. Ceci nous a permis d’étudier les spécificités des stratégies d’écoute de ces différents groupes.L’ensemble des résultats suggèrent que les Images de Classification Auditives pourraient constituer une nouvelle approche, plus précise et plus naturelle, pour explorer et décrire les mécanismes { l’oeuvre au niveau de l’interface acoustico-phonétique. / There is today a broad consensus in the scientific community regarding the involvement of acoustic cues in speech perception. Up to now, however, the precise mechanisms underlying the transformation from continuous acoustic stream into discrete linguistic units remain largely undetermined. This is partly due to the lack of an effective method for identifying and characterizing the auditory primitives of speech. Since the earliest studies on the acoustic–phonetic interface by the Haskins Laboratories in the 50’s, a number of approaches have been proposed; they are nevertheless inherently limited by the non-naturalness of the stimuli used, the constraints of the experimental apparatus, and the a priori knowledge needed. The present thesis aimed at introducing a new method capitalizing on the speech-in-noise situation for revealing the acoustic cues used by the listeners.As a first step, we adapted the Classification Image technique, developed in the visual domain, to a phoneme categorization task in noise. The technique relies on a Generalized Linear Model to link each participant’s response to the specific configuration of noise, on a trial-by-trail basis, thereby estimating the perceptual weighting of the different time-frequency regions for the decision. We illustrated the effectiveness of our Auditory Classification Image method through 2 examples: a /aba/-/ada/ categorization and a /da/-/ga/ categorization in context /al/ or /aʁ/. Our analysis confirmed that the F2 and F3 onsets were crucial for the tasks, as suggested in previous studies, but also revealed unexpected cues. In a second step, we relied on this new method to compare the results of musical experts (N=19) or dyslexics participants (N=18) to those of controls. This enabled us to explore the specificities of each group’s listening strategies.All the results taken together show that the Auditory Classification Image method may be a more precise and more straightforward approach to investigate the mechanisms at work at the acoustic-phonetic interface.
39

Hétérogénéité de la croissance de Betula Glandulosa en milieu subartique à l'échelle du paysage

Trudel, Marilie January 2020 (has links) (PDF)
No description available.
40

Modèles statistiques pour l'étude de la progression de la maladie rénale chronique / Statistical models to study progression of chronic kidney disease

Boucquemont, Julie 15 December 2014 (has links)
Cette thèse avait pour but d'illustrer l'intérêt de méthodes statistiques avancées lorsqu'on s'in­ téresse aux associations entre différents facteurs et la progression de la maladie rénale chronique (MRC). Dans un premier temps, une revue de la littérature a été effectuée alin d'identifier les méthodes classiquement utilisées pour étudier les facteurs de progression de la MRC ; leurs limites et des méthodes permettant de mieux prendre en compte ces limites ont été discutées. Notre second travail s'est concentré sur les analyses de données de survie et la prise en compte de la censure par intervalle, qui survient lorsque l'évènement d'intérêt est la progression vers un stade spécifique de la MRC, et le risque compétitif avec le décès. Une comparaison entre des modèles de survie standards et le modêle illness-death pour données censurées par intervalle nous a permis d'illustrer l'impact de la modélisation choisie sur les estimations à la fois des effets des facteurs de risque et des probabilités d'évènements, à partir des données de la cohorte NephroTest. Les autres travaux ont porté sur les analyses de données longitudinales de la fonction rénale. Nous avons illustré l'intérêt du modèle linéaire mixte dans ce contexte et présenté son extension pour la prise en compte de sous-populations de trajectoires de la fonction rénale différentes. Nous avons ainsi identifier cinq classes, dont une avec un déclin très rapide et une autre avec une amélioration de la fonction rénale au cours du temps. Des perspectives de travaux liés à la prédiction permettent enfin de lier les deux types d'analyses présentées dans la thèse. / The objective of this thesis was to illustrate the benefit of using advanced statistical methods to study associations between risk factors and chrouic kidney disease (CKD) progression. In a first time, we conducted a literature review of statistical methods used to investigate risk factors of CKD progression, identified important methodological issues, and discussed solutions. In our sec­ ond work, we focused on survival analyses and issues with interval-censoring, which occurs when the event of interest is the progression to a specifie CKD stage, and competing risk with death. A comparison between standard survival models and the illness-death mode! for interval-censored data allowed us to illustrate the impact of modeling on the estimates of both the effects of risk factors and the probabilities of events, using data from the NephroTest cohort. Other works fo­ cused on analysis of longitudinal data on renal function. We illustrated the interest of linear mixed mode! in this context and presented its extension to account for sub-populations with different trajectories of renal function. We identified five classes, including one with a strong decline and one with an improvement of renal function over time. Severa! perspectives on predictions bind the two types of analyses presented in this thesis.

Page generated in 0.4504 seconds