• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Spatial statistics in discrete-choice models, application to UADT cancers in northern France / Statistiques spatiales dans les modèles à choix discrets, application aux cancers de l'UADT dans le nord de la France

Darwich, Emad Aldeen 11 December 2017 (has links)
Ce mémoire de thèse concerne l’identification des facteurs de risque d’une maladie spécifique présentant une hétérogénéité spatiale au sein d’une région donnée. Plus particulièrement,nous nous sommes intéressés aux cancers des voies aéro-digestives supérieures(VADS) dans la région Nord-Pas-de-Calais (NPDC) en France. Pour cela, une étude cas témoins a d’abord été réalisée à partir de la création d’un échantillon d’individus sains qui n’étaient pas affectés par des tumeurs cancéreuses (les témoins) et d’un échantillon d’individus atteints du cancer (les cas - ou patients), recrutés dans les centres de soins dans le cadre des projets de recherche DEREDIA et NOFARIS. Concernant la méthodologie,des modèles binaires spatiaux répondant à l’objectif ont été développés à partir de travaux issus des domaines de recherche en statistique/économétrie des comportements(analyse des décisions) ainsi qu’en statistique spatiale. Un des apports méthodologiques de la thèse repose sur la combinaison de techniques provenant de ces deux champs de recherche. Dans une première partie, nous avons utilisé un modèle spatial binaire paramétrique contenant une variable spatiale latente de choix dans le cadre d’un échantillonnage des données. Ce problème est connu sous le nom de "Choice-Based Sampling" (CBS) dans les modèles discrets. Contrairement à l’échantillon aléatoire où tous les éléments de la population ont la même probabilité d’être choisi, l’échantillonnage CBS dans le modèle discret est un type d’échantillonnage dans lequel la classification de la population est faite sous forme de sous-ensembles (strates) basés sur des choix alternatifs. Dans ce contexte,l’utilisation de la procédure d’estimation par maximum de vraisemblance standard (MLE)dans le CBS pourrait mener à des estimations incohérentes (asymptotiquement biaisées).Nous avons adopté ainsi le principe du maximum de vraisemblance auprès de l’étude de scas-témoins spatiaux. Nous avons également fourni un estimateur des moments généralisés(GMM), basé sur les résidus généralisés. Dans une seconde partie, un modèle spatial binaire semi-paramétrique a été considéré. Nous présentons dans ces parties, une simulation de Monte Carlo pour étudier la performance des méthodes d’estimation au sein d’un échantillon final, que nous avons ensuite appliqué aux données du cancer VADS dans la région Nord-Pas-de-Calais. La troisième partie est consacrée à l’étude d’une fonction de risque spatiale en présence de données entachées d’erreurs. En effet, dans le cadre des données cas-témoins considérées, nous supposons que certaines données de type déclarative ne soient pas correctes. Une application de cette méthode à la cartographie du risque de développer un cancer VADS dans la région Nord-Pas-de-Calais a été étudiée. La dernière partie est consacrée à un modèle de durée spatial et son application aux données considérées. / This thesis concerns the identification of risk factors for a certain type of diseasepresenting a certain spatial heterogeneity in a given region.. More specifically, we are interested in cancers of the upper aerodigestive tract (UADT) cancers in the Nord-Pasde-Calais region (NPDC), France. For this, a case-control study was first carried out bycreating a sample of healthy individuals who are not affected by cancerous tumors (thecontrols) and a sample of individuals with cancer (Cases or patients), recruited in healthcenters as part of DEREDIA and NOFARIS research projects. From a methodologicalpoint of view, spatial binary models which meet the objective have been developed onthe basis of studies in statistical/behavioral econometrics (decision analysis) and spatialstatistics. One of the methodological contributions of the thesis on this plan is the combinationof techniques from these two fields of research.In the first part, we used a spatial binary parametric models containing spatial latentchoice variable in a context of sampling data. This problem is known as Choice-BasedSampling (CBS) in discrete choice model. Unlike the random sample where all items in the population have the same probability of being chosen, the Choice-Based Sampling indiscrete choice model is a type of sampling where the classification of the population intosubsets to be sampled is based on the choices or outcomes. In this context, the use ofstandard Maximum likelihood estimation (MLE) procedure in CBS could lead to an inconsistent(asymptotically biased) estimation. Thus, we adapt the principle of maximumlikelihood in our context of spatial case-control studies. We also provide a GMM estimatorbased on the generalized residuals.In the second part, a spatial semi-parametric binary model was considered. We present inthese parts a Monte Carlo experiment to investigate the finite sample performance of theseestimation methods, then we apply to the (UADT) cancer data in the Nord-Pas-de-Calaisregion.The third part is devoted to the study of a spatial risk function in the presence of datacontaminated by measurement errors. Indeed, in the context of the considered case-controlstudy, it is very likely that certain data transmitted by the patients is not correct. Anapplication of this method to the mapping of the risk of having UADT cancer in the Nord-Pas-de-Calais region was studied. The last part is devoted to a spatial duration modeland its application to the real data was considered.
2

Contribution à la statistique spatiale et l'analyse de données fonctionnelles / Contribution to spatial statistics and functional data analysis

Ahmed, Mohamed Salem 12 December 2017 (has links)
Ce mémoire de thèse porte sur la statistique inférentielle des données spatiales et/ou fonctionnelles. En effet, nous nous sommes intéressés à l’estimation de paramètres inconnus de certains modèles à partir d’échantillons obtenus par un processus d’échantillonnage aléatoire ou non (stratifié), composés de variables indépendantes ou spatialement dépendantes.La spécificité des méthodes proposées réside dans le fait qu’elles tiennent compte de la nature de l’échantillon étudié (échantillon stratifié ou composé de données spatiales dépendantes).Tout d’abord, nous étudions des données à valeurs dans un espace de dimension infinie ou dites ”données fonctionnelles”. Dans un premier temps, nous étudions les modèles de choix binaires fonctionnels dans un contexte d’échantillonnage par stratification endogène (échantillonnage Cas-Témoin ou échantillonnage basé sur le choix). La spécificité de cette étude réside sur le fait que la méthode proposée prend en considération le schéma d’échantillonnage. Nous décrivons une fonction de vraisemblance conditionnelle sous l’échantillonnage considérée et une stratégie de réduction de dimension afin d’introduire une estimation du modèle par vraisemblance conditionnelle. Nous étudions les propriétés asymptotiques des estimateurs proposées ainsi que leurs applications à des données simulées et réelles. Nous nous sommes ensuite intéressés à un modèle linéaire fonctionnel spatial auto-régressif. La particularité du modèle réside dans la nature fonctionnelle de la variable explicative et la structure de la dépendance spatiale des variables de l’échantillon considéré. La procédure d’estimation que nous proposons consiste à réduire la dimension infinie de la variable explicative fonctionnelle et à maximiser une quasi-vraisemblance associée au modèle. Nous établissons la consistance, la normalité asymptotique et les performances numériques des estimateurs proposés.Dans la deuxième partie du mémoire, nous abordons des problèmes de régression et prédiction de variables dépendantes à valeurs réelles. Nous commençons par généraliser la méthode de k-plus proches voisins (k-nearest neighbors; k-NN) afin de prédire un processus spatial en des sites non-observés, en présence de co-variables spatiaux. La spécificité du prédicteur proposé est qu’il tient compte d’une hétérogénéité au niveau de la co-variable utilisée. Nous établissons la convergence presque complète avec vitesse du prédicteur et donnons des résultats numériques à l’aide de données simulées et environnementales.Nous généralisons ensuite le modèle probit partiellement linéaire pour données indépendantes à des données spatiales. Nous utilisons un processus spatial linéaire pour modéliser les perturbations du processus considéré, permettant ainsi plus de flexibilité et d’englober plusieurs types de dépendances spatiales. Nous proposons une approche d’estimation semi paramétrique basée sur une vraisemblance pondérée et la méthode des moments généralisées et en étudions les propriétés asymptotiques et performances numériques. Une étude sur la détection des facteurs de risque de cancer VADS (voies aéro-digestives supérieures)dans la région Nord de France à l’aide de modèles spatiaux à choix binaire termine notre contribution. / This thesis is about statistical inference for spatial and/or functional data. Indeed, weare interested in estimation of unknown parameters of some models from random or nonrandom(stratified) samples composed of independent or spatially dependent variables.The specificity of the proposed methods lies in the fact that they take into considerationthe considered sample nature (stratified or spatial sample).We begin by studying data valued in a space of infinite dimension or so-called ”functionaldata”. First, we study a functional binary choice model explored in a case-controlor choice-based sample design context. The specificity of this study is that the proposedmethod takes into account the sampling scheme. We describe a conditional likelihoodfunction under the sampling distribution and a reduction of dimension strategy to definea feasible conditional maximum likelihood estimator of the model. Asymptotic propertiesof the proposed estimates as well as their application to simulated and real data are given.Secondly, we explore a functional linear autoregressive spatial model whose particularityis on the functional nature of the explanatory variable and the structure of the spatialdependence. The estimation procedure consists of reducing the infinite dimension of thefunctional variable and maximizing a quasi-likelihood function. We establish the consistencyand asymptotic normality of the estimator. The usefulness of the methodology isillustrated via simulations and an application to some real data.In the second part of the thesis, we address some estimation and prediction problemsof real random spatial variables. We start by generalizing the k-nearest neighbors method,namely k-NN, to predict a spatial process at non-observed locations using some covariates.The specificity of the proposed k-NN predictor lies in the fact that it is flexible and allowsa number of heterogeneity in the covariate. We establish the almost complete convergencewith rates of the spatial predictor whose performance is ensured by an application oversimulated and environmental data. In addition, we generalize the partially linear probitmodel of independent data to the spatial case. We use a linear process for disturbancesallowing various spatial dependencies and propose a semiparametric estimation approachbased on weighted likelihood and generalized method of moments methods. We establishthe consistency and asymptotic distribution of the proposed estimators and investigate thefinite sample performance of the estimators on simulated data. We end by an applicationof spatial binary choice models to identify UADT (Upper aerodigestive tract) cancer riskfactors in the north region of France which displays the highest rates of such cancerincidence and mortality of the country.

Page generated in 0.072 seconds