Spelling suggestions: "subject:"covariables"" "subject:"novariables""
1 |
Inférence de modèles conditionnellement hétéroscédastiques avec variables exogènes / Inference of heteroskedastic conditional models with exogenous variablesThieu, Le Quyen 24 November 2016 (has links)
Cette thèse de doctorat a pour objectif principal d'étudier certaines propriétés probabilistes et statistiques de modèles de volatilité contenant des variables explicatives exogènes. Elle comporte deux parties.Dans une première partie, nous étudions le comportement asymptotique de l'estimation du quasi-maximum de vraisemblance (QMV) pour la classe polyvalente des modèles PGARCH semi-forts augmentés avec des covariables. Les hypothèses principales sur les variables exogènes sont la stationnarité et la non-colinéarité avec les autres variables explicatives de la volatilité. Pour la distribution asymptotique du QMV, nous étudions quatre situations différentes correspondant à des modèles forts ou semi-forts, et des paramètres à l'intérieur ou au bord de l'espace des paramètres. Nous montrons la normalité asymptotique du QMV sans imposer aucune condition de moment sur le processus observé lorsque le paramètre GARCH-X appartient à l'intérieur de l'espace des paramètres. Par contre, quand un ou plusieurs coefficients sont égaux à zéro, les conditions de moment d'ordre 4 sont requises pour que la matrice d'information soit finie et la loi asymptotique est alors la projection d'une loi normale sur un cône convexe . Comme la vraie valeur du paramètre n'est pas contrainte à appartenir à l'intérieur de l'espace des paramètres, nous proposons des tests pour déterminer l'ordre du modèle et vérifier la signification des variables exogènes. La deuxième partie est consacrée à l'étude de l'influence des variables exogènes sur les matrices de covariance conditionnelle de rendements d'actifs. Plus précisément, nous considérons des modèles BEKK avec variables exogènes. Les paramètres sont estimés par deux méthodes qui s'appellent l'estimation par ciblage de la variance et l'estimation équation par équation. Ces deux méthodes nous permettent de réduire la complexité numérique liée à l'estimation d'un nombre élevé des paramètre des modèles GARCH multivariés, en particulier, en présence de variables exogènes. La consistance ainsi que la loi limite de ces estimateurs sont établies pour des hypothèses relativement peu restrictives. En particulier, les innovations sont supposées être une différence de martingales au lieu d'être iid. Nos résultats sont illustrés par des expériences de Monte Carlo et des applications sur séries réelles. / This PhD Dissertation is dedicated to the study of probabilistic and statistical properties of volatility models augmented with exogenous variables. It consists of two parts which are summarized below. In the first part of this work, we study asymptotic behavior of the QMLE for the versatile class of the semi-strong PGARCH models augmented with exogenous variables. The main assumptions on the exogenous variables are the stationarity and the non-colinearity with the other explanatory variables of the volatility. For the asymptotic distribution of the QMLE, we investigated four different situations corresponding to strong or semi-strong models, and to parameters inside or at the boundary of the parameter space. When the GARCH-X parameter belongs to the interior of the parameter space, the asymptotic distribution of the QMLE is normal, whereas it is the projection of a normal distribution on a convex cone when one or several coefficients are equal to zero. For models with positive GARCH coefficients, the asymptotic distribution is obtained under very mild conditions, in particular, without any moment condition on the observed process. When the GARCH parameter stands at the boundary, fourth-order moment conditions are required for the information matrix to be finite. Our asymptotic results are obtained under conditions that are only marginally stronger than these optimal moment conditions, which extends and improves the results that existed for GARCH models without covariables. The second part is devoted to studying the influence of exogenous variables on the conditional covariance matrix of asset returns. Specifically, we consider BEKK models augmented with exogenous variables. The parameters are estimated by two methods which are called the variance targeting estimation and equation by equation estimation. Both methods allow us to reduce the curse of dimensionality which appears when modeling a conditional covariance matrix, particularly in the presence of exogenous variables. The consistency and the asymptotic distribution of these estimators are established under mild assumptions. In particular, the innovation is assumed to be a martingale difference instead of iid. Our results are illustrated by Monte Carlo experiences and the applications on real series.
|
2 |
Inférence statistique pour un modèle de dégradation en présence de variables explicativesSalami, Ali 07 January 2011 (has links) (PDF)
Dans cette thèse, on modélise le fonctionnement d'un système soumis à une dégradation continue. Ce système est considéré en panne dès que le niveau de dégradation dépasse un certain seuil critique fixé a priori. Dans ce travail, on s'intéresse tout d'abord aux temps d'atteinte de seuils critiques (déterministe ou aléatoire) pour un processus gamma non homogène. Une nouvelle approche est proposée ensuite pour décrire la dégradation d'un système. Cette approche consiste à considérer que la dégradation résulte de la somme d'un processus gamma et d'un mouvement brownien indépendant. Comme la dégradation du système est également influencée par l'environnement, il est intéressant d'envisager un modèle intégrant des covariables. En se basant sur le premier modèle, on suppose que les variables explicatives agissent seulement sur le processus gamma du modèle et qu'elles sont intégrées de manière à affecter l'échelle du temps. Ces modèles (avec ou sans covariables) sont décrits par des paramètres que l'on cherche à estimer. On étudie aussi leurs comportements asymptotiques (convergence et normalité asymptotique). Finalement des tests numériques aussi qu'une application à des données réelles de grande taille sont présentés pour illustrer nos méthodes.
|
3 |
Modélisation conjointe de données longitudinales et de durées de vieDupuy, Jean-François 19 November 2002 (has links) (PDF)
Le modèle de régression semiparamétrique de Cox est l'un des plus utilisés pour l'analyse statistique des durées de vie issues du domaine médical ou de la fiabilité. Ses paramètres sont un paramètre de régression et une fonction de risque de base positive et inconnue. L'inférence statistique pour ce modèle, basée sur la vraisemblance partielle de Cox, est souvent compliquée par la présence de données manquantes des covariables. Dans cette thèse, nous proposons une méthode d'estimation des paramètres du modèle de Cox adaptée à cette situation, et nous étudions les propriétés asymptotiques des estimateurs obtenus. La méthode proposée consiste à modéliser conjointement les durées censurées et le processus de covariable afin d'en déduire, par intégration sur les valeurs manquantes de cette covariable, une vraisemblance conjointe permettant d'estimer les paramètres du modèle de Cox au vu des données incomplètes. Dans un premier temps, nous proposons et formalisons un modèle conjoint pour les durées de vie et la covariable longitudinale. Ce modèle est construit à partir du modèle de Cox et d'un modèle de covariable choisi comme étant une fonction en escalier. Nous établissons ensuite l'identifiabilité de ce modèle sous des conditions de régularité peu contraignantes. Puis, nous adaptons au modèle conjoint la méthode du maximum de vraisemblance semiparamétrique. Nous montrons l'existence d'estimateurs semiparamétriques de ses paramètres, et en particulier de ses paramètres d'intérêt, qui sont les paramètres du modèle de Cox. L'expression compliquée de la vraisemblance conjointe ne permet pas d'obtenir analytiquement ces estimateurs. Nous mettons alors en oeuvre l'estimation à l'aide d'un algorithme EM. Nous montrons ensuite la consistance et la normalité asymptotique de nos estimateurs. Puis, nous proposons un estimateur consistant de leur variance asymptotique. Dans une dernière partie, nous appliquons la méthode proposée sur un jeu de données réelles, et nous comparons nos résultats avec deux autres méthodes d'estimation du modèle de Cox avec covariable manquante proposées dans la littérature.
|
4 |
Méthodes bayésiennes en génétique des populations : relations entre structure génétique des populations et environnement / Bayesian methods for population genetics : relationships between genetic population structure and environment.Jay, Flora 14 November 2011 (has links)
Nous présentons une nouvelle méthode pour étudier les relations entre la structure génétique des populations et l'environnement. Cette méthode repose sur des modèles hiérarchiques bayésiens qui utilisent conjointement des données génétiques multi-locus et des données spatiales, environnementales et/ou culturelles. Elle permet d'estimer la structure génétique des populations, d'évaluer ses liens avec des covariables non génétiques, et de projeter la structure génétique des populations en fonction de ces covariables. Dans un premier temps, nous avons appliqué notre approche à des données de génétique humaine pour évaluer le rôle de la géographie et des langages dans la structure génétique des populations amérindiennes. Dans un deuxième temps, nous avons étudié la structure génétique des populations pour 20 espèces de plantes alpines et nous avons projeté les modifications intra spécifiques qui pourront être causées par le réchauffement climatique. / We introduce a new method to study the relationships between population genetic structure and environment. This method is based on Bayesian hierarchical models which use both multi-loci genetic data, and spatial, environmental, and/or cultural data. Our method provides the inference of population genetic structure, the evaluation of the relationships between the structure and non-genetic covariates, and the prediction of population genetic structure based on these covariates. We present two applications of our Bayesian method. First, we used human genetic data to evaluate the role of geography and languages in shaping Native American population structure. Second, we studied the population genetic structure of 20 Alpine plant species and we forecasted intra-specific changes in response to global warming. STAR
|
5 |
Bandes de confiance par vraisemblance empirique : δ-méthode fonctionnelle et applications aux processus des événements récurrentsFlesch, Alexis 12 July 2012 (has links) (PDF)
Disposant d'un jeu de données sur des infections nosocomiales, nous utilisons des techniques de vraisemblance empirique pour construire des bandes de confiance pour certaines quantité d'intérêt. Cette étude nous amène à renforcer les outils déjà existants afin qu'ils s'adaptent à notre cadre. Nous présentons dans une première partie les outils mathématiques issus de la littérature que nous utilisons dans ce travail de thèse. Nous les appliquons ensuite à diverses situations et donnons de nouvelles démonstrations lorsque cela est nécessaire. Nous conduisons aussi des simulations et obtenons des résultats concrets concernant notre jeu de données. Enfin, nous détaillons les algorithmes utilisés.
|
6 |
Méthodes bayésiennes pour la génétique des populations : relations entre structure génétique des populations et environnementJay, Flora 14 November 2011 (has links) (PDF)
Nous présentons une nouvelle méthode pour étudier les relations entre la structure génétique des populations et l'environnement. Cette méthode repose sur des modèles hiérarchiques bayésiens qui utilisent conjointement des données génétiques multi-locus et des données spatiales, environnementales et/ou culturelles. Elle permet d'estimer la structure génétique des populations, d'évaluer ses liens avec des covariables non génétiques, et de projeter la structure génétique des populations en fonction de ces covariables. Dans un premier temps, nous avons appliqué notre approche à des données de génétique humaine pour évaluer le rôle de la géographie et des langages dans la structure génétique des populations amérindiennes. Dans un deuxième temps, nous avons étudié la structure génétique des populations pour 20 espèces de plantes alpines et nous avons projeté les modifications intra spécifiques qui pourront être causées par le réchauffement climatique.
|
7 |
Contributions à la théorie des valeurs extrêmes : Détection de tendance pour les extrêmes hétéroscédastiques / Contributions to extreme value theory : Trend detection for heteroscedastic extremesMefleh, Aline 26 June 2018 (has links)
Nous présentons dans cette thèse en premier lieu la méthode de Bootstrap par permutation appliquée à la méthode des blocs maxima utilisée en théorie des valeurs extrêmes (TVE) univariée. La méthode est basée sur un échantillonnage particulier des données en utilisant les rangs des blocs maxima dont la distribution est présentée et introduite dans les simulations. Elle amène à une réduction de la variance des paramètres de la loi GEV et des quantiles estimés. En second lieu, on s’intéresse au cas où les observations sont indépendantes mais non identiquement distribuées en TVE. Cette variation dans la distribution est quantifiée en utilisant une fonction dite « skedasis function » notée c qui représente la fréquence des extrêmes. Ce modèle a été introduit par Einmahl et al. dans le papier « Statistics of heteroscedastic extremes ». On étudie plusieurs modèles paramétriques pour c (log-linéaire, linéaire, log-linéaire discret) ainsi que les résultats de consistance et de normalité asymptotique du paramètre θ représentant la tendance. Le test θ =0 contre θ ≠0 est interprété alors comme un test de détection de tendance dans les extrêmes. Nous illustrons nos résultats dans une étude par simulation qui montre en particulier que les tests paramétriques sont en général plus puissants que les tests non paramétriques pour la détection de la tendance, d’où l’utilité de notre travail. Nous discutons en plus le choix du seuil k en appliquant la méthode de Lepski. Enfin, nous appliquons la méthodologie sur les données de températures minimales et maximales dans la région de Fort Collins, Colorado durant le 20ème siècle afin de détecter la présence d’une tendance dans les extrêmes sur cette période. En troisième lieu, on dispose d’un jeu de données de précipitation journalière maximale sur 24 ans dans 40 stations. On réalise une prédiction spatio-temporelle des quantiles correspondants à un niveau de retour de 20 ans pour les précipitations mensuelles dans chaque station. Nous utilisons des modèles de GEV en introduisant des covariables dans les paramètres. Le meilleur modèle est choisi en termes d’AIC et par la méthode de validation croisée. Pour chacun des deux modèles choisis, nous estimons les quantiles extrêmes. Finalement, on applique la TVE unvariée et bivariée sur les vitesses du vent et la hauteur des vagues dans une région au Liban en vue de protéger la plateforme pétrolière qui y sera installée de ces risques environnementaux. On applique d’abord la théorie univariée sur la vitesse du vent et la hauteur des vagues séparément en utilisant la méthode des blocs maximas pour estimer les paramètres de la GEV et les niveaux de retour associés à des périodes de retour de 50, 100 et 500 années. Nous passons ensuite à l’application de la théorie bivariée afin d’estimer la dépendance entre les vents et les vagues extrêmes et d’estimer des probabilités jointes de dépassement des niveaux de retour univariés. Nous associons ces probabilités jointes de dépassement à des périodes de retour jointes et nous les comparons aux périodes de retour marginales. / We firstly present in this thesis the permutation Bootstrap method applied for the block maxima (BM) method in extreme value theory. The method is based on BM ranks whose distribution is presented and simulated. It performs well and leads to a variance reduction in the estimation of the GEV parameters and the extreme quantiles. Secondly, we build upon the heteroscedastic extremes framework by Einmahl et al. (2016) where the observations are assumed independent but not identically distributed and the variation in their tail distributions is modeled by the so-called skedasis function. While the original paper focuses on non-parametric estimation of the skedasis function, we consider here parametric models and prove the consistency and asymptotic normality of the parameter estimators. A parametric test for trend detection in the case where the skedasis function is monotone is introduced. A short simulation study shows that the parametric test can be more powerful than the non-parametric Kolmogorov-Smirnov type test, even for misspecified models. We also discuss the choice of threshold based on Lepski's method. The methodology is finally illustrated on a dataset of minimal/maximal daily temperatures in Fort Collins, Colorado, during the 20th century. Thirdly, we have a training sample data of daily maxima precipitation over 24 years in 40 stations. We make spatio-temporal prediction of quantile of level corresponding to extreme monthly precipitation over the next 20 years in every station. We use generalized extreme value models by incorporating covariates. After selecting the best model based on the Akaike information criterion and the k-fold cross validation method, we present the results of the estimated quantiles for the selected models. Finally, we study the wind speed and wave height risks in Beddawi region in the northern Lebanon during the winter season in order to protect the oil rig that will be installed. We estimate the return levels associated to return periods of 50, 100 and 500 years for each risk separately using the univariate extreme value theory. Then, by using the multivariate extreme value theory we estimate the dependence between extreme wind speed and wave height as well as joint exceedance probabilities and joint return levels to take into consideration the risk of these two environmental factors simultaneously.
|
8 |
Analyse de survie en présence d’hétérogénéité entre sujets dans les essais thérapeutiques / Survival Analysis With Heterogeneity Between Subjects In Clinical TrialsCécilia-Joseph, Elsa 07 December 2015 (has links)
Au cours des études de survie, certains facteurs ayant un rôle pronostique peuvent être inobservés ou indisponibles. Dans le cadre des essais cliniques randomisés où deux groupes de traitement sont comparés par un modèle de Cox, « l’oubli » de tels facteurs dans le modèle entraîne une sous-estimation en valeur absolue de l’effet du traitement. L’objectif de la thèse est de préciser le rôle de différents déterminants de ce biais et de suggérer l’utilisation de méthodes pouvant le réduire, avec un intérêt particulier pour les essais de prévention à l'infection VIH où de tels facteurs peuvent exister. L’effet des principaux facteurs pouvant influencer le biais est précisé dans une première partie de la thèse. Si certains facteurs sont connus de longue date, d’autres, comme la durée de l’essai n’ont, à notre connaissance, pas été étudiés. L’approche utilisée repose sur l’utilisation d’un « vrai » modèle de type à risques proportionnels. Dans ce modèle, l’effet des covariables « oubliées » est résumé par l’introduction dans l’expression du risque instantané d’un terme aléatoire de « fragilité » propre à chaque sujet. Le biais cherché est calculé comme la limite asymptotique, sous le modèle marginal correspondant au « vrai » modèle, du rapport des risques instantanés déduit du modèle de Cox n’incluant pas la fragilité. Les résultats montrent une nette augmentation du biais, en valeur absolue, avec la durée de l’essai. Cette augmentation est particulièrement marquée pour des distributions de fragilité continues comme celles pouvant être rencontrées en pratique, par rapport à des fragilités binaires. Par ailleurs, les résultats antérieurs de la littérature sont confirmés et précisés. Dans un second temps, les conséquences d’une variation de la fragilité au cours du temps sur le biais sont recherchées. Plus précisément, la situation envisagée est celle qui est rencontrée dans les essais de prévention contre le VIH effectués auprès de populations « instables » vis-à-vis du risque, comme les jeunes ou les prostituées en Afrique sub-saharienne. Ces populations montrent une hétérogénéité comportementale liée aux changements de partenaires sexuels dont le statut VIH est par ailleurs inconnu. Il s’agit d’évaluer le biais en présence d’une telle fragilité « intermittente » au moyen de simulations reflétant les situations réelles. Les résultats montrent que le biais dû à l’omission de la fragilité dans l’analyse, bien qu’inférieur au biais obtenu dans le cas d’une fragilité constante au cours du temps, reste significatif et doit être considéré. Les différentes fragilités générées au cours du suivi sont soit indépendantes entre elles, soit corrélées. Enfin, dans le cas d’une fragilité supposée constante au cours du temps, l’intérêt de l’utilisation d’un essai en « cross-over » est recherché. Dans un tel essai, les sujets exempts d’évènement après un temps de suivi donné changent de groupe de traitement. Dans le cadre des essais de prévention VIH, Auvert & al [2011] ont montré en particulier une diminution du biais avec un schéma en cross-over comparativement à un schéma parallèle classique, en utilisant une fragilité catégorielle dans une étude de simulation. Buyze & Goetghebeur [2011] ont également montré les avantages du cross-over, en particulier concernant l’efficacité relative d’un test de comparaison des deux groupes, en utilisant une fragilité de distribution gamma ou log-normale. Ces résultats sont précisés en calculant formellement le biais asymptotique dans l’estimation du risque relatif pour les différentes distributions possibles de la fragilité omise, continue ou catégorielle. Les résultats obtenus sont nettement en faveur du cross-over, avec une diminution du biais entre 60% et 90% et une amélioration de l’efficacité du test. Le temps de changement de groupe optimal est également recherché. Il apparaît que celui-ci dépend essentiellement de la durée le l'essai et de la valeur de l'effet traitement. / In survival analysis, some prognostic factors can be unobserved or unavailable. In randomized clinical trials framework where two treatment groups are compared in the Cox model setting, the omission of such factors in the model leads to an under-estimation in absolute value of the treatment effect. The aim of the project is to better understand the determinants of this bias and to suggest the use of methods that could reduce it, with a particular interest in HIV prevention trials where such factors are likely to exist. In a first step, the role of the main determinants of the bias is highlighted. While some of them have long been identified, others like trial duration have never been considered to our knowledge. The bias was calculated as the asymptotic limit of the maximum likelihood estimator of the treatment effect when the analysis is done following a proportional hazard model which no takes into account the frailty. The results show a clear increase of the bias in absolute value with the trial duration. This increase is especially marked with continuous frailty distributions, such as those which can be encountered in practice, compared to binary frailties. Also, some previous results have been confirmed. In a second step, a frailty depending on time is considered, as it can be encountered in HIV clinical trials including “unstable” population about infection risk, as prostitutes or young people in sub-Saharan Africa. These populations present a behavioral heterogeneity linked to the change of partner whose the HIV status is unknown. The bias is estimated using a transient frailty with a simulation study reflecting real-life situations. The results show that when the frailty is regenerated during the follow-up, the bias caused by its omission, although lower than the bias obtained with a time-independent frailty, stays significant and has to be considered. The different frailties generated during the follow-up are independent or correlated. Finally, with a “stable” population whose the frailty can be supposed constant over time, the interest of the use of the “cross-over” is searched. In such trial, the subjects which have not presented the event after a given time of follow-up, change of treatment group. In HIV prevention trials framework, Auvert & al. (2011) have particularly shown a decrease of the bias with a cross-over design comparatively to a parallel design, using a categorized frailty in a simulation study. Buyze & Goetghebeur (2011) have also shown the advantages of the cross-over, particularly about the relative efficiency of the comparison test of the two treatment groups, using gamma or log-normal frailty distributions. These results are specified calculating explicitly the asymptotic bias of the hazard ratio estimate for different possible distributions of the omitted frailty, continuous or categorized. The obtained results are clearly in favor of the cross-over, with a decrease of the bias between 60% et 90% and a significant improvement of the efficiency of the comparison test. The optimal switch time and its prognostic factors are searched. It appears that it essentially depends on the trial duration and is little affected by the frailty distribution or the value of the treatment effect.
|
9 |
Identidade na pluralidade: avaliação, produção e percepção linguística na cidade de São Paulo / Identity and diversity: linguistic evaluation, production, and perception in the city of Sao PauloOushiro, Lívia 20 February 2015 (has links)
Esta pesquisa apresenta análises sobre avaliação, produção e percepção linguística no português paulistano, por meio do exame de quatro variáveis sociolinguísticas: a realização de /e/ nasal como monotongo [e] ou ditongo [ej] (como em fazenda); a pronúncia de /r/ em coda silábica como tepe [R] ou retroflexo [õ] (como em porta); a concordância nominal de número (como em as casas/as casa); e a concordância verbal de primeira e de terceira pessoa do plural (como em nós fomos/nós foi, eles foram/eles foi). O objetivo central é analisar, em uma comunidade amplamente heterogênea de um ponto de vista sociodemográfico, as inter-relações entre a expressão de identidades sociais através de usos linguísticos e a possível influência dos significados sociais desses usos em processos de variação e mudança linguística. Para tanto, analisou-se qualitativa e quantitativamente uma amostra contemporânea do português paulistano, composta de 118 entrevistas sociolinguísticas com falantes nativos, à luz dos pressupostos teórico-metodológicos da Sociolinguística Variacionista (Labov, 2006 [1966], 2008 [1972]). Tais análises compreendem o encaixamento linguístico e social de cada variável, bem como seu encaixamento simultâneo na fala de cada indivíduo. Além disso, examinaram-se percepções sobre as variantes de (-r), com base na técnica de estímulos pareados (Lambert et al., 1960), a fim de melhor compreender os mecanismos subjacentes à associação de certos significados sociais ao emprego de diferentes formas linguísticas. Os resultados mostram que, embora as correlações entre as quatro variáveis sociolinguísticas e variáveis sociais sejam bastante semelhantes entre si (todas se correlacionam com o Sexo/Gênero, a Classe Social e o Nível de Escolaridade dos falantes), há diferentes tendências dentro da comunidade por exemplo, mudança em direção à variante ditongada [ej]; padrões divergentes quanto ao emprego de (-r) por parte de jovens de diferentes classes sociais; variação estável das concordâncias nominal e verbal em regiões periféricas e mudança em direção à variante padrão em regiões centrais. Para compreendê-los, o exame de seus significados sociais é fundamental. Argumenta-se que [ej] tem se difundido rápida e unidirecionalmente pelo fato de se constituir um marcador (Labov, 2008 [1972]) para paulistanos, que não revelam ter consciência da variável, tampouco apresentam um discurso metalinguístico sobre suas variantes. O forte favorecimento do retroflexo entre jovens de classes baixas foi desencadeado por uma reinterpretação de seu significado social como uma variante local e de prestígio, devido à presença maciça de migrantes do Norte/Nordeste, cuja variante fricativa é relativamente mais estigmatizada na comunidade. Ao mesmo tempo, ainda que o encaixamento social das concordâncias nominal e verbal seja bastante semelhante, a marca zero de concordância nominal (as casa) goza de maior vitalidade por indexicalizar significados como masculinidade, paulistanidade e morador da Mooca. Não obstante as diferentes tendências que se verificam na comunidade, os padrões de encaixamento das variáveis linguísticas se reproduzem sistematicamente na fala de cada indivíduo, o que permite caracterizar os paulistanos como uma única comunidade de fala (Labov, 2006 [1966]), que compartilha normas de produção e de avaliação linguística. De acordo com o teste de percepções, os moradores da cidade também são consistentes em suas reações subjetivas a variantes de (-r). Demonstra-se adicionalmente que a coesão dialetal é promovida não por amplas categorias sociais como Sexo/Gênero ou Faixas Etárias, mas pelo princípio mais fundamental de densidade de comunicação (Gumperz, 1971b,a). / This study examines linguistic evaluation, production, and perception in São Paulo Portuguese, through analyses of four sociolinguistic variables: the realization of nasal /e/ as a monophthong [e] or as a diphthong [ej] (as in fazenda farm); the realization of coda /r/ as a tap [R] or as a retroflex [õ] (as in porta door); nominal number agreement (as in as casas/as casa the houses); and first person plural and third person plural verb agreement (as in nós fomos/nós foi we went, eles foram/eles foi they went). The main goal is to investigate the inter-relation between the expression of social identities through language uses and the possible impact of social meanings on processes of language variation and change, in a highly diverse and heterogeneous community. Based on the theory and methods of Variationist Sociolinguistics (Labov, 2006 [1966], 2008 [1972]), each variables linguistic and social embedding, as well as their simultaneous embedding in individual speakers speech, were analyzed both qualitatively and quantitatively in 118 sociolinguistic interviews with native Paulistano speakers. In addition, perceptions on the variants of (-r) were examined through an experiment using the Matched Guise Technique (Lambert et al., 1960), aimed at describing the mechanisms underlying the association of certain social meanings with different language forms. The results show that, in spite of the similarity between the social embedding of the four variables (all of them are correlated with speakers sex/gender, social class, and level of education), there are different trends within the community for instance, change towards (e) diphthongization; divergent patterns regarding (-r) in the speech of younger speakers of different social classes; stable variation in nominal and verbal agreement in peripheral areas but change towards the prestige variant in central areas. The explanation for these patterns is related to the variants social meanings. It is argued that [ej] has spread rapidly and unidirectionally because it is a marker (Labov, 2008 [1972]) for Paulistanos, who are not aware of the variable and do not present an elaborate metalinguistic discourse on its variants. The fact that retroflex /r/ is strongly favored by working class youth may be attributed to a reinterpretation of its social meaning, due to the extensive presence of migrants from the Northern and Northeastern regions of the country, whose /r/ realization as a fricative is relatively more stigmatized in the community. At the same time, although nominal and verbal agreement are very similarly stratified, the nonstandard variant of the former (as casa the houses) exhibits greater vitality as it indexes masculinities and local identities with the city and with Mooca, one of its most traditional neighborhoods. Despite different trends by different social groups in the community, the embedding of the linguistic variables is systematically reproduced in each speakers speech, which allows for the characterization of São Paulo as a single speech community (Labov, 2006 [1966]) in that its native speakers share norms of use and evaluation of the variants. According to the perception test, the city inhabitants are also consistent in their subjective reactions to the variants of (-r). It is shown that such social cohesion is promoted not by census social categories such as sex/gender or age, but by the more fundamental principle of density of communication (Gumperz, 1971b,a).
|
10 |
Apport des méthodes de survie nette dans le pronostic des lymphomes malins non hodgkiniens en population générale / Contribution of net survival methods to the prognosis of Non-Hodgkin lymphoma in population studiesMounier, Morgane 17 September 2015 (has links)
L'étude de la survie nette des patients atteints de cancer en population générale permet d'apprécier l'efficience globale du système de soin d'un pays. La survie nette se définit comme la survie qui serait observée si la seule cause de décès possible était le cancer. Ce concept est fondamental dans les comparaisons entre zones géographiques et/ou périodes de diagnostic dont l'intérêt est d'estimer les variations spécifiques de la mortalité due au cancer. Le concept de survie nette permet de prendre en compte les éventuelles différences de mortalité naturelle entre les groupes comparés. Actuellement, seuls deux outils estiment la survie nette sans biais : l'estimateur non paramétrique de Pohar-Perme et la modélisation paramétrique ajustée sur certaines covariables (essentiellement l'âge). Par ailleurs, les outils paramétriques s'étant perfectionnés, de nouveaux modèles flexibles permettent de modéliser les effets complexes des variables sur la mortalité. Ce travail repose sur la modélisation du taux de mortalité en excès à la suite d'un lymphome malin non hodgkinien, en se basant sur le modèle proposé par Remontet et al. et sur la nécessité de modéliser conjointement les effets complexes des covariables (telles que le temps de suivi, l'année de diagnostic et l'âge) sur la mortalité à l'aide d'une stratégie de modélisation adaptée. L'effet des variables est restitué sur la survie nette mais aussi sur le taux de mortalité en excès ce qui représente un élément nouveau dans les études de survie. Deux applications ont été menées sur des bases de données collaboratives de population : d'une part sur les données françaises du réseau FRANCIM à la suite d'un diagnostic de lymphome folliculaire entre 1995 et 2010 et, d'autre part, sur les données européennes d'EUROCARE-5 après un lymphome folliculaire ou un lymphome B diffus à grandes cellules diagnostiqué entre 1996 et 2004. Les résultats montrent que la dynamique du taux de mortalité en excès au cours du temps de suivi varie en fonction du sous-type de lymphome, de l'âge et de la zone géographique. Les tendances de cette dynamique en fonction de l'année de diagnostic sont également différentes / The net survival of cancer patients in population studies is the most relevant indicator to assess the overall efficiency of the healthcare system of a country. Net survival is defined as the survival that would be observed if the sole cause of death were cancer. This concept is crucial in comparative studies (between geographical areas and/or periods of diagnosis) that estimate specific variations of cancer-related deaths. Net survival takes into account potential differences in mortality patterns between groups. Currently, two methods provide unbiased estimations of net survival: the non-parametric estimator of Pohar-Perme and the parametric model adjusted on specific covariates (mainly, the age at diagnosis). Moreover, new improved parametric tools, such as flexible models, can model the complex covariate effects on mortality. In this work, we modeled the excess mortality rate after a non Hodgkin lymphoma diagnosis, with a model developed by Remontet et al. In addition, we used an appropriate model-building-strategy to model jointly the complex effects of some covariates (such as the time elapsed since diagnosis, the year of diagnosis, and age) on the excess mortality. Finally, this approach allowed for the covariate effects on the net survival and on the excess mortality rate. We applied this method to two different collaborative databases: first on the French database FRANCIM (1995 to 2010) to study the excess mortality after diagnosis of follicular lymphoma, then on the European data of EUROCARE-5 (1996 to 2004) to study the excess mortality after diagnosis of follicular lymphoma and diffuse large B-cell lymphoma. According to the results, the dynamics of the excess mortality rate varies over the time elapsed since diagnosis according to the lymphoma subtype, the age, and the geographical area. The trends of these dynamics over the years of diagnosis are different too
|
Page generated in 0.067 seconds