31 |
Estimation de la variance en présence de données imputées pour des plans de sondage à grande entropieVallée, Audrey-Anne 07 1900 (has links)
Les travaux portent sur l’estimation de la variance dans le cas d’une non- réponse partielle traitée par une procédure d’imputation. Traiter les valeurs imputées comme si elles avaient été observées peut mener à une sous-estimation substantielle de la variance des estimateurs ponctuels. Les estimateurs de variance usuels reposent sur la disponibilité des probabilités d’inclusion d’ordre deux, qui sont parfois difficiles (voire impossibles) à calculer. Nous proposons d’examiner les propriétés d’estimateurs de variance obtenus au moyen d’approximations des probabilités d’inclusion d’ordre deux. Ces approximations s’expriment comme une fonction des probabilités d’inclusion d’ordre un et sont généralement valides pour des plans à grande entropie. Les résultats d’une étude de simulation, évaluant les propriétés des estimateurs de variance proposés en termes de biais et d’erreur quadratique moyenne, seront présentés. / Variance estimation in the case of item nonresponse treated by imputation is the main topic of this work. Treating the imputed values as if they were observed may lead to substantial under-estimation of the variance of point estimators. Classical variance estimators rely on the availability of the second-order inclusion probabilities, which may be difficult (even impossible) to calculate. We propose to study the properties of variance estimators obtained by approximating the second-order inclusion probabilities. These approximations are expressed in terms of first-order inclusion probabilities and are usually valid for high entropy sampling designs. The results of a simulation study evaluating the properties of the proposed variance estimators in terms of bias and mean squared error will be presented.
|
32 |
Inquéritos por telefone: inferências válidas em regiões com baixa taxa de cobertura de linhas residenciais / Telephone survey: valid inferences in regions with low coverage rate of residential linesBernal, Regina Tomie Ivata 12 August 2011 (has links)
Introdução: O inquérito por telefone, quando comparado ao inquérito domiciliar possui vários atrativos, em especial baixo custo operacional e rapidez do processo de divulgação de resultados. No entanto, a exclusão de domicílios sem telefone fixo, pode representar série questão de validade nas estimativas obtidas. Objetivo: Avaliar vícios potenciais nos resultados divulgados no Sistema de Vigilância de Fatores de Risco para Doenças Crônicas por Inquérito Telefônico (VIGITEL) em município de baixa cobertura de domicílios com telefone fixo. Métodos: A partir de resultados levantados pelo Inquérito Domiciliar realizado no município de Rio Branco-AC, com cobertura de 41 por cento dos domicílios com telefone fixo, tentou-se localizar vícios introduzidos nos resultados do Vigitel. Foi usado método alternativo de ponderação para diminuir o vício da estimativa do Vigitel. Resultados: O Vigitel subestima a maioria das prevalências estimadas. Os pesos de pós-estratificação eliminam parcialmente o vício, cuja origem é proveniente de baixa taxa de cobertura de domicílios com telefone fixo. Por outro lado, o uso desses pesos, quando não necessário, potencializou o vício das variáveis não associadas à posse de telefone fixo. Conclusões: Em municípios de baixa taxa de cobertura de domicílios com telefone fixo, torna-se necessária a implementação de novo método de ponderação e estratégia de seleção de variáveis externas para construção dos pesos de pós estratificação, que minimizem o vício nas estimativas das variáveis levantadas / Introdução: O inquérito por telefone, quando comparado ao inquérito domiciliar possui vários atrativos, em especial baixo custo operacional e rapidez do processo de divulgação de resultados. No entanto, a exclusão de domicílios sem telefone fixo, pode representar série questão de validade nas estimativas obtidas. Objetivo: Avaliar vícios potenciais nos resultados divulgados no Sistema de Vigilância de Fatores de Risco para Doenças Crônicas por Inquérito Telefônico (VIGITEL) em município de baixa cobertura de domicílios com telefone fixo. Métodos: A partir de resultados levantados pelo Inquérito Domiciliar realizado no município de Rio Branco-AC, com cobertura de 41 por cento dos domicílios com telefone fixo, tentou-se localizar vícios introduzidos nos resultados do Vigitel. Foi usado método alternativo de ponderação para diminuir o vício da estimativa do Vigitel. Resultados: O Vigitel subestima a maioria das prevalências estimadas. Os pesos de pós-estratificação eliminam parcialmente o vício, cuja origem é proveniente de baixa taxa de cobertura de domicílios com telefone fixo. Por outro lado, o uso desses pesos, quando não necessário, potencializou o vício das variáveis não associadas à posse de telefone fixo. Conclusões: Em municípios de baixa taxa de cobertura de domicílios com telefone fixo, torna-se necessária a implementação de novo método de ponderação e estratégia de seleção de variáveis externas para construção dos pesos de pós estratificação, que minimizem o vício nas estimativas das variáveis levantadas
|
33 |
Developing a New Mixed-Mode Methodology For a Provincial Park Camper Survey in British ColumbiaDyck, Brian Wesley 08 July 2013 (has links)
Park and resource management agencies are looking for less costly ways to undertake park visitor surveys. The use of the Internet is often suggested as a way to reduce the costs of these surveys. By itself, however, the use of the Internet for park visitor surveys faces a number of methodological challenges that include the potential for coverage error, sampling difficulties and nonresponse error. A potential way of addressing these challenges is the use of a mixed-mode approach that combines the use of the Internet with another survey mode. The procedures for such a mixed-mode approach, however, have not been fully developed and evaluated.
This study develops and evaluates a new mixed-mode approach –a face-to-face/web response – for a provincial park camper survey in British Columbia. The five key steps of this approach are: (a) selecting a random sample of occupied campsites; (b) undertaking a short interview with potential respondents; (c) obtaining an email address at the end of the interview; (d) distributing a postcard to potential respondents that contains the website and an individual access code; and (e) undertaking email follow-ups with nonrespondents.
In evaluating this new approach, two experiments were conducted during the summer of 2010. The first experiment was conducted at Goldstream Provincial Park campground and was designed to compare a face-to-face/paper response to face-to-face/web response for several sources of survey errors and costs. The second experiment was conducted at 12 provincial park campgrounds throughout British Columbia and was designed to examine the potential for coverage error and the effect of a number of email follow-ups on return rates, nonresponse error and the substantive results.
Taken together, these experiments indicate: a low potential for coverage error (i.e., 4% non-use Internet rate); a high email collection rate for follow-ups (i.e., 99% at Goldstream; a combined rate of 88% for 12 campgrounds); similar return rates between a paper mode (60%) and a web (59%) mode; the use of two email follow-ups reduced nonresponse error for a key variable (i.e., geographic location of residence), but not for all variables; low item nonresponse for both mixed-modes (about 1%); very few differences in the substantive results between each follow-up; a 9% cost saving for the web mode. This study suggests that a face-to face/web approach can provide a viable approach for undertaking park visitor surveys if there is high Internet coverage among park visitors. / Graduate / 0366 / 0344 / 0814 / brdyckfam@yahoo.com
|
34 |
Inquéritos por telefone: inferências válidas em regiões com baixa taxa de cobertura de linhas residenciais / Telephone survey: valid inferences in regions with low coverage rate of residential linesRegina Tomie Ivata Bernal 12 August 2011 (has links)
Introdução: O inquérito por telefone, quando comparado ao inquérito domiciliar possui vários atrativos, em especial baixo custo operacional e rapidez do processo de divulgação de resultados. No entanto, a exclusão de domicílios sem telefone fixo, pode representar série questão de validade nas estimativas obtidas. Objetivo: Avaliar vícios potenciais nos resultados divulgados no Sistema de Vigilância de Fatores de Risco para Doenças Crônicas por Inquérito Telefônico (VIGITEL) em município de baixa cobertura de domicílios com telefone fixo. Métodos: A partir de resultados levantados pelo Inquérito Domiciliar realizado no município de Rio Branco-AC, com cobertura de 41 por cento dos domicílios com telefone fixo, tentou-se localizar vícios introduzidos nos resultados do Vigitel. Foi usado método alternativo de ponderação para diminuir o vício da estimativa do Vigitel. Resultados: O Vigitel subestima a maioria das prevalências estimadas. Os pesos de pós-estratificação eliminam parcialmente o vício, cuja origem é proveniente de baixa taxa de cobertura de domicílios com telefone fixo. Por outro lado, o uso desses pesos, quando não necessário, potencializou o vício das variáveis não associadas à posse de telefone fixo. Conclusões: Em municípios de baixa taxa de cobertura de domicílios com telefone fixo, torna-se necessária a implementação de novo método de ponderação e estratégia de seleção de variáveis externas para construção dos pesos de pós estratificação, que minimizem o vício nas estimativas das variáveis levantadas / Introdução: O inquérito por telefone, quando comparado ao inquérito domiciliar possui vários atrativos, em especial baixo custo operacional e rapidez do processo de divulgação de resultados. No entanto, a exclusão de domicílios sem telefone fixo, pode representar série questão de validade nas estimativas obtidas. Objetivo: Avaliar vícios potenciais nos resultados divulgados no Sistema de Vigilância de Fatores de Risco para Doenças Crônicas por Inquérito Telefônico (VIGITEL) em município de baixa cobertura de domicílios com telefone fixo. Métodos: A partir de resultados levantados pelo Inquérito Domiciliar realizado no município de Rio Branco-AC, com cobertura de 41 por cento dos domicílios com telefone fixo, tentou-se localizar vícios introduzidos nos resultados do Vigitel. Foi usado método alternativo de ponderação para diminuir o vício da estimativa do Vigitel. Resultados: O Vigitel subestima a maioria das prevalências estimadas. Os pesos de pós-estratificação eliminam parcialmente o vício, cuja origem é proveniente de baixa taxa de cobertura de domicílios com telefone fixo. Por outro lado, o uso desses pesos, quando não necessário, potencializou o vício das variáveis não associadas à posse de telefone fixo. Conclusões: Em municípios de baixa taxa de cobertura de domicílios com telefone fixo, torna-se necessária a implementação de novo método de ponderação e estratégia de seleção de variáveis externas para construção dos pesos de pós estratificação, que minimizem o vício nas estimativas das variáveis levantadas
|
35 |
Calibration Adjustment for Nonresponse in Sample SurveysRota, Bernardo João January 2016 (has links)
In this thesis, we discuss calibration estimation in the presence of nonresponse with a focus on the linear calibration estimator and the propensity calibration estimator, along with the use of different levels of auxiliary information, that is, sample and population levels. This is a fourpapers- based thesis, two of which discuss estimation in two steps. The two-step-type estimator here suggested is an improved compromise of both the linear calibration and the propensity calibration estimators mentioned above. Assuming that the functional form of the response model is known, it is estimated in the first step using calibration approach. In the second step the linear calibration estimator is constructed replacing the design weights by products of these with the inverse of the estimated response probabilities in the first step. The first step of estimation uses sample level of auxiliary information and we demonstrate that this results in more efficient estimated response probabilities than using population-level as earlier suggested. The variance expression for the two-step estimator is derived and an estimator of this is suggested. Two other papers address the use of auxiliary variables in estimation. One of which introduces the use of principal components theory in the calibration for nonresponse adjustment and suggests a selection of components using a theory of canonical correlation. Principal components are used as a mean to accounting the problem of estimation in presence of large sets of candidate auxiliary variables. In addition to the use of auxiliary variables, the last paper also discusses the use of explicit models representing the true response behavior. Usually simple models such as logistic, probit, linear or log-linear are used for this purpose. However, given a possible complexity on the structure of the true response probability, it may raise a question whether these simple models are effective. We use an example of telephone-based survey data collection process and demonstrate that the logistic model is generally not appropriate.
|
36 |
Inférence doublement robuste en présence de données imputées dans les enquêtesPicard, Frédéric 02 1900 (has links)
L'imputation est souvent utilisée dans les enquêtes pour traiter la non-réponse partielle. Il est bien connu que traiter les
valeurs imputées comme des valeurs observées entraîne une
sous-estimation importante de la variance des estimateurs
ponctuels. Pour remédier à ce problème, plusieurs méthodes
d'estimation de la variance ont été proposées dans la littérature,
dont des méthodes adaptées de rééchantillonnage telles que le
Bootstrap et le Jackknife. Nous définissons le concept de
double-robustesse pour l'estimation ponctuelle et de variance
sous l'approche par modèle de non-réponse et l'approche par modèle
d'imputation. Nous mettons l'emphase sur l'estimation de la
variance à l'aide du Jackknife qui est souvent utilisé dans la
pratique. Nous étudions les propriétés de différents estimateurs
de la variance à l'aide du Jackknife pour l'imputation par la
régression déterministe ainsi qu'aléatoire. Nous nous penchons
d'abord sur le cas de l'échantillon aléatoire simple. Les cas de
l'échantillonnage stratifié et à probabilités inégales seront
aussi étudiés. Une étude de simulation compare plusieurs méthodes
d'estimation de variance à l'aide du Jackknife en terme de biais
et de stabilité relative quand la fraction de sondage n'est pas
négligeable. Finalement, nous établissons la normalité
asymptotique des estimateurs imputés pour l'imputation par
régression déterministe et aléatoire. / Imputation is often used in surveys to treat item nonresponse. It
is well known that treating the imputed values as observed values
may lead to substantial underestimation of the variance of the
point estimators. To overcome the problem, a number of variance
estimation methods have been proposed in the literature, including
appropriate versions of resampling methods such as the jackknife
and the bootstrap. We define the concept of doubly robust point
and variance estimation under the so-called nonresponse and
imputation model approaches. We focus on jackknife variance
estimation, which is widely used in practice. We study the
properties of several jackknife variance estimators under both
deterministic and random regression imputation. We first consider
the case of simple random sampling without replacement. The case
of stratified simple random sampling and unequal probability
sampling is also considered. A limited simulation study compares
various jackknife variance estimators in terms of bias and
relative stability when the sampling fraction is not negligible.
Finally, the asymptotic normality of imputed estimator is
established under both deterministic and random regression
imputation.
|
37 |
Inférence doublement robuste en présence de données imputées dans les enquêtesPicard, Frédéric 02 1900 (has links)
L'imputation est souvent utilisée dans les enquêtes pour traiter la non-réponse partielle. Il est bien connu que traiter les
valeurs imputées comme des valeurs observées entraîne une
sous-estimation importante de la variance des estimateurs
ponctuels. Pour remédier à ce problème, plusieurs méthodes
d'estimation de la variance ont été proposées dans la littérature,
dont des méthodes adaptées de rééchantillonnage telles que le
Bootstrap et le Jackknife. Nous définissons le concept de
double-robustesse pour l'estimation ponctuelle et de variance
sous l'approche par modèle de non-réponse et l'approche par modèle
d'imputation. Nous mettons l'emphase sur l'estimation de la
variance à l'aide du Jackknife qui est souvent utilisé dans la
pratique. Nous étudions les propriétés de différents estimateurs
de la variance à l'aide du Jackknife pour l'imputation par la
régression déterministe ainsi qu'aléatoire. Nous nous penchons
d'abord sur le cas de l'échantillon aléatoire simple. Les cas de
l'échantillonnage stratifié et à probabilités inégales seront
aussi étudiés. Une étude de simulation compare plusieurs méthodes
d'estimation de variance à l'aide du Jackknife en terme de biais
et de stabilité relative quand la fraction de sondage n'est pas
négligeable. Finalement, nous établissons la normalité
asymptotique des estimateurs imputés pour l'imputation par
régression déterministe et aléatoire. / Imputation is often used in surveys to treat item nonresponse. It
is well known that treating the imputed values as observed values
may lead to substantial underestimation of the variance of the
point estimators. To overcome the problem, a number of variance
estimation methods have been proposed in the literature, including
appropriate versions of resampling methods such as the jackknife
and the bootstrap. We define the concept of doubly robust point
and variance estimation under the so-called nonresponse and
imputation model approaches. We focus on jackknife variance
estimation, which is widely used in practice. We study the
properties of several jackknife variance estimators under both
deterministic and random regression imputation. We first consider
the case of simple random sampling without replacement. The case
of stratified simple random sampling and unequal probability
sampling is also considered. A limited simulation study compares
various jackknife variance estimators in terms of bias and
relative stability when the sampling fraction is not negligible.
Finally, the asymptotic normality of imputed estimator is
established under both deterministic and random regression
imputation.
|
38 |
Imputation en présence de données contenant des zérosNambeu, Christian O. 12 1900 (has links)
L’imputation simple est très souvent utilisée dans les enquêtes pour compenser
pour la non-réponse partielle. Dans certaines situations, la variable nécessitant
l’imputation prend des valeurs nulles un très grand nombre de fois. Ceci est très
fréquent dans les enquêtes entreprises qui collectent les variables économiques.
Dans ce mémoire, nous étudions les propriétés de deux méthodes d’imputation
souvent utilisées en pratique et nous montrons qu’elles produisent des estimateurs
imputés biaisés en général. Motivé par un modèle de mélange, nous proposons
trois méthodes d’imputation et étudions leurs propriétés en termes de biais.
Pour ces méthodes d’imputation, nous considérons un estimateur jackknife de la
variance convergent vers la vraie variance, sous l’hypothèse que la fraction de
sondage est négligeable. Finalement, nous effectuons une étude par simulation
pour étudier la performance des estimateurs ponctuels et de variance en termes
de biais et d’erreur quadratique moyenne. / Single imputation is often used in surveys to compensate for item nonresponse.
In some cases, the variable requiring imputation contains a large amount
of zeroes. This is especially frequent in business surveys that collect economic
variables. In this thesis, we study the properties of two imputation procedures
frequently used in practice and show that they lead to biased estimators, in general.
Motivated by a mixture regression model, we then propose three imputation
procedures and study their properties in terms of bias. For the proposed imputation
procedures, we consider a jackknife variance estimator that is consistent
for the true variance, provided the overall sampling fraction is negligible. Finally,
we perform a simulation study to evaluate the performance of point and variance
estimators in terms of relative bias and mean square error.
|
39 |
Estimation multi-robuste efficace en présence de données influentesMichal, Victoire 08 1900 (has links)
No description available.
|
40 |
個案無反應資料之各種加權方法分析比較 / Weighting Adjustments for Unit Nonresponse劉淑芳, Liou, Shue-Fang Unknown Date (has links)
在本論文中,根據所建立的100,000筆模擬資料作為抽樣的母體,利用簡單隨機抽樣法(simple random sampling;SRS)從此模擬的資料中共抽出1068筆成功樣本,分別考慮了當個案訪問失敗(unit nonresponse)情形發生時是『隨機性』及『非隨機性』兩種情況下比較(1)事後分層加權(poststratification approach);(2)多個變數反覆加權(raking or raking ratio);及(3)估計成功率加權等三種加權方法之效果如何。
當訪問失敗具完全隨機性的情況之下所抽出之樣本,由於原始樣本的代表性過於『完美』,即使是經過事後分層加權或是raking加權後,均無顯著的效果。因此,對於樣本的改善程度實在是微不足道!而在訪問失敗是非隨機性的情況時,事後分層加權對於變數間具較強相關性時,則具有較佳的加權效果;raking加權方式的加權效果普遍上均不錯的表現,值得廣泛地採用;而估計成功率加權的效果則必須取決於估計準確與否,否則可能由於估計的偏差而導致加權效果不彰。
最後,本文亦提供了事後分層加權及raking加權的適用時機及建議,以作為日後從事抽樣調查工作者的參考意見。
|
Page generated in 0.0164 seconds