211 |
"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"Venezuela, Maria Kelly 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
|
212 |
Modelos não-lineares para dados longitudinais provenientes de experimentos em blocos casualizados abordagem bayesiana / Nonlinear models for longitudinal data from experiments in randomized block design a bayesian frameworkRocha, Everton Batista da 21 January 2011 (has links)
Dados consistindo de medidas repetidas tomadas em um mesmo indivíduo são muito comuns na agricultura e biologia. A modelagem de dados desta natureza usualmente envolve a caracterização da relação entre medidas repetidas e covariáveis. Em muitas aplicações, a relação proposta entre as medidas repetidas tem um comportamento não-linear nos parâmetros desconhecidos de interesse. Por exemplo, em estudo de crescimento de arvores, geralmente o comportamento da variável resposta e melhor descrito por um modelo não-linear nos parâmetros porque estes modelos caracterizam melhor a realidade dos fenômenos biológicos em estudo e porque e possvel uma interpretação biológica dos parâmetros. A presença de medidas repetidas em um indivíduo requer um cuidado particular na caracterização da variac~ao entre medidas dentro de uma mesma unidade experimental e entre unidades. Dados observados na mesma unidade experimental são correlacionados, e é provável que essa correlação decaia ao longo do tempo e que haja variações entre as medidas. Neste trabalho considera-se duas estruturas de covariâncias: erros aleatórios e independentes com media zero e variância 2, esta formulação não incorpora uma possível dependência entre as observações tomadas no mesmo indivíduo, que e comum em estudos longitudinais. Portanto, e importante ter modelos que acomodem a dependência (entre e dentre dos indivíduos) e a heterocedasticidade na sua formulação. Então, considerou-se outra estrutura de covariância, chamada não-estruturada, com a nulidade de permitir que os dados \"contribuam\" na estrutura da matriz de covariâncias. Neste trabalho analisou-se um delineamento em blocos casualizados assumindo um modelo bayesiano hierárquico de três estágios. No primeiro estagio, modelou-se a variação dentro do indivíduo, no segundo estagio a variação entre indivíduos. Este estágio da hierarquia da uma relação explícita entre os parâmetros aleatórios do modelo. No terceiro estagio foi incorporada a incerteza relativa as quantidades desconhecidas no modelo. Para a analise estatística, utilizou-se um conjunto de dados de um experimento conduzido pela Klabin Fabricadora de Papel e Celulose S.A., do Paraná, Brasil, envolvendo duas espécies de eucaliptos e espaçamentos 10 que foram completamente aleatorizados em blocos; em que a variável resposta, definida como o volume solido com casca, foi observada em 16 indivíduos, e quatro indivíduos foram aleatorizados para cada um dos quatro tratamentos. O modelo de Gompertz foi utilizado para representar o crescimento esperado das arvores de eucaliptos. Usando o modelo de Gompertz e possível ter uma interpretação biológica dos parâmetros. Considerando diferentes estruturas de covariância entre as observações, um programa para a analise de dados foi implementado no WinBUGS. / Data consisting of repeated measurements taken on each of a number of individual arise commonly in agricultural and biological applications. Modeling data of this kind usually involves the characterization of the relationship between the measured response and covariate. In many application,the proposed systematic relationship between the measured response is nonlinear in unknown parameters of interest. For example, in growing studies of trees, generally the behavior of the response variable over time is best described by a nonlinear model in the parameters of interest because this model characterizes better the reality of biological phenomenon in study and because is possible to do a biological interpretation of the parameters. The presence of repeated observations on an individual requires particular care in characterizing the random variation among measurements within a given individual and random variation among individuals. Likely the observations made on the same unit are correlated, probability decreasing over time and possible the variances are growth among the serial measurements. In this work we considerer two covariance structure namely: independent random error vectors whose elements are also independent with mean zero and variance 2, but this formulation does not incorporate possible dependence among the observation taken on the same subject neither that in longitudinal studies it is quite common to have the variances varying along the ordered dimension. Therefore, it is important to have models that allow for both dependences (within and between subjects) and also for heteroscedasticity in their formulations. Then we considerer other covariance structure namely: the structure is a non structure which permit that the data set \\tells\"about the covariance structure. In this work we analyzed a randomized block design assuming a three-stage Bayesian hierarchical model. On the rst stage, we model the intra-individual variation, on the second stage, we model the inter-individual variation. This stage of hierarchy gives an explicit relationship between the random parameters. On the third stage, we dene the hyperprior distribution to incorporate the uncertainty about the unknown parameters. For the statistical analysis we used a data set 12 from a experiment conducted at Klabin Fabricadora de Papel e Celulose S.A. from Parana, Brazil, involving two Eucalyptus species and two spacings in a complete randomized design; where the response variable, dened as the solid volume with bark, was evaluated for each of 16 subjects (groups of Eucalyptus trees), and four subjects were randomly assigned to one of four treatments. To represent the expected growing function of the Eucalyptus\'s tree Gompertz nonlinear model was used. Using the Gompertz nonlinear model is possible to a biological interpretation of the parameters. Considering dierent structures covariance within subjects, a program for the analysis of the data set was implemented in WinBUGS.
|
213 |
Estimating the longitudinal concordance correlation through fixed effects and variance components of polynomial mixed-effects regression model / Estimando a correlação de concordância longitudinal por meio de efeitos fixos e componentes de variâncias do modelo de regressão polinomial de efeitos mistosOliveira, Thiago de Paula 20 April 2018 (has links)
In the post-harvest area, a common approach to quantify the average color of fruits peel over time is the sampling of small number of points generally on its equatorial region using a colorimeter. However, when we use a colorimeter to classify an uneven-colored fruit misclassification may occur because points in the peel region may not be representative of average color of fruit. The main problem when we use this method is to determine the number of points to be sampled as well as the location of these points on the fruit\'s surface. An alternative method to evaluate measure of color is digital image analysis because it covers whole of the object surface, by using a sample of pixels taken from the image. As the colorimeter approach is faster and easier than image analysis, it may not be suitable for assessing the overall mean color of the papaya\'s peel and its performance will depend on the number of measured points and choice of sampled region. In this sense, the comparison between these approach is still necessary because we need to know if a sample on the equatorial region can reproduce a sample over the whole region, and if the colorimeter can compete with a scanner or digital camera in measuring the mean hue of papaya peel over time. Thus, we proposed a longitudinal concordance correlation (LCC) based on polynomial mixed-effects regression model to evaluate the extent of agreement among methods. The results show that ideally image analysis of whole fruit\'s region should be used to compute the mean hue and that the topography and curved surface of papaya fruit did not affect the mean hue obtained by the scanner. Since there are still no packages available to estimate the LCC in the free software environment R, we are developing a package called lcc, which provides functions for estimating the longitudinal concordance correlation (LCC) among methods based on variance components and fixed effects of polynomial mixed-effects model. Additionally, we implemented arguments in this function to estimating the longitudinal Pearson correlation (LPC), as precision measure, and longitudinal bias corrector factor (LA), as accuracy measure. Moreover, these components can be estimated using different structures for variance- covariance matrices of random effects and variance functions to model heteroscedasticity among within-group errors using or not the time as variance covariate. / No setor de pós-colheita é muito comum a utilização de colorímetros para avaliar a cor média da casca de frutos ao longo do tempo. No entanto, muitas vezes as técnicas de amostragem utilizando esse equipamento podem levar a medidas tendenciosas da média amostral. Alternativamente, a utilização de imagens digitais pode levar a um menor viés, uma vez que toda a região da casca do fruto é amostrada de forma sistemática. No entanto, ainda é necessária a comparação de ambas abordagens, pois o colorímetro tem vantagens em relação a facilidade de utilização e menor tempo para realizar a amostragem em cada fruto quando comparado a um scanner de mesa. Assim, no caso de variáveis respostas medidas em uma escala contínua, a reprodutibilidade das medidas tomadas por ambos equipamentos pode ser avaliada por meio do coeficiente de correlação de concordância. Dessa forma, para avaliar o perfil da concordância entre métodos, nós propomos uma correlação de concordância longitudinal (LCC), baseada em um modelo de regressão polinomial com efeitos mistos. Os resultados sugeriram que as técnicas por meio de imagens digitais devem ser utilizadas para a quantificação da tonalidade média de frutos. Adicionalmente, a partir do perfil de concordância estimado notamos que existe um período em que ambos os equipamentos podem ser utilizados. A performance do coeficiente de concordância longitudinal foi avaliada por meio de um estudo de simulação, o qual sugeriu que nossa metodologia é robusta a dados desbalanceados (\"dropout\") e que a probabilidade de convergência é aceitavel para uma amostra de 20 frutos e ideal para amostras a partir de 100 frutos. Uma vez que ainda não existem pacotes disponibilizados no ambiente computacional R para a estimação da correlação de concordância longitudinal, nós estamos desenvolvendo um pacote intitulado lcc, o qual será submetido ao \"Comprehensive R Archive Network\" (CRAN). Nesse pacote nós implementamos procedimentos para estimação da correlação de concordância longitudinal, da correlação de Person longitudinal e de uma medida de acurácia longitudinal. Além disso, nosso pacote foi desenvolvido para dados balanceados e desbalanceados, permitindo modelar a heteroscedasticidade entre erros dentro do grupo usando ou não o tempo como covariável, e, também, permitindo a inclusão de covariáveis no preditor linear para controlar variações sistemáticas na variável resposta.
|
214 |
"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"Maria Kelly Venezuela 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
|
215 |
Modelos não-lineares para dados longitudinais provenientes de experimentos em blocos casualizados abordagem bayesiana / Nonlinear models for longitudinal data from experiments in randomized block design a bayesian frameworkEverton Batista da Rocha 21 January 2011 (has links)
Dados consistindo de medidas repetidas tomadas em um mesmo indivíduo são muito comuns na agricultura e biologia. A modelagem de dados desta natureza usualmente envolve a caracterização da relação entre medidas repetidas e covariáveis. Em muitas aplicações, a relação proposta entre as medidas repetidas tem um comportamento não-linear nos parâmetros desconhecidos de interesse. Por exemplo, em estudo de crescimento de arvores, geralmente o comportamento da variável resposta e melhor descrito por um modelo não-linear nos parâmetros porque estes modelos caracterizam melhor a realidade dos fenômenos biológicos em estudo e porque e possvel uma interpretação biológica dos parâmetros. A presença de medidas repetidas em um indivíduo requer um cuidado particular na caracterização da variac~ao entre medidas dentro de uma mesma unidade experimental e entre unidades. Dados observados na mesma unidade experimental são correlacionados, e é provável que essa correlação decaia ao longo do tempo e que haja variações entre as medidas. Neste trabalho considera-se duas estruturas de covariâncias: erros aleatórios e independentes com media zero e variância 2, esta formulação não incorpora uma possível dependência entre as observações tomadas no mesmo indivíduo, que e comum em estudos longitudinais. Portanto, e importante ter modelos que acomodem a dependência (entre e dentre dos indivíduos) e a heterocedasticidade na sua formulação. Então, considerou-se outra estrutura de covariância, chamada não-estruturada, com a nulidade de permitir que os dados \"contribuam\" na estrutura da matriz de covariâncias. Neste trabalho analisou-se um delineamento em blocos casualizados assumindo um modelo bayesiano hierárquico de três estágios. No primeiro estagio, modelou-se a variação dentro do indivíduo, no segundo estagio a variação entre indivíduos. Este estágio da hierarquia da uma relação explícita entre os parâmetros aleatórios do modelo. No terceiro estagio foi incorporada a incerteza relativa as quantidades desconhecidas no modelo. Para a analise estatística, utilizou-se um conjunto de dados de um experimento conduzido pela Klabin Fabricadora de Papel e Celulose S.A., do Paraná, Brasil, envolvendo duas espécies de eucaliptos e espaçamentos 10 que foram completamente aleatorizados em blocos; em que a variável resposta, definida como o volume solido com casca, foi observada em 16 indivíduos, e quatro indivíduos foram aleatorizados para cada um dos quatro tratamentos. O modelo de Gompertz foi utilizado para representar o crescimento esperado das arvores de eucaliptos. Usando o modelo de Gompertz e possível ter uma interpretação biológica dos parâmetros. Considerando diferentes estruturas de covariância entre as observações, um programa para a analise de dados foi implementado no WinBUGS. / Data consisting of repeated measurements taken on each of a number of individual arise commonly in agricultural and biological applications. Modeling data of this kind usually involves the characterization of the relationship between the measured response and covariate. In many application,the proposed systematic relationship between the measured response is nonlinear in unknown parameters of interest. For example, in growing studies of trees, generally the behavior of the response variable over time is best described by a nonlinear model in the parameters of interest because this model characterizes better the reality of biological phenomenon in study and because is possible to do a biological interpretation of the parameters. The presence of repeated observations on an individual requires particular care in characterizing the random variation among measurements within a given individual and random variation among individuals. Likely the observations made on the same unit are correlated, probability decreasing over time and possible the variances are growth among the serial measurements. In this work we considerer two covariance structure namely: independent random error vectors whose elements are also independent with mean zero and variance 2, but this formulation does not incorporate possible dependence among the observation taken on the same subject neither that in longitudinal studies it is quite common to have the variances varying along the ordered dimension. Therefore, it is important to have models that allow for both dependences (within and between subjects) and also for heteroscedasticity in their formulations. Then we considerer other covariance structure namely: the structure is a non structure which permit that the data set \\tells\"about the covariance structure. In this work we analyzed a randomized block design assuming a three-stage Bayesian hierarchical model. On the rst stage, we model the intra-individual variation, on the second stage, we model the inter-individual variation. This stage of hierarchy gives an explicit relationship between the random parameters. On the third stage, we dene the hyperprior distribution to incorporate the uncertainty about the unknown parameters. For the statistical analysis we used a data set 12 from a experiment conducted at Klabin Fabricadora de Papel e Celulose S.A. from Parana, Brazil, involving two Eucalyptus species and two spacings in a complete randomized design; where the response variable, dened as the solid volume with bark, was evaluated for each of 16 subjects (groups of Eucalyptus trees), and four subjects were randomly assigned to one of four treatments. To represent the expected growing function of the Eucalyptus\'s tree Gompertz nonlinear model was used. Using the Gompertz nonlinear model is possible to a biological interpretation of the parameters. Considering dierent structures covariance within subjects, a program for the analysis of the data set was implemented in WinBUGS.
|
216 |
Curvas de crescimento e produtividade de vacas Nelore e cruzadas, de diferentes tipos biológicos, em sistema de produção intensiva / Curves of growth and productivity of Nellore and cross from different biological types in intensive production systemSilva, Fabiane de Lima 11 February 2010 (has links)
Inicialmente, foram analisados dados peso-idade do nascimento até 100 meses de idade, de vacas de quatro grupos genéticos (G): Nelore (NEL), ½Canchim + ½Nelore (CN), ½Angus + ½Nelore (AN) e ½Simental + ½Nelore (SN), pertencentes a Embrapa Pecuária Sudeste, São Carlos. Os animais considerados neste estudo nasceram de 1998 a 2001 (Ano), na primavera e outono (EP), e foram criados em sistema de produção intensiva, recebendo três níveis de suplementação pós-desmama (M): 0, 1,5; 3,0 kg/animal/dia de concentrado. O objetivo neste estudo foi comparar diferentes modelos não-lineares para estimar o crescimento, e avaliar a influência de efeitos de ambiente e grupo genético sobre os parâmetros estimados. Os modelos não-lineares: Brody, Gompertz, Logístico, Von Bertalanffy e Richards foram ajustados por mínimos quadrados ordinários e ponderados, considerando a variância normal e ponderada pelo inverso dos pesos em diferentes períodos. Foi usado o procedimento NLIN do SAS. Os modelos Brody e Von Bertalanffy convergiram para todos os G, havendo, entretanto, leve superioridade do Brody ponderado. Na comparação do ajuste dos modelos considerando o uso do inverso da variância os modelos mostraram-se mais adequado. As estimativas dos parâmetros peso assintótico (A) e taxa de maturidade (k) do modelo de Brody ponderado foram analisadas por meio de modelo que, além do efeito médio global, incluiu os efeitos de G, M, EP e as interações entre estes efeitos. Houve diferenças significativas das curvas de crescimento médias para os G. Na análise individual dos parâmetros A e k estimados através do modelo Brody ponderado, verificou-se que A foi influenciado (P<0,05) por G e EP e k foi influenciado (P<0,05) por M, fornecidos aos animais durante quatro meses após desmama. Melhorias no manejo alimentar resultaram em menor variação na forma das curvas de crescimentos e em altas taxas de maturidade. Na segunda parte, verificou-se a qualidade do modelo Brody, ponderado pelo inverso das variâncias dos pesos, quanto ao ajuste peso-idade como também a influência das estimativas do peso à maturidade (A) e da taxa de maturidade (k) sobre características produtivas das vacas NEL, CN, AN e SN. Foram organizados 10 grupos contemporâneos (GC), com concatenação dos efeitos Ano-EP-M para cada G. Utilizando-se um modelo misto com efeitos de G e GC, foi incluído, alternadamente covariáveis linear e quadrática de A e k, na análise das características produtivas: peso à desmama dos bezerros (PD); número (ND8) e kg (KD8) de bezerros desmamados em até 8 anos de permanência da vaca no rebanho; relação PD/peso da vaca ao parto (PD_PVP); relação PD/peso da vaca à desmama do bezerro (PD_PVD); relação PD/unidade metabólica da vaca (PV0,75) à desmama do bezerro (PDW). Houve diferença significativa (P<0,05) da curva de crescimento entre os grupos genéticos (G) e também entre os grupos de contemporâneos (GC) dentro de G. Verificou-se que estas características foram, em geral, influenciadas (P<0,01) tanto pelos efeitos linear e quadrático de A quanto pelos efeitos linear e quadrático de k. / Initially, were analyzed weight-age data from birth to 100 months of age from cows of four genetic groups (G): Nellore (NEL), ½Nellore + ½Canchim (CN), ½Angus +½Nellore (AN) and ½Simmental + ½Nellore (SN), of a experiment carried out at Embrapa Southeast Cattle Research Center, State of São Paulo, Brazil. The animals considered in this study were born from 1998 to 2001 (Year) in spring and fall (EP), and were managed in intensive production system and submitted to three of levels of supplementation post-weaning (M): 0, 1.5 and 3.0 kg/animal/day of concentrate. The objective of this study was to compare different nonlinear models to fitted growth curves, of beef cattle females, and to evaluate of environmental and genetic group effects on the estimated parameters. The nonlinear models: Brody, Gompertz, Logistic, Von Bertalanffy and Richards were fitted by ordinary least squares and weighted by the inverse of the variances of the weights in different periods. It was used the NLIN procedure of SAS. The parameters asymptotic weight (A) and maturing rate (k) obtained from model of Brody were analyzed by a mixed linear model that, besides the overall mean effect, included the effects of G, M, EP, and the interactions among these effects. The Brody and Von Bertalanffy models converged for all genetic groups, although slight superiority of the weighted Brody. Comparing the goodness of fit of these models, the use of the inverse of variances showed more efficient than the adjust of the models considering normal variances. Individual analysis of A and k estimated the model weighted Brody, the A parameter was influenced (P <0.05) by genetic group and season of birth and k was influenced (P <0 05) for levels of supplementation to the animals. Improvements in feeding supplementation resulted in less variation in the shape of growth curves and rates of maturity. In the second part of the work, it was evaluated the goodness of the Brody model, weighted by the inverse variance weights, in the adjust of weight-age data, and also analyzed the influence of the maturity weight (A) and maturing rate (k) estimates for traits cows productivity. Were organized 10 contemporary groups (CG) with concatenation of effects Year- EP-M for each G. Considering a mixed model with effects of G and CG (10 contemporaneous groups organized by concatenation Year-EP-M effects), linear and quadratic covariate effects of A and k, were added, alternately, for the analysis of the following traits: weaning weight of calve (WW), number (NW8) and kg (KW8) of calves weaned over 8 years of the cow in the herd; WW/weight of the cow at calving (WW_WC); WW/cow weight at weaning of calf (WW_WWC); and WW/metabolic unit of the cow (PV0,75) at weaning of the calf (MW). There was significant difference (P<0.05) of the growth curve among the genetic groups and also among contemporary groups within G. It was found that the production traits were, in general, influenced (P<0.01) by both linear and quadratic effects of A and k.
|
217 |
On Cluster Robust ModelsSantiago Calderón, José Bayoán 01 January 2019 (has links)
Cluster robust models are a kind of statistical models that attempt to estimate parameters considering potential heterogeneity in treatment effects. Absent heterogeneity in treatment effects, the partial and average treatment effect are the same. When heterogeneity in treatment effects occurs, the average treatment effect is a function of the various partial treatment effects and the composition of the population of interest. The first chapter explores the performance of common estimators as a function of the presence of heterogeneity in treatment effects and other characteristics that may influence their performance for estimating average treatment effects. The second chapter examines various approaches to evaluating and improving cluster structures as a way to obtain cluster-robust models. Both chapters are intended to be useful to practitioners as a how-to guide to examine and think about their applications and relevant factors. Empirical examples are provided to illustrate theoretical results, showcase potential tools, and communicate a suggested thought process.
The third chapter relates to an open-source statistical software package for the Julia language. The content includes a description for the software functionality and technical elements. In addition, it features a critique and suggestions for statistical software development and the Julia ecosystem. These comments come from my experience throughout the development process of the package and related activities as an open-source and professional software developer. One goal of the paper is to make econometrics more accessible not only through accessibility to functionality, but understanding of the code, mathematics, and transparency in implementations.
|
218 |
Penalized mixed-effects ordinal response models for high-dimensional genomic data in twins and familiesGentry, Amanda E. 01 January 2018 (has links)
The Brisbane Longitudinal Twin Study (BLTS) was being conducted in Australia and was funded by the US National Institute on Drug Abuse (NIDA). Adolescent twins were sampled as a part of this study and surveyed about their substance use as part of the Pathways to Cannabis Use, Abuse and Dependence project. The methods developed in this dissertation were designed for the purpose of analyzing a subset of the Pathways data that includes demographics, cannabis use metrics, personality measures, and imputed genotypes (SNPs) for 493 complete twin pairs (986 subjects.) The primary goal was to determine what combination of SNPs and additional covariates may predict cannabis use, measured on an ordinal scale as: “never tried,” “used moderately,” or “used frequently”. To conduct this analysis, we extended the ordinal Generalized Monotone Incremental Forward Stagewise (GMIFS) method for mixed models. This extension includes allowance for a unpenalized set of covariates to be coerced into the model as well as flexibility for user-specified correlation patterns between twins in a family. The proposed methods are applicable to high-dimensional (genomic or otherwise) data with ordinal response and specific, known covariance structure within clusters.
|
219 |
Latent Growth Model Approach to Characterize Maternal Prenatal DNA Methylation TrajectoriesLapato, Dana 01 January 2019 (has links)
Background. DNA methylation (DNAm) is a removable chemical modification to the DNA sequence intimately associated with genomic stability, cellular identity, and gene expression. DNAm patterning reflects joint contributions from genetic, environmental, and behavioral factors. As such, differences in DNAm patterns may explain interindividual variability in risk liability for complex traits like major depression (MD). Hundreds of significant DNAm loci have been identified using cross-sectional association studies. This dissertation builds on that foundational work to explore novel statistical approaches for longitudinal DNAm analyses. Methods. Repeated measures of genome-wide DNAm and social and environmental determinants of health were collected up to six times across pregnancy and the first year postpartum as part of the Pregnancy, Race, Environment, Genes (PREG) Study. Statistical analyses were completed using a combination of the R statistical environment, Bioconductor packages, MplusAutomate, and Mplus software. Prenatal maternal DNAm was measured using the Infinium HumanMethylation450 Beadchip. Latent growth curve models were used to analyze repeated measures of maternal DNAm and to quantify site-level DNAm latent trajectories over the course of pregnancy. The purpose was to characterize the location and nature of prenatal DNAm changes and to test the influence of clinical and demographic factors on prenatal DNAm remodeling. Results. Over 1300 sites had DNAm trajectories significantly associated with either maternal age or lifetime MD. Many of the genomic regions overlapping significant results replicated previous age and MD-related genetic and DNAm findings. Discussion. Future work should capitalize on the progress made here integrating structural equation modeling (SEM) with longitudinal omics-level measures.
|
220 |
我國上市公司營利事業所得稅負擔之研究 / BUSINESS INCOME TAX BURDEN OF PUBLIC COMPANIES IN TAIWAN楊朝旭, Yang, Chaur Shiuh Unknown Date (has links)
美國的租稅正義公民會社(Citizens for Tax Jusitce)在一九八五年發表一篇震撼美國政府、企業界與學術界的研究報告,文章中指出美國最大約兩百五十家大企業中,有半數以上,在一九八一年到一九八五年當中 ,至少有一年未納一毛錢的聯邦所得稅,或者甚至收到聯邦的退稅款。這篇報告引起美國財經學者與會計學者對公司租稅負擔的熱烈探討,亦對美國國會通過一九八六年租稅改革法案(the Tax Reform Act of 1986)取消投資扣抵、擴大稅基並加強最低稅負(alternative minimum tax)之稽徵有重要的影響。
本文之主要研究目的在於探討我國上市公司之營利事業所得稅負擔,是否受到企業規模、產業別以及稅制變化之影響。本研究使用我國教育部電子計算機中心提供之「台灣股票上市公司財務報表資料庫」,取出自民國七十三年到民國八十一年連續九年間,相同八十家上市公司所構成之縱查資料(longitudinal data或panel data),利用二元固定影響模型(two-way fixed effects model)等方法進行分析,發現上市公司之規模越大有效稅率越低(租稅負擔越低),顯示較大的上市公司可能運用較大的政治力量來減輕其租稅負擔,此結果代表用租稅來反映政治成本的政治成本假說(political cost hypothesis)不適用於我國的上市公司。在財務會計的研究上,經常以政治成本假說為基礎來解釋經理人員為何採用可降低當期盈餘的會計方法,亦即假設政治成本假說為正確,則企業規模愈大,愈容易受到政治上的監督(例如稅捐單位的嚴格審查),其政治成本愈大,為了避免這種政治成本,規模愈大約企業愈可能採用降低當期盈餘的會計方法。但是由本文的研究結果顯示,同租稅來表示政治成本的政治成本假說在我國並不成立,因此,未來有關之研究,在解釋我國公司規模對會計方法之選擇的影響時,不能直接從政治成本假說的觀點來解釋。
本文亦參考國外有關文獻,將我國與美國上市公司同期間(1986~1989)的租稅負擔加以比較,發現我國上市公司的有效稅率低於美國,但其主要原因為我國上市公司有虧損所引起。
本文另外亦使用產業的虛擬變數來分析不同產業是否有不同的租稅負擔,檢定結果顯示產業別對租稅負擔有顯著的影響。最後,本文比較民國七十五年營所稅自30%降為25%與實施加值稅前後,公司租稅負擔的變化情形,發現七十五年稅制變動後,規模愈大之上市公司須繳愈多的營利事業所得稅。 / A 1985 study by Citizens for Tax Justice examined the corpor-ate income tax burden of 250 largest U.S. corporations. They found that almost half of the largest corporations paid absolutely nothing in federal income taxes, or received tax rebates, in at least one of the four years from 1981 to 1984.This thesis intends to examine the income tax burden of public companies in Taiwan. In particular, the thesis investigates whether firm size, specific industry and tax system change will affect the income tax burden of public (listed) corporations. Financial statement data of the public corporations were obtained from the Econometric Programm- ing System (EPS) data base provided by the Ministry of Education. The main sample consists of eighty corporations that appear in all nine years over the 1984-1992 period.
To control for individual company and time heterogeneity and reduce omitted variable bias, fixed effects models are employed in this study. Using a two-way fixed effects model, the result shows that the larger the corporation's size the lower the effective tax rate (the lower the corporation's tax burden). It indicates that larger corporations may have more political power to reduce their tax burden. The finding suggests that political cost hypothesis is not justified in Taiwan's public corporations from the standpoint of effective tax rates.
This thesis also analyzes whether tax burden varies across industries. The analysis shows that a corporation's tax burden is related to the industry in which the corporation operates. Finally, this study examines the changes of corporation's tax burden pre and post 1986 when the highest statutory business income tax rate was reduced from 30 percent to 25 percent and the value-added tax was adopted in the same year. The analysis indicates that after the tax system change in 1986, large corporations paid more business income taxes.
|
Page generated in 0.0731 seconds