Spelling suggestions: "subject:"modelos lineares"" "subject:"odelos lineares""
231 |
Análise e comparação de alguns métodos alternativos de seleção de variáveis preditoras no modelo de regressão linear / Analysis and comparison of some alternative methods of selection of predictor variables in linear regression models.Marques, Matheus Augustus Pumputis 04 June 2018 (has links)
Neste trabalho estudam-se alguns novos métodos de seleção de variáveis no contexto da regressão linear que surgiram nos últimos 15 anos, especificamente o LARS - Least Angle Regression, o NAMS - Noise Addition Model Selection, a Razão de Falsa Seleção - RFS (FSR em inglês), o LASSO Bayesiano e o Spike-and-Slab LASSO. A metodologia foi a análise e comparação dos métodos estudados e aplicações. Após esse estudo, realizam-se aplicações em bases de dados reais e um estudo de simulação, em que todos os métodos se mostraram promissores, com os métodos Bayesianos apresentando os melhores resultados. / In this work, some new variable selection methods that have appeared in the last 15 years in the context of linear regression are studied, specifically the LARS - Least Angle Regression, the NAMS - Noise Addition Model Selection, the False Selection Rate - FSR, the Bayesian LASSO and the Spike-and-Slab LASSO. The methodology was the analysis and comparison of the studied methods. After this study, applications to real data bases are made, as well as a simulation study, in which all methods are shown to be promising, with the Bayesian methods showing the best results.
|
232 |
Modelos de regressão lineares mistos sob a classe de distribuições normal-potência / Linear mixed regression models under the power-normal class distributionsFalon, Roger Jesus Tovar 27 November 2017 (has links)
Neste trabalho são apresentadas algumas extensões dos modelos potência-alfa assumindo o contexto em que as observações estão censuradas ou limitadas. Inicialmente propomos um novo modelo assimétrico que estende os modelos t-assimétrico (Azzalini e Capitanio, 2003) e t-potência (Zhao e Kim, 2016) e inclui a distribuição t de Student como caso particular. Este novo modelo é capaz de ajustar dados com alto grau de assimetria e curtose, ainda maior do que os modelos t-assimétrico e t-potência. Em seguida estendemos o modelo t-potência às situações em que os dados apresentam censura, com alto grau de assimetria e caudas pesadas. Este modelo generaliza o modelo de regressão linear t de Student para dados censurados por Arellano-Valle et al. (2012). O trabalho também introduz o modelo linear misto normal-potência para dados assimétricos. Aqui a inferência estatística é realizada desde uma perspectiva clássica usando o método de máxima verossimilhança junto com o método de integração numérica de Gauss-Hermite para aproximar as integrais envolvidas na função de verossimilhança. Mais tarde, o modelo linear com interceptos aleatórios para dados duplamente censurados é estudado. Este modelo é desenvolvido sob a suposição de que os erros e os efeitos aleatórios seguem distribuições normal-potência e normal- assimétrica. Para todos os modelos estudados foram realizados estudos de simulação a fim de estudar as suas bondades de ajuste e limitações. Finalmente, ilustram-se todos os métodos propostos com dados reais. / In this work some extensions of the alpha-power models are presented, assuming the context in which the observations are censored or limited. Initially we propose a new asymmetric model that extends the skew-t (Azzalini e Capitanio, 2003) and power-t (Zhao e Kim, 2016) models and includes the Students t-distribution as a particular case. This new model is able to adjust data with a high degree of asymmetry and cursose, even higher than the skew-t and power-t models. Then we extend the power-t model to situations in which the data present censorship, with a high degree of asymmetry and heavy tails. This model generalizes the Students t linear censored regression model t by Arellano-Valle et al. (2012) The work also introduces the power-normal linear mixed model for asymmetric data. Here statistical inference is performed from a classical perspective using the maximum likelihood method together with the Gauss-Hermite numerical integration method to approximate the integrals involved in the likelihood function. Later, the linear model with random intercepts for doubly censored data is studied. This model is developed under the assumption that errors and random effects follow power-normal and skew-normal distributions. For all the models studied, simulation studies were carried out to study their benefits and limitations. Finally, all proposed methods with real data are illustrated.
|
233 |
Modelos de fronteira estocástica: uma abordagem bayesiana / Stochastic frontier models: a bayesian approachCespedes, Juliana Garcia 24 July 2008 (has links)
A firma é o principal agente econômico para a produção e distribuição de bens e serviços. Seu constante investimento em melhorias e o aperfeiçoamento de sua capacidade produtiva, visando tornar-se cada vez mais eficiente, transforma-se em um determinante central do bem estar econômico da sociedade. O processo de medir a ineficiência de firmas baseia-se em análises de fronteiras, onde a ineficiência é medida como a distância entre os pontos observados da variável resposta e a função de produção, custo ou lucro verdadeiras, dependendo do modelo assumido para descrever a variável resposta. Existe uma variedade de formas funcionais para essas funções e algumas vezes é difícil julgar qual delas deve ser escolhida, visto que a forma verdadeira é desconhecida e pode ser somente aproximada. Em geral, na literatura, dados de produção são analisados assumindo-se modelos multiplicativos que impõem a restrição de que a produção é estritamente positiva e utiliza-se a transformação logarítmica para linearizar o modelo. Considera-se que o logaritmo do produto dada a ineficiência técnica tem distribuição contínua, independentemente de os dados serem contínuos ou discretos. A tese divide-se em dois artigos: o primeiro utiliza a inferência bayesiana para estimar a eficiência econômica de firmas utilizando os modelos de fronteira estocástica de custo com forma funcional flexível Fourier, que asseguram um bom ajuste para a fronteira, sendo fundamental para o cálculo da ineficiência econômica; o segundo artigo propõem os modelos generalizados de fronteira estocástica, baseando-se nos modelos lineares generalizados mistos com a abordagem bayesiana, para quantificar a ineficiência técnica de firmas (medida de incerteza) utilizando a variável resposta na escala original e distribuições pertencentes à família exponencial para a variável resposta dada a medida de ineficiência. / The firm is the main economic agent for the production and distribution of goods and services. Its constant investment in improvements and enhancement of its productive capacity to make itself more efficient becomes a central determinant of economic welfare of society. The measure process of inefficiency is based on frontier analysis, where inefficiency is measured as the distance between the observed points from variable response and real production, cost or profit function, depending on chosen model to describe the variable response. There are several functional forms to these functions and sometimes it is very difficult to decide which one has to be chosen because the true form is unknown and it can just be approximate. Generally, in the literature, production data are analyzed assuming multiplicative models that impose the restriction of what the production is strictly positive and use the logarithm transformation to turn the model lineal. It is considerate that the product\'s logarithm given the technical inefficiency has distribution continual, independent if the data are continuous or discrete. The papers presented in this thesis are: the first paper uses the bayesian inference to estimate the economic efficiency of firms in the cost stochastic frontier models using the Fourier flexible cost function, that assure a good settlement to the frontier being essential to calculate the economic inefficiency. The second paper proposes a generalized stochastic frontier models, based on generalized linear mixed models with the Bayesian approach, to quantify the inefficiency technical of the firms (uncertainty measures) by using the response variable in the scale original with distributions belonging on the exponential family to the response variable given the measure of inefficiency.
|
234 |
Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica / Joint modeling of mean and dispersion and applications to agricultural researchVieira, Afrânio Márcio Corrêa 10 February 2009 (has links)
Diversos delineamentos experimentais que são aplicados correntemente tomam como base experimentos agronômicos. Esses dados experimentais são, geralmente, analisados usando-se modelos que consideram uma variância residual constante (ou homogênea), como pressuposto inicial. Entretanto, esta pressuposição mostra-se relativamente forte quando se está diante de situações para as quais fatores ambientais ou externos exercem considerável influência nas medidas experimentais. Neste trabalho, são estudados modelos para a média e a variância, simultaneamente, com a variância estruturada de duas formas: (i) por meio de um preditor linear, que permite incorporar variáveis externas e fatores de ruído e (ii) por meio de efeitos aleatórios, que permitem acomodar tanto o efeito longitudinal quanto o efeito de superdispersão, no caso de medidas binárias repetidas no tempo. A classe de modelos lineares generalizados duplos (MLGD) foi aplicada a um estudo observacional que consistiu em medir a mortalidade de frangos de corte no fim da condição de espera pré-abate. Nesse problema, é forte a evidência de que alguns fatores influenciam a variabilidade, e consequentemente, diminuem a precisão das análises inferenciais. Outro problema agronômico relevante, associado à horticultura, são os experimentos de cultura de tecidos vegetais, em que o número de explantes que regeneram são contados. Como esse tipo de experimento apresenta um grande número de parâmetros a serem estimados, comparado ao tamanho da amostra, os modelos existente podem gerar estimativas questionáveis ou até levar a conclusões erroneas, uma vez esse que são baseados em grandes amostras para se fazer inferência estatística. Foi proposto um modelo linear generalizados duplo, para os dados de proporções, de uma perspectiva Bayesiana, visando a análise estatística sob pequenas amostras e a incorporação do conhecimento especialista no processo de estimação dos parâmetros. Um problema clínico, que envolve dados binários medidos repetidamente no tempo é apresentado e são propostos dois modelos que acomodam o efeito da superdispersão e a dependência longitudinal das medidas, utilizandos-se efeitos aleatórios. Foram obtidos resultados satisfatórios nos três problemas estudados. Os MLGD permitiram identificar os fatores associados à mortalidade das aves de corte, o que permitirá minimizar perdas e habilitar os processos de manejo, transporte e abate aos critérios de bem-estar animal e exigências da comunidade européia. O MLGD Bayesiano permitiu identificar o genótipo associado ao efeito de superdispersão, aumentando a precisão da inferência de seleção de variedades. Dois modelos combinados foram propostos logit-normal-Bernoulli-beta e o probit-normal-Bernoulli-beta, que acomodaram satisfatoriamente a superdispersão e a dependência longitudinal das medidas binárias. Esses resultados reforçam a importância de se modelar a média e a variância conjuntamente, o que aumenta a precisão na pesquisa agronômica, tanto em estudos experimentais quanto em estudos observacionais. / Several experimental designs that are currently applied are based on agricultural experiments. These experimental data are, usually, analised with statistical models that assume constant residual variance (or homogeneous), as basic assumption. However, this assumption shows hard to stand for, when environmental or external factors exert strong influence over the measurements. In this work, we study the joint modelling for the mean and the variance, the latter being structured on two ways: (i) through a linear predictor, which allows the incorporation of external variables and/or noise factors and (ii) by the use of random effects, that accommodate jointly the possible overdispersion effect and the dependence of longitudinal data in the case of binary measusurements taken over time. The class of double generalized linear models (DGLM) was applied to an observational study where the poultry mortality was measured in the preslaughter operations. With this situation, it can be observed that there is a strong influence from some environmental factors over the variability observed, and consequently, this reduces the precision of the inferential analysis. Another relevant agricultural problem, related to horticulture, is the tissue culture experiments, where the number of regenerated explants is counted. Usually, this kind of experiment use a large number of parameters to be estimated, when compared with the sample size. The current frequentist models are based on large samples for statistical inference and, under this experimental condition, can generate unreliable estimates or even lead to erroneous conclusions. A double generalized linear model was proposed to analyse proportion data, under the Bayesian perspective, which can be applied to small samples and can incorporate expert knowledge into the parameter estimation process. One clinical research, that measured binary data repeatedly through the time is presented and two models are proposed to fit the overdispersion effect and the dependence of longitudinal measurements, using random effects. It was obtained satisfactory results under these three problems studied. the DGLM allowed to identify factors associated with the poultry mortality, that will allow to minimize loss and improve the process, since the catching until lairage on slaughterhouse, agreeing with animal welfare criteria and the European community rules. The Bayesian DGLM allowed to identify the genotype associated with the overdispersion effect, increasing the precision on the inference about varieties selection. Two combined models were proposed, a logit-normal- Bernoulli-beta and a probit-normal-Bernoulli-beta, which have both addressed the overdispersion effect and the longitudinal dependence of the binary measurements. These results reinforce the importance to modelling mean and dispersion jointly, as a way to increase the precision of agricultural experimentation, be it on experimental studies or observational studies.
|
235 |
"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"Venezuela, Maria Kelly 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
|
236 |
Métodos de estimação baseados na função de verossimilhança para modelos lineares elípticos / Estimation methods based on the likelihood function in Elliptical Linear ModelsPérez, Natalia Andrea Milla 14 September 2018 (has links)
O objetivo desta tese é estudar métodos de estimação baseados na função de verossimilhança em modelos mistos lineares elípticos. Derivamos inicialmente os métodos de máxima verossimilhança, máxima verossimilhança restrita e de máxima verossimilhança perfilada modificada para o modelo linear normal. Estendemos os métodos para os modelos lineares elípticos e encontramos diferenças entre as equações resultantes de cada método. A principal motivação deste trabalho é que o método de máxima verossimilhança restrita tem sido aplicado para obter estimadores menos viesados para os componentes de variância-covariância, em contraste com os estimadores de máxima verossimilhança. O método tem sido muito utilizado em modelos com estruturas de variância-covariância como é o caso dos modelos mistos lineares. Assim, procuramos estender o método para os modelos mistos lineares elípticos bem como comparar com outros procedimentos de estimação, máxima verossimilhança e máxima verossimilhança perfilada modificada. Estudamos em particular os modelos mistos lineares com erros t-Student e exponencial potência. / The aim of this thesis is to study estimation methods based on the likelihood functions in elliptical linear mixed models. First, we review the modified profile maximum likelihood and the restricted maximum likelihood methods as well as the traditional maximum likelihood method in normal linear models. Then, we extend the methodologies for elliptical linear models and we compare the estimating equations derived for each method. The main motivation of the work is that the restricted maximum likelihood method has been largely applied in normal linear mixed models in order to reduce the bias of the maximum likelihood variance-component estimators. So, we intend to investigate the possible extension for elliptical linear mixed models as well as to compare with the modified profile maximum likelihood and the maximum likelihood methods. Particular studies for Student-t and power exponential linear mixed models are presented.
|
237 |
Aperfeiçoamento de métodos estatísticos em modelos de regressão da família exponencial / Further statistical methods in regression models of the exponential familyCavalcanti, Alexsandro Bezerra 03 August 2009 (has links)
Neste trabalho, desenvolvemos três tópicos relacionados a modelos de regressão da família exponencial. No primeiro tópico, obtivemos a matriz de covariância assintótica de ordem $n^$, onde $n$ é o tamanho da amostra, dos estimadores de máxima verossimilhança corrigidos pelo viés de ordem $n^$ em modelos lineares generalizados, considerando o parâmetro de precisão conhecido. No segundo tópico calculamos o coeficiente de assimetria assintótico de ordem n^{-1/2} para a distribuição dos estimadores de máxima verossimilhança dos parâmetros que modelam a média e dos parâmetros de precisão e dispersão em modelos não-lineares da família exponencial, considerando o parâmetro de dispersão desconhecido, porém o mesmo para todas as observações. Finalmente, obtivemos fatores de correção tipo-Bartlett para o teste escore em modelos não-lineares da família exponencial, considerando covariáveis para modelar o parâmetro de dispersão. Avaliamos os resultados obtidos nos três tópicos desenvolvidos por meio de estudos de simulação de Monte Carlo / In this work, we develop three topics related to the exponential family nonlinear regression. First, we obtain the asymptotic covariance matrix of order $n^$, where $n$ is the sample size, for the maximum likelihood estimators corrected by the bias of order $n^$ in generalized linear models, considering the precision parameter known. Second, we calculate an asymptotic formula of order $n^{-1/2}$ for the skewness of the distribution of the maximum likelihood estimators of the mean parameters and of the precision and dispersion parameters in exponential family nonlinear models considering that the dispersion parameter is the same although unknown for all observations. Finally, we obtain Bartlett-type correction factors for the score test in exponential family nonlinear models assuming that the precision parameter is modelled by covariates. Monte Carlo simulation studies are developed to evaluate the results obtained in the three topics.
|
238 |
Identificação de tendências evolutivas de marcadores de replicação viral e do status imunológico de pacientes vivendo com HIV: impacto da terapia anti-retroviral inicial sobre a resposta ao tratamento / Identifying trends in viral replication and immune status markers among patients living with HIV: impact of the initial antiretroviral therapeutic regimen on response to treatmentCourtouké, Claudia de Lello 08 May 2008 (has links)
INTRODUÇÃO: Na história natural da infecção por HIV, um período longo de aproximadamente dez anos precede o desenvolvimento da doença. No entanto, a interação vírus-hospedeiro é caracterizada por um evento dinâmico e não estático. Os modelos matemáticos foram cruciais para revelar o conceito de latência viral, visto que a replicação viral intensa e persistente foi demonstrada através da fase assintomática. Uma contribuição importante demonstrou que a maioria das células que produzia vírus tornava-se infectada em poucos dias. Nosso estudo visa avaliar indivíduos infectados por HIV, investigando o impacto dos esquemas anti-retrovirais iniciais recebidos por eles (monoterapia versus bibiterapia versus HAART) no curso da doença. MÉTODOS: Usamos um banco de dados com 1391 pacientes, atendidos em serviço de referência em São Paulo, com pelo menos seis mensurações consecutivas de carga viral. Utilizamos o modelo linear aplicado à carga viral no plasma e ao número de células CD4+ em sangue periférico para classificar os desfechos em favoráveis ou desfavoráveis. Validamos a escolha da aproximação linear de acordo com dois critérios baseados na estatística c2 e em ( ) 2 2 Q . A associação de cada um desses desfechos e o esquema anti-retroviral inicial prescrito foi avaliada após a análise dos coeficientes angulares da reta de regressão para a carga viral e para o número de células T CD4+. RESULTADOS: Para a maioria dos pacientes com carga viral não-detectável durante o seguimento, nenhum esquema anti-retroviral inicial foi capaz de modificar o desfecho. Os resultados indicam efeito benéfico dos esquemas anti-retrovirais para apenas 20% dos pacientes com viremia persistente. Desfechos desfavoráveis foram associados à maioria dos pacientes com recuperação de viremia tanto de forma transiente ou como no final do seguimento. Para a maioria dos pacientes com viremia intermitente, mas com regularidade no final do seguimento: ou não-detectável ou detectável, os resultados mostram, respectivamente, desfechos favorável e desfavorável, independentemente do primeiro esquema anti-retroviral prescrito. Desfechos distintos foram apresentados por pacientes com carga viral oscilatória, ora detectável ora não-detectável, destacando-se que para a maioria dos pacientes que iniciou o tratamento com duas ou três drogas o desfecho foi favorável, ao passo que aquela que iniciou com uma única droga, exibiu desfecho desfavorável. CONCLUSÕES: As ferramentas da Matemática demonstraram, com sucesso, que o esquema anti-retroviral prescrito inicialmente não está associado à resposta ao tratamento para a maioria dos pacientes analisados. Os desfechos favoráveis podem estar associados a intervenções médicas envolvendo reforço da adesão ou mesmo troca de esquemas terapêuticos durante o seguimento. O aparecimento de linhagens resistentes à terapia antiretroviral e a seleção positiva dessas linhagens pode ser uma explicação para os desfechos desfavoráveis obtidos / In the natural history of HIV infection, a ten-year long asymptomatic period precedes disease development. However, viral-host interaction is a dynamic rather than a static event. Mathematical models have been crucial to rule out the concept of viral latency, since persistent and intense viral replication was demonstrated throughout the asymptomatic phase. One important contribution revealed that most plasma viral producing cells had become infected few days before. The present study aims at evaluating such an interaction in HIV infection, investigating the impact of initial antiretroviral regimens (mono therapy vs. double therapy vs. highly active antiretroviral therapy - HAART) in the course of disease. Using an available database with at least six sequential CD4+ cell counts and HIV viral load assessments of 1391 patients under clinical follow-up at a reference care centre in São Paulo, we classified patients according to a linear approximation model of plasma viral loads and peripheral blood CD4+ cell counts into favourable and unfavourable outcomes. We validated the linear approach according to two criteria, based on c2 and ( ) 2 2 Q . Association between each of these outcomes and the initial prescribed antiretroviral regimen was sought after analyzing the viral load and CD4+ cell counts slopes from the linear model. No particular initial regimen was shown associated with plasma viral undetectability during follow-up. The results point out for a beneficial effect of ART regimens for only 20% patients with persistent vireamia. Unfavourable outcomes were associated with most patients who resumed vireamia transiently or at the end of follow-up. For most patients with intermittent vireamia ending with an undetectable or a detectable viral load, the results indicate favourable and unfavourable outcomes, respectively, regardless of the initial prescribed antiretroviral regimen. Distinct outcomes occurred among patients with oscillatory viral loads, standing out the fact that for most patients who were started on therapy with two or three drugs had a favourable outcome. In contrast, most of those who were started on antiretroviral monotherapy had an unfavourable outcome. Mathematical tools have successfully demonstrated that the initially prescribed ART regimen was not associated with the long-term response to therapy for most analysed patients. Favourable outcomes can be associated to medical interventions including reinforcement of adherence or even changes in therapeutic regimens during follow-up. Emergence and positive selection of ART-resistant viral strains might be hypothesized as implicated in unfavourable outcomes
|
239 |
"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"Maria Kelly Venezuela 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
|
240 |
Modelos de regressão lineares mistos sob a classe de distribuições normal-potência / Linear mixed regression models under the power-normal class distributionsRoger Jesus Tovar Falon 27 November 2017 (has links)
Neste trabalho são apresentadas algumas extensões dos modelos potência-alfa assumindo o contexto em que as observações estão censuradas ou limitadas. Inicialmente propomos um novo modelo assimétrico que estende os modelos t-assimétrico (Azzalini e Capitanio, 2003) e t-potência (Zhao e Kim, 2016) e inclui a distribuição t de Student como caso particular. Este novo modelo é capaz de ajustar dados com alto grau de assimetria e curtose, ainda maior do que os modelos t-assimétrico e t-potência. Em seguida estendemos o modelo t-potência às situações em que os dados apresentam censura, com alto grau de assimetria e caudas pesadas. Este modelo generaliza o modelo de regressão linear t de Student para dados censurados por Arellano-Valle et al. (2012). O trabalho também introduz o modelo linear misto normal-potência para dados assimétricos. Aqui a inferência estatística é realizada desde uma perspectiva clássica usando o método de máxima verossimilhança junto com o método de integração numérica de Gauss-Hermite para aproximar as integrais envolvidas na função de verossimilhança. Mais tarde, o modelo linear com interceptos aleatórios para dados duplamente censurados é estudado. Este modelo é desenvolvido sob a suposição de que os erros e os efeitos aleatórios seguem distribuições normal-potência e normal- assimétrica. Para todos os modelos estudados foram realizados estudos de simulação a fim de estudar as suas bondades de ajuste e limitações. Finalmente, ilustram-se todos os métodos propostos com dados reais. / In this work some extensions of the alpha-power models are presented, assuming the context in which the observations are censored or limited. Initially we propose a new asymmetric model that extends the skew-t (Azzalini e Capitanio, 2003) and power-t (Zhao e Kim, 2016) models and includes the Students t-distribution as a particular case. This new model is able to adjust data with a high degree of asymmetry and cursose, even higher than the skew-t and power-t models. Then we extend the power-t model to situations in which the data present censorship, with a high degree of asymmetry and heavy tails. This model generalizes the Students t linear censored regression model t by Arellano-Valle et al. (2012) The work also introduces the power-normal linear mixed model for asymmetric data. Here statistical inference is performed from a classical perspective using the maximum likelihood method together with the Gauss-Hermite numerical integration method to approximate the integrals involved in the likelihood function. Later, the linear model with random intercepts for doubly censored data is studied. This model is developed under the assumption that errors and random effects follow power-normal and skew-normal distributions. For all the models studied, simulation studies were carried out to study their benefits and limitations. Finally, all proposed methods with real data are illustrated.
|
Page generated in 0.0644 seconds