Global ETD Search

1	Modelos estatísticos para análise de dados longitudinais categorizados ordinais Patricia Barreto Santana, Silvia January 2004 (has links) Made available in DSpace on 2014-06-12T18:06:22Z (GMT). No. of bitstreams: 2 arquivo7261_1.pdf: 519185 bytes, checksum: 923bd272ea2504b66609c2a51a5f7382 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2004 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Modelos para dados longitudinais são modelos de regressão com respostas correlacionadas no tempo, observadas da mesma unidade amostral, podendo estas respostas serem consideradas de alguma forma grupos (clusters). A correlação existente deve ser levada em consideração. Uma forma de modelar esta correlação entre as observações ao longo do tempo é através das Equações de Estimação Generalizadas (GEEs). Liang & Zeger (1986) propuseram uma forma relativamente simples de tratar dados longitudinais através de Modelos Lineares Generalizados (MLG). O objetivo deste trabalho é estudar este tipo de modelo estatístico e seus métodos de estimação associados para análise de dados longitudinais categorizados ordinais e fazer uma análise de um conjunto de dados longitudinais considerando que os dados são correlacionados. Foi realizada uma aplicação com dados reais proveniente de um estudo de coorte de 477 crianças residentes nos municípios da zona da mata meridional de Pernambuco acompanhadas ao nascer e aos 2, 4, 6, 9, 12,15 e 18 meses de vida, estimando-se as probabilidades de desnutrição em relação a certas condições sócio-demográficas e biológicas, aqui denominada ?condição geral? e mais a situação de aleitamento da criança. Foram construídos modelos marginais nos quais a resposta é uma variável aleatória categorizada ordinal. Através dos modelos encontrados foi verificado a importância do aleitamento materno no estado nutricional da criança. Para as análises foram utilizados os pacotes estatísticos SAS e R. Os resultados indicam que as probabilidades estimadas utilizando os dois pacotes computacionais são bastantes próximas, apesar do pacote SAS utilizar o método GEE1, e o R utilizar o método GEE2, que são métodos diferentes provenientes de extensões do GEE. As estimativas oferecidas pelo R são sempre um pouco menores que as oferecidas pelo SAS Dados longitudinais Equações de estimação generalizadas
2	Determinantes da evasão e repetência escolar no Ceará Shirasu, Maitê Rimekká January 2014 (has links) SHIRASU, Maitê Rimekká. Determinantes da evasão e repetência escolar no Ceará. 2014. 47f. Dissertaçao (mestrado) - Universidade Federal do Ceará, Programa de Pós Graduação em Economia, CAEN, Fortaleza, Ce, 2014. / Submitted by Mônica Correia Aquino (monicacorreiaaquino@gmail.com) on 2016-02-18T20:17:04Z No. of bitstreams: 1 2014_dissert_mrshirasu.pdf: 800832 bytes, checksum: 9e979540d358edd9690e2627625b3e4f (MD5) / Approved for entry into archive by Mônica Correia Aquino(monicacorreiaaquino@gmail.com) on 2016-02-18T20:17:16Z (GMT) No. of bitstreams: 1 2014_dissert_mrshirasu.pdf: 800832 bytes, checksum: 9e979540d358edd9690e2627625b3e4f (MD5) / Made available in DSpace on 2016-02-18T20:17:16Z (GMT). No. of bitstreams: 1 2014_dissert_mrshirasu.pdf: 800832 bytes, checksum: 9e979540d358edd9690e2627625b3e4f (MD5) Previous issue date: 2014 / Considering the overall benefits from education, the dropouts and school failures bring about severe consequences for economic progress and welfare of the population. The purpose of this study was to identify the determinants for the occurrence of such problems in public high schools of the State of Ceará. For doing this, a longitudinal database of SPAECE of 2008, extended to 2009-2011, is applied to a multilevel logistic model on a hierarchical basis, which is divided in two dimensions: school and students. It is found evidence that factors associated with both the students themselves and their families’ status affects significantly the chances for dropouts and school failures. While the cash transfer (Bolsa Família) to student’s household is an important mechanism to reduce the probability of dropout and school failure, the lack of students' dedications in school activities and persistency of failures are the main deficiencies for increasing the chances of dropouts from school. Since the sampled schools have similar infrastructure, the intervention of educators must be driven to student motivation in scholar activities, through educational measures that call for their attention and warn them effectively on the social and economic benefits arising from the accumulation of education in the medium and long term, as it occurs in developed countries. / Tendo em vista os reconhecidos benefícios sociais e econômicos advindos da educação, tanto em nível individual quanto agregado, identificar os fatores que causam os problemas de evasão e repetência escolar tem persistido como ponto importante na agenda de pesquisadores, seja de países em desenvolvimento ou desenvolvidos. Nesse sentido, este estudo objetivou identificar os determinantes da evasão e da repetência escolar no ensino médio das escolas públicas do Ceará. Para tanto, foi utilizada a base de dados longitudinal do Sistema de Avaliação Permanente da Educação Básica (SPAECE) de 2008, acompanhada de 2009 a 2011, sobre a qual se construiu um modelo logístico multinível que incorpora a natureza hierárquica dos dados, subdivididos em níveis de alunos e de escolas. Os resultados indicam a importância do Programa Bolsa Família para a redução da probabilidade, tanto para a ocorrência de evasão, quanto de repetência escolar. Além disso, dentre os fatores que têm a maior influência no aumento das chances de o aluno deixar a escola, estão o desinteresse pelos estudos e a persistência de repetência em anos anteriores. Sendo este último, junto com o atraso escolar, os principais determinantes da retenção dos alunos cearenses. Uma vez que essas escolas possuem infraestruturas semelhantes, a intervenção dos educadores deve estar atrelada à motivação dos alunos pelos estudos, através de medidas pedagógicas que os envolvam e os alertem efetivamente sobre os benefícios sociais e econômicos advindos pela acumulação de educação a médio e longo prazo, tal como ocorre nos países desenvolvidos. Dados longitudinais Escolas públicas - Ceará Evasão e repetência escolar
3	Análise da cor da casca do mamão cv. Sunrise Solo por meio de modelo de regressão linear misto / Analysis of color peel of the papaya cv. Sunrise Solo through of the mixed linear regression model Nascimento, Caroline Oliveira do 30 May 2019 (has links) O mamão (Carica papaya L.) tem importância destacada na fruticultura e se encontra entre os seis principais produtos que somam mais de 50% da produção nacional desse setor. O mamão tem uma maturação relativamente rápida. Visando aumentar o potencial de comércio e possivelmente diminuir as perdas pós-colheita, a análise de imagens digitais é um recurso tecnológico para avaliar a tonalidade e intensidade da cor da casca dos frutos no período de maturação, que serve de base para estabelecer modelos funcionais para mensurações realizadas num período de tempo. Nesse contexto tem como motivação um estudo longitudinal envolvendo a avaliação da intensidade e tonalidade da cor da casca do mamão da espécie Carica papaya L. no período de maturação. Para a análise dos dados é utilizada a metodologia dos modelos lineares de efeitos mistos e para selecionar os modelos que melhor se ajustavam aos dados, utilizou-se teste da razão de verossimilhanças e teste F, em um método de seleção top-down. Verifica-se que modelo polinomial quadrático com efeito aleatório em todos os parâmetros descreve de maneira satisfatória a variável tonalidade. Para a variável intensidade obteve-se um modelo polinomial cúbico para os efeitos aleatórios e apenas o intercepto como parâmetro de efeito fixo. As análises de diagnóstico confirmaram o ajuste satisfatório dos modelos. / The papaya (Carica papaya L.) has important importance in fruticulture and is among the six main products that add up to more than 50% of the national production of this sector. Papaya has a relatively rapid maturation. In order to increase commercial potential and possibly reduce post-harvest losses, digital image analysis is a technological tool to evaluate the color tone and intensity of fruit peel during the maturation period, which serves as the basis for establishing functional models for measurements performed over a period of time. In this context it has as motivation a longitudinal study involving the evaluation of the intensity and color tone of the shell of the papaya of the species Carica papaya L. in the maturation period. For the analysis of the data the methodology of the linear models of mixed effects is used and to select the models that best fit the data, was used a test of the likelihood ratio and test F, in a method of selection top-down. It can be verified that the quadratic polynomial model with random effect in all the parameters describes in a satisfactory way the variable tonality. For the intensity variable we obtained a cubic polynomial model for the random effects and only the intercept as a fixed effect parameter. Diagnostic analyzes confirmed the satisfactory fit of the models. Dados longitudinais Fruticultura Fruticulture Longitudinal data Regressão Regression Seleção de modelos Selection of models
4	Análise estatística para dados de contagem longitudinais na presença de covariáveis: aplicações na área médica / Statistical Analyze For Longitudinal Counting Data in Presence of Covariates: Application in Medical Research Barros, Emilio Augusto Coelho 09 February 2009 (has links) COELHO-BARROS, E. A. Analise estatstica para dados de contagem longitudinais na presenca de covariaveis: Aplicações na area medica. Dissertação (mestrado) - Faculdade de Medicina de Ribeirão Preto - USP, Ribeirão Preto - SP - Brasil, 2009. Dados de contagem ao longo do tempo na presenca de covariaveis são muito comuns em estudos na area da saude coletiva, por exemplo; numero de doenças que uma pessoa, com alguma caracteristica especifica, adquiriu ao longo de um período de tempo; numero de internações hospitalares em um período de tempo, devido a algum tipo de doença; numero de doadores de orgãos em um período de tempo. Nesse trabalho são apresentados diferentes modelos estatsticos de\\fragilidade\" de Poisson para a analise estatística de dados de contagem longitudinais. Teoricamente, a distribuição de Poisson exige que a media seja igual a variância, quando isto não ocorre tem-se a presenca de uma variabilidade extra-Poisson. Os modelos estatsticos propostos nesta dissertação incorporam a variabilidade extra-Poisson e capturam uma possvel correlação entre as contagens para o mesmo indivduo. Para cada modelo foi feito uma analise Bayesiana Hierarquica considerando os metodos MCMC (Markov Chain Monte Carlo). Utilizando bancos de dados reais, cedidos por pesquisadores auxiliados pelo CEMEQ (Centro de Metodos Quantitativos, USP/FMRP), foram discutidos alguns aspectos de discriminação Bayesiana para a escolha do melhor modelo. Um exemplo de banco de dados reais, discutido na Seção 4 dessa dissertação, que se encaixa na area da saude coletiva, e composto de um estudo prospectivo, aberto e randomizado, realizado em pacientes infectados pelo HIV que procuraram atendimento na Unidade Especial de Terapia de Doencas Infecciosas (UETDI) do Hospital das Clnicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (HCFMRP-USP). Os esquemas terapêuticos estudados consistiam em zidovudina e lamivudina, associadas ao efavirenz ou lopinavir. Entre setembro de 2004 e maio de 2006 foram avaliados 66 pacientes, sendo 43 deles includos no estudo. Destes, 39 participantes alcançaram a semana 24 de acompanhamento, enquanto 27 atingiram a semana 48. Os grupos de pacientes apresentavam características basais semelhantes, quanto a idade, sexo, mediana de CD4 e carga viral. O interesse desse experimento e estudar a contagem de CD4 considerando os dois esquemas terapêuticos (efavirenz e lopinavir). / COELHO-BARROS, E. A. Analise estatstica para dados de contagem longitudinais na presenca de covariaveis: Aplicac~oes na area medica. Dissertac~ao (mestrado) - Faculdade de Medicina de Ribeir~ao Preto - USP, Ribeir~ao Preto - SP - Brasil, 2009. Longitudinal counting data in the presence of covariates is very common in many applications, especially considering medical data. In this work we present dierent \\frailty\"models to analyze longitudinal Poisson data in the presence of covariates. These models incorporate the extra-Poisson variability and the possible correlation among the repeated counting data for each individual. A hierarchical Bayesian analysis is introduced for each dierent model considering usual MCMC (Markov Chain Monte Carlo) methods. Considering reals biological data set (obtained from CEMEQ, Medical School of Ribeir~ao Preto, University of S~ao Paulo, Brazil), we also discuss some Bayesian discrimination aspects for the choice of the best model. In Section 4 is considering a data set related to an open prospective and randomized study, considering of HIV infected patients, free of treatments, which entered the Infection Diseases Therapy Special Unit (UETDI) of the Clinical Hospital of the Medical School of Ribeir~ao Preto, University of S~ao Paulo (HCFMRP-USP). The therapeutic treatments consisted of the drugs Zidovudine and Lamivudine, associated to Efavirenz and Lopinavir. The data set was related to 66 patients followed from September, 2004 to may, 2006, from which, 43 were included in the study. The patients groups presented similar basal characteristics in terms of sex, age, CD4 counting median and viral load. The main goal of this study was to compare the CD4 cells counting for the two treatments, based on the drugs Efavirenz and Lopinavir, recently adopted as preferencial for the initial treatment of the disease. Bayesian inference. Counting data Dados de contagem Dados longitudinais Infer^encia Bayesiana Longitudinal data
5	Apreçamento de ativos com assimetria e curtose: um teste de comomentos com dados em painel / Asset pricing with skewness and kurtosis: testing co-moments with panel data Castro Junior, Francisco Henrique Figueiredo de 17 July 2008 (has links) Ao longo dos anos, desde a concepção do CAPM, o modelo vem passando por um rigoroso escrutínio por parte da comunidade científica e dos agentes de mercado interessados na sua utilização prática. Evidências tanto a favor quanto contra a sua adequação foram surgindo. Várias foram as causas levantadas para o fraco desempenho do CAPM: omissão de variáveis no modelo, variação no tempo da medida de risco (β) ou, ainda, a ausência de outros momentos tais como assimetria e curtose. Esta pesquisa teve como objetivo a investigação empírica da relação entre momentos sistêmicos (covariância, coassimetria e cocurtose) e a taxa de retorno de ativos financeiros negociados no mercado brasileiro. Foi utilizada uma amostra de 179 empresas brasileiras regularmente negociadas na Bovespa entre os anos de 2003 e 2007. Para o teste do modelo de apreçamento, foi utilizado um procedimento em duas etapas. Na primeira, os comomentos de cada ativo foram estimados usando-se dados longitudinais de taxas de retorno. Os coeficientes estimados foram, então, utilizados em uma segunda etapa, na qual uma regressão com dados em painel buscou determinar a relação entre o prêmio pelo risco dos ativos e os comomentos estimados na primeira etapa. Foram estimados modelos com dados agrupados, efeitos aleatórios e efeitos fixos. A determinação do modelo mais adequado foi feita por meio de testes de especificação. Os dados mostraram evidências de que a distribuição de probabilidade das taxas de retorno da maioria das empresas não segue uma distribuição normal, e que tanto a covariância como a cocurtose são fatores de risco relevantes em modelos de apreçamento, mesmo controlados por fatores como: tamanho, alavancagem, liquidez, relação entre preço de mercado e preço contábil e relação entre valor de mercado e valor contábil. / Since the development of the CAPM, the model has been tested with a rigorous scrutiny by academic community and market practitioners who are interested in its practical utilization. Evidence for and against the adequacy of the model has arisen. Various reasons for the failure of the CAPM were raised: omission of variables, time-varying risk factors (β), or the absence of other moments like skewness and kurtosis. This research aimed at empirical investigation of the relationship between systematic moments (covariance, coskewness and cokurtosis) and the rate of return of financial assets traded in the Brazilian market. The sample consisted of 179 stocks regularly traded at Bovespa from 2003 to 2007. The test of the pricing model was run in a two-pass procedure. In the first pass, the comoments for every stock were estimated using a longitudinal series of rates of returns. The estimated coeficients were then used in the second pass, in a panel data regression that intended to establish a relationship between the risk premium and the comoments estimated in the first pass. Panel data models with pooled data, random effects and fixed effects were estimated. The adequacy of each model was tested by specification procedures. Data showed evidence that the rates of return were not normally distributed, and that covariance and cokurtosis were significant risk factors in pricing models, even after controlling for factors like: size, leverage, liquidity, price-earning ratio and Administração de investimentos Administração financeira Análise de dados longitudinais Corporate finance investiments panel data
6	Modelo não linear misto aplicado a análise de dados longitudinais em um solo localizado em Paragominas, PA / Nonlinear mixed model applied in longitudinal data analysis in a soil located in Paragominas, PA Mello, Marcello Neiva de 22 January 2014 (has links) Este trabalho tem como objetivo aplicar a teoria de modelos mistos ao estudo do teor de nitrogênio e carbono no solo, em diversas profundidades. Devido a grande quantidade de matéria orgânica no solo, o teor de nitrogênio e carbono apresentam alta variabilidade nas primeiras profundidades, além de apresentar um comportamento não linear. Assim, fez-se necessário utilizar a abordagem de modelos não lineares mistos a dados longitudinais. A utilização desta abordagem proporciona um modelo que permite modelar dados não lineares, com heterogeneidade de variâncias, fornecendo uma curva para cada amostra. / This paper has as an objective to apply the theory of mixed models to the content of nitrogen and carbon in the soil at various depths. Due to the large amount of organic material in the soil, the content of nitrogen and carbon present high variability in the depths of soil surface, and present a nonlinear behavior. Thus, it was necessary to use the approach of nonlinear mixed models to longitudinal data analysis. The use of this approach provides a model that allows to model nonlinear data with heterogeneity of variances by providing a curve for each sample. Dados longitudinais Longitudinal data Modelos não lineares mistos Nitrogen and carbon Nitrogenio e carbono Nonlinear mixed effects models
7	Modelos para a análise de dados de contagens longitudinais com superdispersão: estimação INLA / Models for data analysis of longitudinal counts with overdispersion: INLA estimation Rocha, Everton Batista da 04 September 2015 (has links) Em ensaios clínicos é muito comum a ocorrência de dados longitudinais discretos. Para sua análise é necessário levar em consideração que dados observados na mesma unidade experimental ao longo do tempo possam ser correlacionados. Além dessa correlação inerente aos dados é comum ocorrer o fenômeno de superdispersão (ou sobredispersão), em que, existe uma variabilidade nos dados além daquela captada pelo modelo. Um caso que pode acarretar a superdispersão é o excesso de zeros, podendo também a superdispersão ocorrer em valores não nulos, ou ainda, em ambos os casos. Molenberghs, Verbeke e Demétrio (2007) propuseram uma classe de modelos para acomodar simultaneamente a superdispersão e a correlação em dados de contagens: modelo Poisson, modelo Poisson-gama, modelo Poisson-normal e modelo Poisson-normal-gama (ou modelo combinado). Rizzato (2011) apresentou a abordagem bayesiana para o ajuste desses modelos por meio do Método de Monte Carlo com Cadeias de Markov (MCMC). Este trabalho, para modelar a incerteza relativa aos parâmetros desses modelos, considerou a abordagem bayesiana por meio de um método determinístico para a solução de integrais, INLA (do inglês, Integrated Nested Laplace Approximations). Além dessa classe de modelos, como objetivo, foram propostos outros quatros modelos que também consideram a correlação entre medidas longitudinais e a ocorrência de superdispersão, além da ocorrência de zeros estruturais e não estruturais (amostrais): modelo Poisson inacionado de zeros (ZIP), modelo binomial negativo inacionado de zeros (ZINB), modelo Poisson inacionado de zeros - normal (ZIP-normal) e modelo binomial negativo inacionado de zeros - normal (ZINB-normal). Para ilustrar a metodologia desenvolvida, um conjunto de dados reais referentes à contagens de ataques epilépticos sofridos por pacientes portadores de epilepsia submetidos a dois tratamentos (um placebo e uma nova droga) ao longo de 27 semanas foi considerado. A seleção de modelos foi realizada utilizando-se medidas preditivas baseadas em validação cruzada. Sob essas medidas, o modelo selecionado foi o modelo ZIP-normal, sob o modelo corrente na literatura, modelo combinado. As rotinas computacionais foram implementadas no programa R e são parte deste trabalho. / Discrete and longitudinal structures naturally arise in clinical trial data. Such data are usually correlated, particularly when the observations are made within the same experimental unit over time and, thus, statistical analyses must take this situation into account. Besides this typical correlation, overdispersion is another common phenomenon in discrete data, defined as a greater observed variability than that nominated by the statistical model. The causes of overdispersion are usually related to an excess of observed zeros (zero-ination), or an excess of observed positive specific values or even both. Molenberghs, Verbeke e Demétrio (2007) have developed a class of models that encompasses both overdispersion and correlation in count data: Poisson, Poisson-gama, Poisson-normal, Poissonnormal- gama (combined model) models. A Bayesian approach was presented by Rizzato (2011) to fit these models using the Markov Chain Monte Carlo method (MCMC). In this work, a Bayesian framework was adopted as well and, in order to consider the uncertainty related to the model parameters, the Integrated Nested Laplace Approximations (INLA) method was used. Along with the models considered in Rizzato (2011), another four new models were proposed including longitudinal correlation, overdispersion and zero-ination by structural and random zeros, namely: zero-inated Poisson (ZIP), zero-inated negative binomial (ZINB), zero-inated Poisson-normal (ZIP-normal) and the zero-inated negative binomial-normal (ZINB-normal) models. In order to illustrate the developed methodology, the models were fit to a real dataset, in which the response variable was taken to be the number of epileptic events per week in each individual. These individuals were split into two groups, one taking placebo and the other taking an experimental drug, and they observed up to 27 weeks. The model selection criteria were given by different predictive measures based on cross validation. In this setting, the ZIP-normal model was selected instead the usual model in the literature (combined model). The computational routines were implemented in R language and constitute a part of this work. Análise de dados longitudinais Bayesian inference Contagens Counts Inferência Bayesiana Longitudinal data analysis Overdispersion Superdispersão
8	Análise estatística para dados de contagem longitudinais na presença de covariáveis: aplicações na área médica / Statistical Analyze For Longitudinal Counting Data in Presence of Covariates: Application in Medical Research Emilio Augusto Coelho Barros 09 February 2009 (has links) COELHO-BARROS, E. A. Analise estatstica para dados de contagem longitudinais na presenca de covariaveis: Aplicações na area medica. Dissertação (mestrado) - Faculdade de Medicina de Ribeirão Preto - USP, Ribeirão Preto - SP - Brasil, 2009. Dados de contagem ao longo do tempo na presenca de covariaveis são muito comuns em estudos na area da saude coletiva, por exemplo; numero de doenças que uma pessoa, com alguma caracteristica especifica, adquiriu ao longo de um período de tempo; numero de internações hospitalares em um período de tempo, devido a algum tipo de doença; numero de doadores de orgãos em um período de tempo. Nesse trabalho são apresentados diferentes modelos estatsticos de\\fragilidade\" de Poisson para a analise estatística de dados de contagem longitudinais. Teoricamente, a distribuição de Poisson exige que a media seja igual a variância, quando isto não ocorre tem-se a presenca de uma variabilidade extra-Poisson. Os modelos estatsticos propostos nesta dissertação incorporam a variabilidade extra-Poisson e capturam uma possvel correlação entre as contagens para o mesmo indivduo. Para cada modelo foi feito uma analise Bayesiana Hierarquica considerando os metodos MCMC (Markov Chain Monte Carlo). Utilizando bancos de dados reais, cedidos por pesquisadores auxiliados pelo CEMEQ (Centro de Metodos Quantitativos, USP/FMRP), foram discutidos alguns aspectos de discriminação Bayesiana para a escolha do melhor modelo. Um exemplo de banco de dados reais, discutido na Seção 4 dessa dissertação, que se encaixa na area da saude coletiva, e composto de um estudo prospectivo, aberto e randomizado, realizado em pacientes infectados pelo HIV que procuraram atendimento na Unidade Especial de Terapia de Doencas Infecciosas (UETDI) do Hospital das Clnicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (HCFMRP-USP). Os esquemas terapêuticos estudados consistiam em zidovudina e lamivudina, associadas ao efavirenz ou lopinavir. Entre setembro de 2004 e maio de 2006 foram avaliados 66 pacientes, sendo 43 deles includos no estudo. Destes, 39 participantes alcançaram a semana 24 de acompanhamento, enquanto 27 atingiram a semana 48. Os grupos de pacientes apresentavam características basais semelhantes, quanto a idade, sexo, mediana de CD4 e carga viral. O interesse desse experimento e estudar a contagem de CD4 considerando os dois esquemas terapêuticos (efavirenz e lopinavir). / COELHO-BARROS, E. A. Analise estatstica para dados de contagem longitudinais na presenca de covariaveis: Aplicac~oes na area medica. Dissertac~ao (mestrado) - Faculdade de Medicina de Ribeir~ao Preto - USP, Ribeir~ao Preto - SP - Brasil, 2009. Longitudinal counting data in the presence of covariates is very common in many applications, especially considering medical data. In this work we present dierent \\frailty\"models to analyze longitudinal Poisson data in the presence of covariates. These models incorporate the extra-Poisson variability and the possible correlation among the repeated counting data for each individual. A hierarchical Bayesian analysis is introduced for each dierent model considering usual MCMC (Markov Chain Monte Carlo) methods. Considering reals biological data set (obtained from CEMEQ, Medical School of Ribeir~ao Preto, University of S~ao Paulo, Brazil), we also discuss some Bayesian discrimination aspects for the choice of the best model. In Section 4 is considering a data set related to an open prospective and randomized study, considering of HIV infected patients, free of treatments, which entered the Infection Diseases Therapy Special Unit (UETDI) of the Clinical Hospital of the Medical School of Ribeir~ao Preto, University of S~ao Paulo (HCFMRP-USP). The therapeutic treatments consisted of the drugs Zidovudine and Lamivudine, associated to Efavirenz and Lopinavir. The data set was related to 66 patients followed from September, 2004 to may, 2006, from which, 43 were included in the study. The patients groups presented similar basal characteristics in terms of sex, age, CD4 counting median and viral load. The main goal of this study was to compare the CD4 cells counting for the two treatments, based on the drugs Efavirenz and Lopinavir, recently adopted as preferencial for the initial treatment of the disease. Dados de contagem Dados longitudinais Infer^encia Bayesiana Bayesian inference. Counting data Longitudinal data
9	Métodos estatísticos na seleção genômica ampla para curvas de crescimento em animais / Statistical methods used in genome wide selection for growth curves in animals Rocha, Gilson Silvério da 20 June 2011 (has links) Made available in DSpace on 2015-03-26T13:32:12Z (GMT). No. of bitstreams: 1 texto completo.pdf: 4537549 bytes, checksum: 620653542527fa7feaefde5219b6a878 (MD5) Previous issue date: 2011-06-20 / The main contribution of molecular genetics to the benefit of applied genetic breeding is the direct use of the DNA data in genomic selection, allowing high selective efficiency and speed in the acquisition of genetic gains in selection and low costs. A practical and consistent way of analyzing the productive efficiency of beef animals subjected to selection is through the study of growth curves, as these represent a longitudinal trajectory of the weights of the animals in function of time. Thus, firstly, growth models (non-linear models) are adjusted to the weight-age data of each animal submitted to selection and the parameters estimated as phenotypes are considered. This procedure permits to determine genetic parameter estimates for any growth trajectory point, and to understand the genetic architecture of the entire trajectory, since all the weighing information is condensed by these few biologically interpretable parameters. The parameters estimated from the growth models are used to predict the Genomic Breeding Value (GBV) by means of specific statistical methods for the Genome Wide Selection (GWS). The general objective of this work was to apply statistical methods used in the Genome Wide Selection, mainly RRBLUP/ GWS and the Bayesian LASSO on the study of animal growth curves, considering as phenotypic variables the estimates of the parameters of non-linear regression models. The specific objectives were: to estimate the genomic breeding values for each individual evaluated; to estimate the effect of SNP markers and to identify those with the greatest effects; to select, via grouping techniques, groups of individuals genetically superior, in relation to the growth curve; and to validate all the methodology used via simulation study and apply it to real data of an F2 population of swine originated from the cross of two males from the naturalized Brazilian race Piau with 18 females of a commercial line (Landrace × Large White × Pietrain).The results indicated that the Genome Wide Selection statistical methods were efficient in studying the growth curves, considering simulated and real swine weight-age data. GWS presented high accuracy in the selection of the growth curve trajectory, allowing the detection of the QTLs (Quantitative Trait Loci) for the curve parameters of the individuals studied. In the absence of genes of significant effect, the methods RR-BLUP/GWS and Bayesian LASSO showed similar results but the latter showed more efficiency when the halothane gene, characterized as of significant effect, was included as a marker in the analyses. / O principal atrativo da genética molecular em benefício do melhoramento genético aplicado é a utilização direta das informações do DNA na seleção genômica, de modo a permitir alta eficiência seletiva, rapidez na obtenção de ganhos genéticos com a seleção e baixo custo. Uma forma prática e consistente de analisar a eficiência produtiva de animais de corte sujeitos à seleção é por meio dos estudos de curvas de crescimento, pois estas representam uma trajetória longitudinal dos pesos dos animais em função do tempo. Para isso, primeiramente ajustam-se modelos de crescimento (modelos não lineares) aos dados de peso-idade de cada animal submetido à seleção e consideram-se os parâmetros estimados como fenótipos. Este procedimento permite a obtenção de estimativas de parâmetros genéticos para qualquer ponto da trajetória de crescimento e possibilita a compreensão da arquitetura genética de toda a trajetória, uma vez que as informações de todas as pesagens são condensadas por esses poucos parâmetros interpretáveis biologicamente. Em seguida, os parâmetros estimados dos modelos de crescimento são utilizados para predizer os Valores Genéticos Genômicos (Genomic Breeding Value – GBV) por meio de métodos estatísticos específicos para a Seleção Genômica ix Ampla (Genome Wide Selection – GWS). O objetivo geral do presente trabalho foi empregar métodos estatísticos usados na Seleção Genômica Ampla, especificamente o RR-BLUP/GWS e o LASSO Bayesiano, no estudo de curvas de crescimento animal, considerando como variáveis fenotípicas as estimativas dos parâmetros de modelos de regressão não linear. Os objetivos específicos foram: estimar valores genéticos genômicos para cada indivíduo avaliado; estimar efeitos de marcadores SNPs e identificar os de maiores efeitos; selecionar, via técnicas de agrupamento, grupos de indivíduos geneticamente superiores em relação à curva de crescimento; e validar toda metodologia utilizada via estudo de simulação e aplicá-la a dados reais de uma população F2 de suínos proveniente do cruzamento de dois varrões da raça naturalizada brasileira Piau com 18 fêmeas de linhagem comercial (Landrace × Large White × Pietrain). Os resultados indicaram que os métodos estatísticos na Seleção Genômica Ampla foram eficientes no estudo de curvas de crescimento, considerando dados simulados e dados reais de peso-idade de suínos. A GWS apresentou alta acurácia na seleção para a trajetória das curvas de crescimento e possibilitou a detecção de QTLs (Quantitative Trait Loci) para os parâmetros da curva dos indivíduos considerados. Na ausência de genes de grande efeito, os métodos RRBLUP/ GWS e LASSO Bayesiano produziram resultados semelhantes, no entanto o método LASSO Bayesiano apresentou maior eficiência quando o gene halotano, caracterizado como de grande efeito, foi incluído como marcador nas análises. Marcadores SNPs Dados longitudinais Suínos SNPs markers Longitudinal data Pigs CNPQ::CIENCIAS AGRARIAS
10	Modelos para análise de dados não-normais multivariados longitudinais Ceratti, Rubem Kaipper 08 July 2013 (has links) Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2013. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-01-12T15:24:17Z No. of bitstreams: 1 2013_RubemKalpperCeratti.pdf: 1830693 bytes, checksum: 5cc2b460e956662ebc74cdfd9b67bd15 (MD5) / Approved for entry into archive by Patrícia Nunes da Silva(patricia@bce.unb.br) on 2016-01-12T15:52:07Z (GMT) No. of bitstreams: 1 2013_RubemKalpperCeratti.pdf: 1830693 bytes, checksum: 5cc2b460e956662ebc74cdfd9b67bd15 (MD5) / Made available in DSpace on 2016-01-12T15:52:07Z (GMT). No. of bitstreams: 1 2013_RubemKalpperCeratti.pdf: 1830693 bytes, checksum: 5cc2b460e956662ebc74cdfd9b67bd15 (MD5) / Neste trabalho são abordados modelos lineares generalizados de efeitos mistos para análise de dados longitudinais multivariados, no tratamento de dados em que se assume a distribuição Poisson composta, que tem suporte em $[0,+\infty)$ e é um caso particular da família Tweedie de distribuições, também pertencente à família exponencial de dispersão. No ajuste dos modelos mistos multivariados para a distribuição Poisson composta, utiliza-se uma abordagem de pseudo-verossimilhança, estimando modelos par-a-par e reduzindo o tempo computacional. Como aplicação, analisa-se um conjunto de dados provenientes de um experimento agronômico no qual avaliam-se os efeitos de tratamentos, ao longo do tempo, no perfil de 25 compostos químicos de plantas de algodão. ______________________________________________________________________________ ABSTRACT / This work presents generalized linear mixed effects models as a framework to the analysis of longitudinal multivariate data for which the underlying distribution is assumed to follow a compound Poisson distribution, whose support lies in $[0,+\infty)$, and is a particular case of the Tweedie family of distributions, and, also, belongs to the exponential dispersion family. In order to fit multivariate mixed models to the compound Poisson distribution, a pseudo-likelihood approach is used, fitting pairwise models and reducing computational time. As an application, agronomic experiment data is analyzed, estimating the effects of 5 treatments, over different time periods, on the profile of 25 organic compounds of cotton plants. Análise multivariada Dados longitudinais Família exponencial Distribuição Poisson composta Modelos lineares generalizados

Search results