Global ETD Search

21	Robust mixture regression models using t-distribution Wei, Yan January 1900 (has links) Master of Science / Department of Statistics / Weixin Yao / In this report, we propose a robust mixture of regression based on t-distribution by extending the mixture of t-distributions proposed by Peel and McLachlan (2000) to the regression setting. This new mixture of regression model is robust to outliers in y direction but not robust to the outliers with high leverage points. In order to combat this, we also propose a modified version of the proposed method, which fits the mixture of regression based on t-distribution to the data after adaptively trimming the high leverage points. We further propose to adaptively choose the degree of freedom for the t-distribution using profile likelihood. The proposed robust mixture regression estimate has high efficiency due to the adaptive choice of degree of freedom. We demonstrate the effectiveness of the proposed new method and compare it with some of the existing methods through simulation study. EM algorithm Mixture regression models Outliers Robust regression T-distribution Statistics (0463)
22	Modelos de regressão sobre dados composicionais / Regression model for Compositional data Camargo, André Pierro de 09 December 2011 (has links) Dados composicionais são constituídos por vetores cujas componentes representam as proporções de algum montante, isto é: vetores com entradas positivas cuja soma é igual a 1. Em diversas áreas do conhecimento, o problema de estimar as partes $y_1, y_2, \\dots, y_D$ correspondentes aos setores $SE_1, SE_2, \\dots, SE_D$, de uma certa quantidade $Q$, aparece com frequência. As porcentagens $y_1, y_2, \\dots, y_D$ de intenção de votos correspondentes aos candidatos $Ca_1, Ca_2, \\dots, Ca_D$ em eleições governamentais ou as parcelas de mercado correspondentes a industrias concorrentes formam exemplos típicos. Naturalmente, é de grande interesse analisar como variam tais proporções em função de certas mudanças contextuais, por exemplo, a localização geográfica ou o tempo. Em qualquer ambiente competitivo, informações sobre esse comportamento são de grande auxílio para a elaboração das estratégias dos concorrentes. Neste trabalho, apresentamos e discutimos algumas abordagens propostas na literatura para regressão sobre dados composicionais, assim como alguns métodos de seleção de modelos baseados em inferência bayesiana. \\\\ / Compositional data consist of vectors whose components are the proportions of some whole. The problem of estimating the portions $y_1, y_2, \\dots, y_D$ corresponding to the pieces $SE_1, SE_2, \\dots, SE_D$ of some whole $Q$ is often required in several domains of knowledge. The percentages $y_1, y_2, \\dots, y_D$ of votes corresponding to the competitors $Ca_1, Ca_2, \\dots, Ca_D$ in governmental elections or market share problems are typical examples. Of course, it is of great interest to study the behavior of such proportions according to some contextual transitions. In any competitive environmet, additional information of such behavior can be very helpful for the strategists to make proper decisions. In this work we present and discuss some approaches proposed by different authors for compositional data regression as well as some model selection methods based on bayesian inference.\\\\ BIC BIC Compositional data Dados composicionais FBST FBST Model selection Modelos de regressão Regression models Seleção de modelos
23	Proposta de um modelo de regressão binária com resposta contínua aplicado à análise dos dados do SINASC: identificação de fatores de risco para o baixo peso ao nascer / A propose of a binary regression model with continuous response applied to data analysis from SINASC: identification of risk factors for low birth weight Zhuofan, Wu 25 January 2011 (has links) O presente estudo tem por objetivo estudar a aplicabilidade de modelos de regressão binária com resposta contínua na análise de dados do SINASC (Sistema de Informações de Nascidos Vivos), analisando suas vantagens, limitações e estratégias na estimação de parâmetros ao identicar os fatores de riscos para baixo peso ao nascer. Muitos autores vêm utilizando os dados do SINASC para estudar as variáveis que estão associadas ao baixo peso ao nascer. Estes autores geralmente utilizam o modelo usual de regressão logística, o qual analisa somente respostas binárias (a variável resposta é codicada como 1: baixo peso ao nascer, 0: caso contrário). O modelo de regressão com resposta contínua foi utilizado para estudar as variáveis associadas aos recém-nascidos com maior propensão a um peso ao nascer inferior ao ponto de corte 2500g, ou seja, a resposta é expressa em uma variável contínua. Nesta situação, uma extensão do modelo tradicional foi utilizada visando a possibilidade de obter-se estimativas mais precisas. Para a estimação de parâmetros do modelo de regressão binária com resposta contínua, foi utilizado o método da máxima verossimilhança. Os resultados obtidos a partir da metodologia proposta possui as seguintes vantagens em relação ao modelo usual: (a) o modelo de regressão proposto foi capaz de predizer o baixo peso ao nascer com maior precisão; (b) o modelo proposto evita problemas de separação persistentes em modelos usuais. Desta forma, o modelo estudado poderá oferecer signicativas contribuições à Saúde Coletiva, ao trazer uma nova possibilidade de análise de dados desta área. / The objective of this dissertation is to study the applicability of binary regression models for continuous outcomes in the data analysis from SINASC (Brazilian Live Births Information System), analyzing its advantages, limitations and strategies in the estimation of parameters, when identifying the risk factors for low-birth-weight. Many authors have been using data from SINASC to study the variables that are associated with the low-birth-weight. These authors typically use the usual logistic regression model, which analyzes only binary responses (the dependent variable is coded as 1 for low-birth-weight and 0 for otherwise). The regression model with continuous response was proposed and used to study the variables associated with the newborns with higher propensity to a birth weight below the cutoff point of 2500 g, that is, the answer is expressed as a continuous variable. In this situation, an extension method of the traditional model was used in order to enable obtaining more accurate estimates. For the estimation of the parameters from binary regression model with continuous response, the maximum likelihood method was used. The results obtained from the proposed methodology brought these following advantages comparing with the usual model: (A) the proposed regression model was capable for predicting low birth weight with a bettter precision; (B) the proposed model can process the persistent problems of separation present in the conventional models. Thus, the studied method may offer significant contributions to the Public Health, bringing new possibilities for data analysis in this area. bioestatística biostatistics birth weight estimação estimation modelos de regressão peso ao nascer regression models SINASC SINASC
24	Modelo de regressão para um processo de renovação Weibull com termo de fragilidade / Regression model for a Weibull renewall process distribution with a frailty efect Fogo, José Carlos 03 August 2007 (has links) Processsos de renovação são um caso especial de processos pontuais envolvendo eventos recorrentes nos quais um item ou unidade, após a ocorrência de uma falha, é recolocado na mesma condição de novo. Devido a essa propriedade os tempos entre ocorrências para um processo de renovação são independentes e a sua função intensidade é dada pela função de risco. Fatores que interferem nos tempos de recorrência de unidades distintas, ou indivíduos, e que não são observados, podem ser modelados com a inclusão de um termo de fragilidade no modelo. Neste trabalho é apresentado o desenvolvimento de um modelo de regressão para um processo de renovação com tempos entre ocorrências com distribuição de Weibull. Na modelagem foi considerada, ainda, a presença de censuras e a inclusão de um termo de fragilidade para explicar a relação existente entre os tempos de recorrências de uma unidade. A metodologia é desenvolvida para o caso em que várias unidades são acometidas por eventos recorrentes. Nas simulações realizadas foram analisadas as probabilidades de cobertura empíricas do intervalo de confiança normal assintótico e também o comportamento das variâncias dos estimadores. A presença de censuras na amostra inflacionou as variâncias dos estimadores de máxima verossimilhança além de produzir estimativas viciadas para um dos parâmetros da regressão, sendo que o vício do estimador foi corrigido por meio de um processo "bootstrap". Na modelagem sem termo de fragilidade, os resultados das análises das probabilidades de cobertura empírica dos intervalos de confiança assintóticos mostraram uma boa aproximação com os valores esperados, mas com certos cuidados a serem tomados, especialmente nos procedimentos baseados na simetria das distribuições empíricas. A inclusão de um termo de fragilidade na modelagem, por sua vez, causou uma perturbação na estimação máxima verossimilhança com um aumento nas variâncias dos estimadores diretamente associados à variabilidade do termo de fragilidade. Além disso, as coberturas empíricas dos intervalos de confiança assintóticos foram, na grande maioria superestimadas, com resultados satisfatórios apenas para o parâmetro de forma da distribuição Weibull. / Renewal Processes are a special case of point processes involving recurrent events in which a unit, after a failure, is restored to the like new condition. Due to that property the times between occurrences for a renewal process are independent and its intensity function is given by the hazard function. Random factors not observed, that afects the recurrence times of the units, can be explained by a frailty term added in the model. In this work a regression model is presented for a renewal process with Weibull distribution for the times between occurrences. The modeling considers censored times and a frailty variable to explain the relationship among the recurrence times of a unit. The methodology was developed for the situation where several units are submitted by recurrent events. The empirical probabilities of coverage of the asymptotic normal confidence interval and the behavior of the variances of the estimators were analyzed in the simulations performed. The presence of censures in the sample inflated the variances of the maximum likelihood estimators besides to produce biased estimates for the regression parameters. The bias of the estimator was corrected by "bootstrap" procedure. The analysis of the probability of empirical coverage of the asymptotic confidence intervals, without frailty, presented a good approximation to the nominal values, but some observations about procedures have to be made on the symmetry of the empirical distributions. The frailty term incorporated at the modeling disturbed the maximum likelihood estimation increasing estimators' variability, directly associated to the variance of the fragility term. In the most of the cases, the empirical coverages of the asymptotic confidence intervals were overestimated, with satisfactory results just for the shape parameter of the Weibull distribution. Análise de sobrevivência Frailty Processos estocásticos pontuais Recurrent events Regression models Renewal process Simulação (Estatística) Survival analisys
25	Modelos multivariados binários com funções de ligação assimétricas / Multivariate binary regression models with asymmetric link functions Farias, Rafael Braz Azevedo 25 May 2012 (has links) Conjuntos de dados com respostas multivariadas aparecem frequentemente em pesquisas em que os dados são provenientes de questionários. Exemplos mais comuns são pesquisas de opinião, mais especificamente, pesquisas de marketing em que a preferência do consumidor em potencial é avaliado: pelo produto, marca, preço, praça, promoção e etc. Um tipo pesquisa de opinião que ganha grande destaque no Brasil de dois em dois anos são as pesquisas eleitorais de intenção de votos. Nós introduzimos nesta tese uma classe de modelos de regressão multivariados com funções de ligação assimétricas para o ajuste de conjuntos de dados com respostas multivariadas binárias. As funções de ligação consideradas são bastante flexíveis e robustas, contemplando funções de ligação simétricas como casos particulares. Devido a complexidade do modelo, nós discutimos a sua identificabilidade. A abordagem Bayesiana foi considerada e alguns algoritmos de Monte Carlo via Cadeia de Markov (MCMC) foram desenvolvidos. Nós descrevemos algumas ferramentas de seleção de modelos, os quais incluem o Critério de Informação da Deviance (DIC), a Pseudo-Verossimilhança Marginal e o Pseudo-Fator de Bayes. Adicionalmente, um estudo de simulação foi desenvolvido com dois objetivos; i) verificar a qualidade dos algoritmos desenvolvidos e ii) verificar a importância da escolha da função de ligação . No final da tese uma aplicação em um conjunto de dados real é considerada com o objetivo de ilustrar as metodologias e técnicas apresentadas. / Data sets with multivariate responses often appear in surveys where the data came from questionnaires. Opinion poll, sometimes simply referred to as a poll, are common examples of studies in which the responses are multivariate. One type poll that gain great prominence in Brazil in election years, is the survey of vote intent. However, despite the higher visibility of prognostic studies of election, opnion polls is a tool widely used to detect trends and positions of different social segments on various topics, be they political, social or governmental. We introduce in this work a class of multivariate regression models with asymmetric link functions to fit data sets with multivariate binary responses. The link functions here considered are quite flexible and robust, contemplating symmetrical link functions as special cases. Due to the complexity of the model, we discuss its identifiability. The Bayesian approach was considered and some Monte Carlo Markov Chain (MCMC) algorithms have been developed. Simulation studies have been developed with two objectives: i) verify the quality of the algorithms developed and ii) to verify the importance of choosing the link function. At the end of this work an application in a real data set is considered in order to illustrate the methodologies and techniques presented. binary models modelos binários modelos elípticos-assimétricos multivariate regression models regressão multivariada skew-elliptical distributions
26	Proposta de um modelo de regressão binária com resposta contínua aplicado à análise dos dados do SINASC: identificação de fatores de risco para o baixo peso ao nascer / A propose of a binary regression model with continuous response applied to data analysis from SINASC: identification of risk factors for low birth weight Wu Zhuofan 25 January 2011 (has links) O presente estudo tem por objetivo estudar a aplicabilidade de modelos de regressão binária com resposta contínua na análise de dados do SINASC (Sistema de Informações de Nascidos Vivos), analisando suas vantagens, limitações e estratégias na estimação de parâmetros ao identicar os fatores de riscos para baixo peso ao nascer. Muitos autores vêm utilizando os dados do SINASC para estudar as variáveis que estão associadas ao baixo peso ao nascer. Estes autores geralmente utilizam o modelo usual de regressão logística, o qual analisa somente respostas binárias (a variável resposta é codicada como 1: baixo peso ao nascer, 0: caso contrário). O modelo de regressão com resposta contínua foi utilizado para estudar as variáveis associadas aos recém-nascidos com maior propensão a um peso ao nascer inferior ao ponto de corte 2500g, ou seja, a resposta é expressa em uma variável contínua. Nesta situação, uma extensão do modelo tradicional foi utilizada visando a possibilidade de obter-se estimativas mais precisas. Para a estimação de parâmetros do modelo de regressão binária com resposta contínua, foi utilizado o método da máxima verossimilhança. Os resultados obtidos a partir da metodologia proposta possui as seguintes vantagens em relação ao modelo usual: (a) o modelo de regressão proposto foi capaz de predizer o baixo peso ao nascer com maior precisão; (b) o modelo proposto evita problemas de separação persistentes em modelos usuais. Desta forma, o modelo estudado poderá oferecer signicativas contribuições à Saúde Coletiva, ao trazer uma nova possibilidade de análise de dados desta área. / The objective of this dissertation is to study the applicability of binary regression models for continuous outcomes in the data analysis from SINASC (Brazilian Live Births Information System), analyzing its advantages, limitations and strategies in the estimation of parameters, when identifying the risk factors for low-birth-weight. Many authors have been using data from SINASC to study the variables that are associated with the low-birth-weight. These authors typically use the usual logistic regression model, which analyzes only binary responses (the dependent variable is coded as 1 for low-birth-weight and 0 for otherwise). The regression model with continuous response was proposed and used to study the variables associated with the newborns with higher propensity to a birth weight below the cutoff point of 2500 g, that is, the answer is expressed as a continuous variable. In this situation, an extension method of the traditional model was used in order to enable obtaining more accurate estimates. For the estimation of the parameters from binary regression model with continuous response, the maximum likelihood method was used. The results obtained from the proposed methodology brought these following advantages comparing with the usual model: (A) the proposed regression model was capable for predicting low birth weight with a bettter precision; (B) the proposed model can process the persistent problems of separation present in the conventional models. Thus, the studied method may offer significant contributions to the Public Health, bringing new possibilities for data analysis in this area. bioestatística estimação modelos de regressão peso ao nascer SINASC biostatistics birth weight estimation regression models SINASC
27	Distribuições das classes Kumaraswamy generalizada e exponenciada: propriedades e aplicações / Distributions of the generalized Kumaraswamy and exponentiated classes: properties and applications Braga Junior, Antonio Carlos Ricardo 04 April 2013 (has links) Recentemente, Cordeiro e de Castro (2011) apresentaram uma classe generalizada baseada na distribuição Kumaraswamy (Kw-G). Essa classe de distribuições modela as formas de risco crescente, decrescente, unimodal e forma de U ou de banheira. Uma importante distribuição pertencente a essa classe é a distribuição Kumaraswamy Weibull modificada (KwMW) proposta por Cordeiro; Ortega e Silva (2013). Com isso foi utilizada essa distribuição para o desenvolvimento de algumas novas propriedades e análise bayesiana. Além disso, foi desenvolvida uma nova distribuição de probabilidade a partir da distribuição gama generalizada geométrica (GGG) que foi denominada de gama generalizada geométrica exponenciada (GGGE). Para a nova distribuição GGGE foram calculados os momentos, a função geradora de momentos, os desvios médios, a confiabilidade e as estatísticas de ordem. Desenvolveu-se o modelo de regressão log-gama generalizada geométrica exponenciada. Para a estimação dos parâmetros, foram utilizados os métodos de máxima verossimilhança e bayesiano e, finalmente, para ilustrar a aplicação da nova distribuição foi analisado um conjunto de dados reais. / Recently, Cordeiro and de Castro (2011) showed a generalized class based on the Kumaraswamy distribution (Kw-G). This class of models has crescent risk forms, decrescent, unimodal and U or bathtub form. An important distribution belonging to this class the Kumaraswamy modified Weibull distribution (KwMW), proposed by Cordeiro; Ortega e Silva (2013). Thus this distribution was used to develop some new properties and bayesian analysis. Furthermore, we develop a new probability distribution from the generalized gamma geometric distribution (GGG) which it is called generalized gamma geometric exponentiated (GGGE) distribution. For the new distribution we calculate the moments, moment generating function, mean deviation, reliability and order statistics. We define a log-generalized gamma geometric exponentiated regression model. The methods used to estimate the model parameters are: maximum likelihood and bayesian. Finally, we illustrate the potentiality of the new distribution by means of an application to a real data set. Análise de sobrevivência Distribuições (Probabilidade) Distributions (Probability) Máxima verossimilhança Maximum likelihood Modelos de regressão Regression models Survival analysis
28	Estimativa de propriedades físicas e mecânicas de Pinus sp. por colorimetria / Estimative of physical and mechanical properties of Pinus sp. by colorimetry Lucas José Marini 01 February 2019 (has links) A possibilidade de utilização da técnica de colorimetria para obter informações relevantes das peças de Pinus é uma excelente alternativa, uma vez que o colorímetro é um equipamento de fácil manuseio e rápida aquisição de dados, e o uso de madeira de florestas plantadas é crescente no Brasil. O objetivo desta pesquisa foi gerar modelos de regressão para estimativa da densidade aparente e das propriedades mecânicas (resistência e módulo de elasticidade) em função de parâmetros colorimétricos. Nesta pesquisa, 403 amostras de Pinus sp. foram caracterizadas de acordo com o sistema CIE Lab, utilizando um colorímetro Konica Minolta. A densidade aparente, a resistência à compressão paralela às fibras e o módulo de elasticidade na compressão paralela às fibras das 403 amostras também foram determinados, de acordo com as premissas do Anexo B da norma brasileira ABNT NBR 7190 (1997). Foi proposto um modelo de regressão multivariável e testado utilizando análise de variância (ANOVA), ao nível de significância de 5%, para estimar as três propriedades citadas, em função dos parâmetros colorimétricos e do número anéis de crescimento (quantidades de lenho inicial e lenho tardio). Os resultados indicaram que a madeira apresenta coloração branco-amarelada, pois possui valor de luminosidade (L) superior a 54. A pigmentação amarela (b) é a principal responsável pela formação das cores no gênero Pinus. A análise de correlação entre cor, número de lenhos (Nle) e densidade revelou que apenas a luminosidade, o número de lenhos e a interação desses fatores afetaram significativamente os valores de densidade. A diminuição da luminosidade e o aumento na quantidade de lenhos implicam um aumento significativo nos valores de densidade da madeira. A análise de correlação entre cor, número de lenhos e módulo de elasticidade revelou que apenas o número de lenhos afetou significativamente os valores do módulo de elasticidade. O aumento no número lenhos implica aumento significativo no módulo de elasticidade na compressão paralela às fibras. A análise de correlação entre cor, número de lenhos e resistência à compressão paralela às fibras mostrou que apenas os fatores L, a, b e as interações L·b, a·b, afetaram significativamente os valores da resistência. A interação entre os fatores L* e b* implicou na redução dos valores da resistência à compressão paralela às fibras. A técnica de colorimetria mostrou-se adequada para a estimativa de propriedades físico-mecânicas da madeira. / The possibility of using the colorimetric technique to obtain relevant information of Pinus pieces is an excellent alternative, since the colorimeter is an equipment of easy handling and quick data acquisition, and the use of wood from planted forests is growing in Brazil. This research aims to generate regression models to estimate the wood density and mechanical properties (strength and modulus of elasticity) as a function of colorimetric parameters. Here, 403 pieces of Pinus sp. have been characterized according to the CIE Lab* system using a Konica Minolta colorimeter. The apparent density, the compression parallel to the grain strength and the modulus of elasticity in the compression parallel to the grain of the 403 samples were also determined, according to the assumptions of Brazilian standard code ABNT NBR 7190 (1997). It was proposed a multivariate regression model and tested using analysis of variance (ANOVA), at 5% significance level, to estimate the density, the compressive strength and the modulus of elasticity as a function of the colorimetric parameters and the number of tree growth rings (earlywood and latewood). Results indicated that the wood has a yellowish-white coloration, with a value of brightness (L) higher than 54. The yellow pigmentation (b) is the main responsible for the color formation of the genus Pinus. Correlation analysis among color, number of tree growth rings (Nle) and density showed that only the brightness, the number of tree growth rings and the interaction of these factors affected significantly the values of density. Decreasing in brightness and increasing in the number tree growth rings implies a significant increasing in wood density values. Correlation analysis among color, number of tree growth rings and modulus of elasticity showed that only the number of tree growth rings affected significantly the values of modulus of elasticity. Increasing in the number tree growth rings implies a significant increasing in the modulus of elasticity. Correlation analysis among color, number of tree growth rings and compression parallel to the grain strength showed that only the factors L, a, b* and the interactions L* ·b, a· b, affected significantly the values of strength. The interaction between the factors L and b* implied the reduction of the values of the compression parallel to the grain strength. The colorimetric technique was appropriated for estimative of physico-mechanical properties of wood. Pinus Colorimetria Modelos de regressão Propriedades mecânicas Pinus Colorimetry Mechanical properties Regression models
29	Estimação do período de carência de medicamento veterinário em produtos comestíveis (tecidos) de origem animal por modelos de regressão / Estimation of the withdrawal period for veterinary drugs in edible tissues of animal origin by regression models Rosa, Simone Cristina 12 August 2016 (has links) Resíduos de medicamento veterinário podem estar presentes em produtos comestíveis de origem animal, tais como carne, leite, ovos e mel. Para assegurar que a concentração de tais resíduos não excede um limite considerado seguro (Limite Máximo de Resíduo - LMR) deve ser estabelecido o período de carência, que é o tempo que deve ser respeitado para que um animal possa ser enviado para o abate após ter recebido um dado medicamento veterinário. A estimação do período de carência usualmente é feita pelo ajuste de um modelo de regressão linear simples, seguido pelo cálculo de um limite de tolerância. Para isso, os pressupostos de homocedasticidade e de normalidade dos erros do modelo devem ser atendidos. No entanto, violações desses pressupostos são frequentes nos estudos de depleção residual. No presente trabalho foram utilizados dois bancos de dados da quantificação de resíduo de medicamento veterinário em tecidos de bovinos e o período de carência foi estimado para fígado, gordura, músculo e rins. Os modelos de regressão foram ajustados para a média dos resultados de cada animal, para a média dos resultados de cada extração analítica e para os resultados obtidos para cada réplica, sendo que para esta última situação foi ajustado um modelo de regressão linear com efeitos mistos. O modelo linear ajustado para as médias obtidas para cada extração analítica apresentou maior precisão nas estimativas dos parâmetros do modelo e também menor período de carência. No entanto, para esse modelo também foram detectados mais pontos potencialmente influentes comparado aos demais modelos ajustados. Não foi possível calcular o limite de tolerância e, consequentemente, predizer o período de carência quando utilizado o modelo com efeitos mistos. Conclui-se que a o ajuste de outros modelos estatísticos mais robustos e flexíveis deve ser considerado para a estimação do período de carência de medicamento veterinário. / Veterinary drugs residues can be found in foodstuffs of animal origin such as meat, milk, eggs and honey. In order to ensure that the concentration of these residues does not exceed a safe limit (Maximum Residue Limit - MRL) it is necessary to establish a withdrawal period, which is the waiting time necessary for an animal to be sent for slaughtering after having received a veterinary drug. The estimation of the withdrawal period is normally obtained by the fitting of a simple linear regression model, followed by the calculation of a tolerance limit. For this, the assumptions of homoscedasticity and the normality of the errors must be met. However, violations of these assumptions are frequent in the residual depletion studies. In the present study two database of the quantification of veterinary drug residue in bovine tissues were used and the withdrawal period was estimated for liver, fat, muscle and kidneys. The regression models were fitted to the mean value of the results obtained for each animal, to the mean value of the results obtained for each analytical extraction and to the results obtained for the repeated sample measurements, and a linear mixed model was fitted for this later situation. The linear model fitted to the mean value of the results obtained for each analytical extraction showed greater precision in the parameters estimates of the model as well as shorter withdrawal period. However, for this model, more potentially influential points were detected compared to other models fitted. It was not possible to calculate the tolerance limit, and, consequently, to predict the withdrawal period using the mixed effects model. In conclusion, the fitting of the other more robust and flexible statistical models should be considered for the estimation of the withdrawal period of veterinary drug. drug residue linear regression período de carência regressão regressão linear regression models resíduo de medicamento withdrawal period
30	Análise multivariada no mapeamento genético de traços quantitativos / Multivariate analysis in genetic mapping of quantitative traits Esteban Duarte, Nubia 18 June 2007 (has links) Em pesquisa Genômica é de grande interesse o mapeamento de genes que controlam traços ou fenótipos quantitativos. Metodologias estatsticas para identicar genes que tenham efeitos sobre um unico traço são bem conhecidas na literatura e têm sido exaustivamente aplicadas no mapeamento genético de muitas doenças. Porem, na pratica, diferentes traços são correlacionados, como é o caso de hipertensão e obesidade, possivelmente, devido a aço de genes comuns envolvidos na sua regulação. Nestes casos, por meio de tecnicas estatísticas multivariadas, que exploram a estrutura de covariância entre os traços, é possvel identificar genes não detectados por analises univariadas, ganhar precisão nas estimativas dos efeitos e conhecer a posicão desses genes, alem de testar efeitos de pleiotropia (um mesmo gene controlando varios traços) e interacções gene-ambiente (os genes que controlam a pressão antes e depois de dieta com sal). Neste trabalho diferentes alternativas de analise estatstica são consideradas para explorar a informacão de vários tracos conjuntamente: modelo de regressão intervalar multivariado (Jiang & Zeng, 1995), mapeamento multivariado via a teoria espectral (Mangin et al.,1998), via medidas resumo relevantes (como a diferenca entre respostas antes e depois de uma exposição) e via ajustes por covariaveis. Também são introduzidas algumas abordagens graficas para o estudo do efeito de pleiotropia e interação geneambiente. As metodologias supracitadas são aplicadas a dados reais fornecidos pelo Laboratorio de Cardiologia e Genética Molecular do InCor/USP, que consideram várias medidas de pressão arterial em ratos provenientes de uma população F2. / In Genomic research, the mapping of genes which control quantitative traits has been of great interest. Statistical methods for detection of genes, in uencing a single trait, are well known in the literature and they have been exhaustive used in the genetic mapping of many diseases. However, in real situations, dierent kind of traits are correlated, such as hypertention and obesity, that would be due to the action of a set of commom genes involved in the regulation of these traits. In these cases, through of multivariate statistical techniques, which explore the covariance structure between the traits, it is possible to identify genes that are not detected by univariated analysis. In addition multivariate analysis are useful to obtain accurate estimates and to know the position of these genes, besides testing eects of pleiotropic (a gene controlling several traits) and geneenvironmental interations (genes that control the pressure before and after salt diet). In this work dierent alternatives from statistical analysis are considered to explore information of several traits jointly: Interval multivariate regression models (Jiang and Zeng, 1995); multivariate mapping through the espectral theory (Mangin et al. 1998), summary measures (for example, models formulated in terms of the dierence between two traits) and adjustments including covariates. Also, graphics procedures are introduced in order to study eects of pleiotropy and geneenvironmental interactions . The methodologies mentioned above are applied to real data set, supplied by the Cardiology and Molecular Genetic Laboratory of Heart institute (InCor-USP), that consider several measurements of blood pressure in rats that come from a F2 population. Análise multivariada Efeitos de pleiotropia. effects of pleiotropy. Genetic Mapping Mapeamento genético Modelos de regressão Multivariate analysis Regression models

Search results