• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 251
  • 14
  • 10
  • 1
  • Tagged with
  • 279
  • 195
  • 138
  • 103
  • 76
  • 63
  • 61
  • 59
  • 56
  • 54
  • 51
  • 51
  • 47
  • 42
  • 38
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
221

Estimativa do valor da taxa de penetrância em doenças autossômicas dominantes: estudo teórico de modelos e desenvolvimento de um programa computacional / Penetrance rate estimation for autosomal dominant diseases: study of models and development of a computer program

Andréa Roselí Vançan Russo Horimoto 17 September 2009 (has links)
O objetivo principal do trabalho foi o desenvolvimento de um programa computacional, em linguagem Microsoft Visual Basic 6.0 (versão executável), para estimativa da taxa de penetrância a partir da análise de genealogias com casos de doenças com herança autossômica dominante. Embora muitos dos algoritmos empregados no programa tenham se baseado em idéias já publicadas na literatura (em sua maioria por pesquisadores e pós-graduandos do Laboratório de Genética Humana do Instituto de Biociências da Universidade de São Paulo), desenvolvemos alguns métodos inéditos para lidar com situações encontradas com certa frequência nos heredogramas publicados na literatura, como: a) ausência de informações sobre o fenótipo do indivíduo gerador da genealogia; b) agrupamento de árvores de indivíduos normais sem a descrição da distribuição de filhos entre os progenitores; c) análise de estruturas da genealogia contendo uniões consanguíneas, utilizando um método alternativo ao descrito na literatura; d) determinação de soluções gerais para as funções de verossimilhança de árvores de indivíduos normais com ramificação regular e para as probabilidades de heterozigose de qualquer indivíduo pertencente a essas árvores. Além da versão executável, o programa, denominado PenCalc, é apresentado também numa versão para Internet (PenCalc Web), a qual fornece adicionalmente as probabilidades de heterozigose e o cálculo de afecção na prole de todos os indivíduos da genealogia. Essa versão pode ser acessada livre e gratuitamente no endereço http://www.ib.usp.br/~otto/pencalcweb. Desenvolvemos também um modelo com taxa de penetrância variável dependente da geração, uma vez que a inspeção de famílias com doenças autossômicas dominantes, como é o caso da síndrome da ectrodactilia associada à hemimelia tibial (EHT), sugere a existência de um fenômeno similar à antecipação, em relação à taxa de penetrância. Os modelos com taxa de penetrância constante e variável, e os métodos desenvolvidos neste trabalho foram aplicados a 21 heredogramas de famílias com afetados pela EHT e ao conjunto das informações de todas essas genealogias (meta-análise), obtendo-se em todos os casos estimativas da taxa de penetrância. / The main objective of this dissertation was the development of a computer program, in Microsoft® Visual Basic® 6.0, for estimating the penetrance rate of autosomal dominant diseases by means of the information contained on genealogies. Some of the algorithms we used in the program were based on ideas already published in the literature by researchers and (post-) graduate students of the Laboratory of Human Genetics, Department of Genetics and Evolutionary Biology, Institute of Biosciences, University of São Paulo. We developed several other methods to deal with particular structures found frequently in the genealogies published in the literature, such as: a) the absence of information on the phenotype of the individual generating of the genealogy; b) the grouping of trees of normal individuals without the separate description of the offspring number per individual; c) the analysis of structures containing consanguineous unions; d) the determination of general solutions in simple analytic form for the likelihood functions of trees of normal individuals with regular branching and for the heterozygosis probabilities of any individual belonging to these trees. In addition to the executable version of the program summarized above, we also prepared, in collaboration with the dissertation supervisor and the undergraduate student Marcio T. Onodera (main author of this particular version), another program, represented by a web version (PenCalc Web). It enables the calculation of heterozygosis probabilities and the offspring risk for all individuals of the genealogy, two details we did not include in the present version of our program. The program PenCalc Web can be accessed freely at the home-page address http://www.ib.usp.br/~otto/pencalcweb. Another important contribution of this dissertation was the development of a model of estimation with generationdependent penetrance rate, as suggested by the inspection of families with some autosomal dominant diseases, such as the ectrodactyly-tibial hemimelia syndrome (ETH), a condition which exhibits a phenomenon similar to anticipation in relation to the penetrance rate. The models with constant and variable penetrance rates, as well as practically all the methods developed in this dissertation, were applied to 21 individual genealogies from the literature with cases of ETH and to the set of all these genealogies (meta-analysis). The corresponding results of all these analysis are comprehensively presented.
222

Redes neurais artificiais auto-organizáveis na classificação não-supervisionada de imagens multiespectrais de sensoriamento remoto / Self-organizing artificial neural networks in the unsupervised classification of multispectral remote sensing imagery

Christopher Silva de Pádua 14 October 2016 (has links)
O uso de imagens provenientes de sensores remotos, tal como sistemas acoplados em aviões e satélites, é cada vez mais frequente, uma vez que permite o monitoramento continuo e periódico ao longo do tempo por meio de diversas observações de uma mesma região, por vezes ampla ou de difícil acesso. Essa ferramenta tem se mostrado importante e significativa em aplicações como o mapeamento de solo e fronteiras; acompanhamento de áreas de desmatamento, queimadas e de produção agrícola. Para gerar resultados interpretáveis ao usuário final, essas imagens devem ser processadas. Atualmente, o método de classificação por máxima verossimilhança é o mais empregado para classificação de imagens multiespectrais de sensores remotos, entretanto, por se tratar de uma técnica supervisionada, seus resultados dependem extensivamente da qualidade do conjunto de treinamento, utilizado para definir os parâmetros do método. A seleção de um bom conjunto de treinamento é um processo custoso e inviabiliza a automação da classificação para diversas imagens. O método de classificação por máxima verossimilhança é também paramétrico e portanto exitem algumas suposições quanto a distribuição dos dados que devem ser atendidas, caso contrário a aplicação do método pode gerar resultados ruins. Tendo em vista essas desvantagens do método da máxima verossimilhança, este trabalho propõe um novo método para a classificação de imagens multiespectrais provenientes de sensores remotos de forma que o procedimento seja autônomo, veloz e preciso, minimizando dessa forma os possíveis erros humanos inseridos em etapas intermediárias do processo, tal como a definição de conjuntos de treinamento. O método aqui proposto pertence ao conjunto das redes neurais artificiais (RNAs) e é denominado growing neural gas (GNG). Este método baseia-se no aprendizado não supervisionado de padrões \"naturais\" dentro de um conjunto de dados por meio da criação e adaptação de uma rede mínima de neurônios. Os resultados gerados a partir da classificação pela RNA foram comparados com os métodos mais utilizados na literatura atual, sendo eles o método da máxima verossimilhança e o método k-means. A partir da biblioteca espectral ASTER, mantida e criada parcialmente pela NASA, foram realizadas várias repetições do experimento, que consiste em classificar os dados de acordo com as diferentes classes existentes, e para cada uma destas repetições calculou-se uma medida de acurácia, denominada índice kappa, além do tempo de execução de cada método, de forma que suas médias foram comparadas via intervalo de confiança gerados por bootstrap não paramétrico. Também investigou-se como a análise de componentes principais (ACP), técnica utilizada para reduzir a dimensão dos dados e consequentemente o custo computacional, pode influenciar no desempenho dos métodos, tanto em sua qualidade de classificação quanto em relação ao tempo de execução. Os resultados mostram que o método proposto é superior nos dois aspectos estudados, acurácia e tempo de execução, para a maioria dos fatores aplicados. Mostra-se ainda um exemplo de aplicação prática em que uma imagem multiespectral de satélite não satisfaz as pré-suposições estabelecidas para o uso do método da máxima verossimilhança e verifica-se a diferença entre os métodos com relação a qualidade final da imagem classificada. / The use of images from remote sensors, such as coupled systems in airplanes and satellites, are increasingly being used because they allow continuous and periodic surveillance over time through several observations of some particular area, sometimes large or difficult to access. This sort of image has shown an important and meaningful participation in applications such as soil and borders mapping; surveillance of deforestation, forest fires and agricultural production areas. To generate interpretable results to the end user, these images must be processed. Currently, the maximum likelihood classification method is the most used for multispectral image classification of remote sensing, however, because it is a supervised technique, the results depend extensively on the quality of the training set, used to define the parameters of the method. Selecting a good training set is a costly process and prevents the automation of classification for different images. The maximum likelihood classification method is also parametric, and therefore, some assumptions about the distribution of the data must be met, otherwise the application of the method can generate bad results. In view of these disadvantages of the maximum likelihood method, this dissertation proposes a new, autonomous, fast and accurate method for multispectral remote sensing imagery classification thereby minimizing the possible human errors inserted at intermediate stages of the process, such as the definition of training sets. The method proposed here belongs to the set of artificial neural networks (ANN) and is called growing neural gas (GNG). This method is based on unsupervised learning of \"natural\" patterns in a dataset through the creation and adaptation of a minimum network of neurons. The results generated from the classification by ANN were compared with the most commonly used methods in the literature: the maximum likelihood method and the k-means method. From the spectral library Aster, maintained and made in part by NASA, several replications of the experiment were made, which is to classify the data according to different preestablished classes, and a measure of accuracy called kappa index was calculated for each of the replicates, in addition to the execution time of each method, so that their means were compared via confidence interval generated by nonparametric bootstrap. It was additionally investigated how principal component analysis (PCA), technique which reduces dimension of data and consequently the computational cost, can influence the performance of methods, both in its quality rating and runtime. The results show that the proposed method is superior in both aspects studied, accuracy and runtime, for the majority of applied factors. Furthermore, it is shown an example of a practical application in which a multispectral satellite image does not necessarily meet the established assumptions for using the maximum likelihood method, and there is a difference between the methods, regarding to its final classified image quality.
223

Bayesian and classical inference for extensions of Geometric Exponential distribution with applications in survival analysis under the presence of the data covariated and randomly censored /

Gianfelice, Paulo Roberto de Lima. January 2020 (has links)
Orientador: Fernando Antonio Moala / Abstract: This work presents a study of probabilistic modeling, with applications to survival analysis, based on a probabilistic model called Exponential Geometric (EG), which o ers great exibility for the statistical estimation of its parameters based on samples of life time data complete and censored. In this study, the concepts of estimators and lifetime data are explored under random censorship in two cases of extensions of the EG model: the Extended Geometric Exponential (EEG) and the Generalized Extreme Geometric Exponential (GE2). The work still considers, exclusively for the EEG model, the approach of the presence of covariates indexed in the rate parameter as a second source of variation to add even more exibility to the model, as well as, exclusively for the GE2 model, a analysis of the convergence, hitherto ignored, it is proposed for its moments. The statistical inference approach is performed for these extensions in order to expose (in the classical context) their maximum likelihood estimators and asymptotic con dence intervals, and (in the bayesian context) their a priori and a posteriori distributions, both cases to estimate their parameters under random censorship, and covariates in the case of EEG. In this work, bayesian estimators are developed with the assumptions that the prioris are vague, follow a Gamma distribution and are independent between the unknown parameters. The results of this work are regarded from a detailed study of statistical simulation applied to... (Complete abstract click electronic access below) / Resumo: Este trabalho apresenta um estudo de modelagem probabilística, com aplicações à análise de sobrevivência, fundamentado em um modelo probabilístico denominado Exponencial Geométrico (EG), que oferece uma grande exibilidade para a estimação estatística de seus parâmetros com base em amostras de dados de tempo de vida completos e censurados. Neste estudo são explorados os conceitos de estimadores e dados de tempo de vida sob censuras aleatórias em dois casos de extensões do modelo EG: o Exponencial Geom étrico Estendido (EEG) e o Exponencial Geométrico Extremo Generalizado (GE2). O trabalho ainda considera, exclusivamente para o modelo EEG, a abordagem de presença de covariáveis indexadas no parâmetro de taxa como uma segunda fonte de variação para acrescentar ainda mais exibilidade para o modelo, bem como, exclusivamente para o modelo GE2, uma análise de convergência até então ignorada, é proposta para seus momentos. A abordagem da inferência estatística é realizada para essas extensões no intuito de expor (no contexto clássico) seus estimadores de máxima verossimilhança e intervalos de con ança assintóticos, e (no contexto bayesiano) suas distribuições à priori e posteriori, ambos os casos para estimar seus parâmetros sob as censuras aleatórias, e covariáveis no caso do EEG. Neste trabalho os estimadores bayesianos são desenvolvidos com os pressupostos de que as prioris são vagas, seguem uma distribuição Gama e são independentes entre os parâmetros desconhecidos. Os resultad... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre
224

Contribuições em modelos de regressão com erro de medida multiplicativo / Contributions in regression models with multiplicative measurement error

Silva, Eveliny Barroso da 04 February 2016 (has links)
Em modelos de regressão em que uma covariável é medida com erro, é comum o uso de estruturas que relacionam a covariável observada com a verdadeira covariável não observada. Essas estruturas são usualmente aditivas ou multiplicativas. Na literatura existem diversos trabalhos interessantes que tratam de modelos de regressão com erro de medida aditivo, muitos dos quais são modelos lineares com covariáveis e erro de medida normalmente distribuídos. Para modelos em que o erro de medida é multipicativo, não se encontra na literatura o mesmo desenvolvimento teórico encontrado para modelos em que o erro de medida é aditivo. O mesmo vale para situações em que as suposições de normalidade para as covariáveis e erro de medida não se aplicam. Este trabalho propõe a construção, definição, métodos de estimação e análise de diagnóstico para modelos de regressão com erro de medida multiplicativo em uma das covariáveis. Para esses modelos, consideramos que a variável resposta possa pertencer ou à classe de modelos de regressão série de potências modificadas ou à família exponencial. O rol de distribuições pertencentes à família série de potências modificada é bem abrangente, portanto, neste trabalho, desenvolvemos a teoria de estimação e validação do modelo primeiramente de forma geral e, para exemplificar, apresentamos o modelo de regressão binomial negativa com erro de medida. para o caso em que a variável resposta pertença à família exponencial. apresentamos o modelo de regressão beta com erro de medida multiplicativo. Todos os modelos propostos foram analisados através de estados de simulação e aplicados a conjuntos de dados reais. / In regression models in which a covariate is measured with erros, it is common to use structures that correlate the observed covariate with the true non-observed covariate. Such structures are usually additive or multiplicative. In the literatue there are several interesting works that deal with regression models having an additive measuremsnt error, many of which are linear models with covariate and measurement error normally distributed. For models having a multiplicative measurement error, one does not find in the literature the same theoretical amount of works as one finds for models in which the measurement error is additive. The same happens in situations where the supositions of normality for the covariates and the measurement errors do not apply. The presente work proposes the construction,definition, estimation methods, and diagnostic analysis for the regression models with a multiplicative measurement error in one of the covariates. For these models it is considered that the response variable may belong either to the class of modified power series regression models or to the exponential family. The list of distributions belonging to the family modified power series is rather comprehensive; for this reason this work develops, firstly and in a general way, the models estimation and validation theory, and, as an example, presents the model of negative binomial regression with measurement error. In the case where response variable belongs to the exponential family, the model of beta regression with multiplicative measurement error is presented. All proposed models were analysed through simulationb studies and applied to real data sets.
225

A distribuição beta generalizada semi-normal / The beta generalized half-normal distribution

Pescim, Rodrigo Rossetto 29 January 2010 (has links)
Uma nova família de distribuições denominada distribuição beta generalizada semi-normal, que inclui algumas distribuições importantes como casos especiais, tais como as distribuições semi-normal e generalizada semi-normal (Cooray e Ananda, 2008), é proposta neste trabalho. Para essa nova família de distribuições, foi realizado o estudo da função densidade probabilidade, função de distribuição acumulada e da função de taxa de falha (ou risco), que não dependeram de funções matemáticas complicadas. Obteve-se uma expressão formal para os momentos, função geradora de momentos, função densidade da distribuição de estatística de ordem, desvios médios, entropia, contabilidade e para as curvas de Bonferroni e Lorenz. Examinaram-se os estimadores de máxima verossimilhança dos parâmetros e deduziu- se a matriz de informação esperada. Neste trabalho é proposto, também, um modelo de regressão utilizando a distribuição beta generalizada semi-normal. A utilidade dessa nova distribuição é ilustrada através de dois conjuntos de dados, mostrando que ela é mais flexível na análise de dados de tempo de vida do que outras distribuições existentes na literatura. / A new family of distributions so-called beta generalized half-normal distribution, which includes some important distributions as special cases, such as the half-normal and generalized half-normal (Cooray and Ananda, 2008) distributions, is proposed in this work. For this new family of distributions, we studied the probability density function, cumulative distribution function and failure rate function (or hazard function), which did not depend on complicated mathematical functions. We obtained a formal expression for the moments, moment generating function, density function of order statistics distribution, mean deviation, entropy, reliability and Bonferroni and Lorenz curves. We examined maximum likelihood estimation of parameters and provided the information matrix. This work also proposed a regression model using the beta generalized half-normal distribution. The usefulness of the new distribution is illustrated through two data sets by showing that it is quite °exible in analyzing lifetime data instead other distributions in the literature.
226

Modelo de confiabilidade para sistemas reparáveis considerando diferentes condições de manutenção preventiva imperfeita. / Reliability model to repairable system under different conditions for imperfect preventive maintenance.

Coque Junior, Marcos Antonio 06 October 2016 (has links)
Um sistema reparável opera sob uma estratégia de manutenção que exige ações de recuperação preventiva em tempos pré-definidos e ações de reparo quando ocorre a perda de função do sistema. A manutenção preventiva (MP) é programada periodicamente e muitas vezes possui um intervalo de tempo fixo para ações. No entanto, as atividades de MP podem não restaurar o sistema para uma condição similar ao início de vida deste, mas para uma situação intermediária. Nesse caso, a MP é denominada de imperfeita. Além disso, ao longo da vida do sistema, são executados diferentes planos de manutenção com condições e atividades distintas que podem afetar a intensidade de falha de diferentes maneiras. Para modelar essas características da MP em um sistema reparável, propõe-se uma nova classe de modelo de fator de melhoria, denominado fator de melhoria variável que possibilita a modelagem da situação de manutenção perfeita. A formulação da função de verossimilhança foi desenvolvida para estimação dos parâmetros bem como desenvolvidos testes de verificação da qualidade de ajuste, intervalos de confiança para os parâmetros e otimização da periodicidade de realização da MP com base no enfoque dos novos modelos propostos. Os resultados foram aplicados em dados reais e verificou-se uma parametrização mais flexível a MP imperfeita e maior versatilidade nas análises de confiabilidade do sistema quando utilizado os novos modelos. / A repairable system operates under a maintenance strategy that calls for preventive repair actions at prescheduled times and the repair actions that restore system when failure occurs. The preventive maintenance (PM) is scheduled periodically and it often holds a fixed time interval for PM actions. However, PM activities are generally imperfect and cannot restore the system to as good as new condition but to an intermediate situation, which is called imperfect PM. In addition, throughout system life are implemented diverse maintenance policies with different activities and conditions that may affect the failure intensity in different ways. To model these PM characteristics, proposes a new model class of improvement factor called variable improvement factor that also enables modeling perfect maintenance situation. The likelihood function is developed for parameter estimation as well as goodness-of-fit tests and confidence intervals for the parameters are developed, and optimization of the PM intervals based on the proposed models is presented. The proposed model was applied to a data set and a more flexible parameterization for imperfect PM and greater versatility in the system reliability analysis were verified with the use of the new model.
227

Modelos de regressão beta inflacionados truncados / The truncated inflated beta regression

Pereira, Gustavo Henrique de Araujo 24 May 2012 (has links)
Os modelos de regressão beta e beta inflacionados conseguem ajustar adequadamente grande parte das variáveis do tipo proporção. No entanto, esses modelos não são úteis quando a variável resposta não pode assumir valores no intervalo (0,c) e assume o valor c com probabilidade positiva. Variáveis relacionadas a algum tipo de pagamento limitado entre dois valores, quando estudadas em relação ao seu valor máximo, possuem essas características. Para ajustar essas variáveis, introduzimos a distribuição beta inflacionada truncada (BIZUT), que é uma mistura de uma distribuição beta com suporte no intervalo (c,1) e uma distribuição trinomial que assume os valores zero, um e c. Propomos ainda um modelo de regressão para as situações em que a variável resposta tem distribuição BIZUT. Admitimos que todos os parâmetros da distribuição podem variar em função de variáveis preditoras. Além disso, o modelo permite que o parâmetro conhecido c varie entre as unidades populacionais. Para esse modelo são desenvolvidos diversos aspectos inferenciais, são obtidos resultados para as situações em que c é variável e são conduzidos estudos de simulação de Monte Carlo. Além disso, discutimos análise de resíduos, desenvolvemos análise de influência local e realizamos uma aplicação a dados reais de cartão de crédito. / The beta regression model or the inflated beta regression model may be a reasonable choice to fit a proportion in most situations. However, they do not fit well variables that do not assume values in the open interval (0,c), 0 < c < 1 and assume the c value with positive probability. Variables related to a kind of double bounded payment amount when studied as a proportion of the maximum payment amount have this feature. For these variables, we introduce the truncated inflated beta distribution (TBEINF). This proposed distribution is a mixture of the beta distribution bounded in the open interval (c,1) and a trinomial distribution that assumes the values zero, one and c. This work also proposes a regression model where the response variable is TBEINF distributed. The model allows all the unknown parameters of the conditional distribution of the response variable to be modeled as functions of explanatory variables. Moreover, the model allows nonconstant known parameter c across population units. For this model, some inferential aspects are developed, some results when c is not constant are obtained and Monte Carlo simulation studies are performed. In addition, residual and local influence analysis are discussed and an application to credit card data is presented.
228

Modelos de regressão beta inflacionados / Inflated beta regression models

Ospina Martinez, Raydonal 04 April 2008 (has links)
Nos últimos anos têm sido desenvolvidos modelos de regressão beta, que têm uma variedade de aplicações práticas como, por exemplo, a modelagem de taxas, razões ou proporções. No entanto, é comum que dados na forma de proporções apresentem zeros e/ou uns, o que não permite admitir que os dados provêm de uma distribuição contínua. Nesta tese, são propostas, distribuições de mistura entre uma distribuição beta e uma distribuição de Bernoulli, degenerada em zero e degenerada em um para modelar dados observados nos intervalos [0, 1], [0, 1) e (0, 1], respectivamente. As distribuições propostas são inflacionadas no sentido de que a massa de probabilidade em zero e/ou um excede o que é permitido pela distribuição beta. Propriedades dessas distribuições são estudadas, métodos de estimação por máxima verossimilhança e momentos condicionais são comparados. Aplicações a vários conjuntos de dados reais são examinadas. Desenvolvemos também modelos de regressão beta inflacionados assumindo que a distribuição da variável resposta é beta inflacionada. Estudamos estimação por máxima verossimilhança. Derivamos expressões em forma fechada para o vetor escore, a matriz de informação de Fisher e sua inversa. Discutimos estimação intervalar para diferentes quantidades populacionais (parâmetros de regressão, parâmetro de precisão) e testes de hipóteses assintóticos. Derivamos expressões para o viés de segunda ordem dos estimadores de máxima verossimilhança dos parâmetros, possibilitando a obtenção de estimadores corrigidos que são mais precisos que os não corrigidos em amostras finitas. Finalmente, desenvolvemos técnicas de diagnóstico para os modelos de regressão beta inflacionados, sendo adotado o método de influência local baseado na curvatura normal conforme. Ilustramos a teoria desenvolvida em um conjuntos de dados reais. / The last years have seen new developments in the theory of beta regression models, which are useful for modelling random variables that assume values in the standard unit interval such as proportions, rates and fractions. In many situations, the dependent variable contains zeros and/or ones. In such cases, continuous distributions are not suitable for modeling this kind of data. In this thesis we propose mixed continuous-discrete distributions to model data observed on the intervals [0, 1],[0, 1) and (0, 1]. The proposed distributions are inflated beta distributions in the sense that the probability mass at 0 and/or 1 exceeds what is expected for the beta distribution. Properties of the inflated beta distributions are given. Estimation based on maximum likelihood and conditional moments is discussed and compared. Empirical applications using real data set are provided. Further, we develop inflated beta regression models in which the underlying assumption is that the response follows an inflated beta law. Estimation is performed by maximum likelihood. We provide closed-form expressions for the score function, Fishers information matrix and its inverse. Interval estimation for different population quantities (such as regression parameters, precision parameter, mean response) is discussed and tests of hypotheses on the regression parameters can be performed using asymptotic tests. We also derive the second order biases of the maximum likelihood estimators and use them to define bias-adjusted estimators. The numerical results show that bias reduction can be effective in finite samples. We also develop a set of diagnostic techniques that can be employed to identify departures from the postulated model and influential observations. To that end, we adopt the local influence approach based in the conformal normal curvature. Finally, we consider empirical examples to illustrate the theory developed.
229

Modelos de regressão lineares mistos sob a classe de distribuições normal-potência / Linear mixed regression models under the power-normal class distributions

Falon, Roger Jesus Tovar 27 November 2017 (has links)
Neste trabalho são apresentadas algumas extensões dos modelos potência-alfa assumindo o contexto em que as observações estão censuradas ou limitadas. Inicialmente propomos um novo modelo assimétrico que estende os modelos t-assimétrico (Azzalini e Capitanio, 2003) e t-potência (Zhao e Kim, 2016) e inclui a distribuição t de Student como caso particular. Este novo modelo é capaz de ajustar dados com alto grau de assimetria e curtose, ainda maior do que os modelos t-assimétrico e t-potência. Em seguida estendemos o modelo t-potência às situações em que os dados apresentam censura, com alto grau de assimetria e caudas pesadas. Este modelo generaliza o modelo de regressão linear t de Student para dados censurados por Arellano-Valle et al. (2012). O trabalho também introduz o modelo linear misto normal-potência para dados assimétricos. Aqui a inferência estatística é realizada desde uma perspectiva clássica usando o método de máxima verossimilhança junto com o método de integração numérica de Gauss-Hermite para aproximar as integrais envolvidas na função de verossimilhança. Mais tarde, o modelo linear com interceptos aleatórios para dados duplamente censurados é estudado. Este modelo é desenvolvido sob a suposição de que os erros e os efeitos aleatórios seguem distribuições normal-potência e normal- assimétrica. Para todos os modelos estudados foram realizados estudos de simulação a fim de estudar as suas bondades de ajuste e limitações. Finalmente, ilustram-se todos os métodos propostos com dados reais. / In this work some extensions of the alpha-power models are presented, assuming the context in which the observations are censored or limited. Initially we propose a new asymmetric model that extends the skew-t (Azzalini e Capitanio, 2003) and power-t (Zhao e Kim, 2016) models and includes the Students t-distribution as a particular case. This new model is able to adjust data with a high degree of asymmetry and cursose, even higher than the skew-t and power-t models. Then we extend the power-t model to situations in which the data present censorship, with a high degree of asymmetry and heavy tails. This model generalizes the Students t linear censored regression model t by Arellano-Valle et al. (2012) The work also introduces the power-normal linear mixed model for asymmetric data. Here statistical inference is performed from a classical perspective using the maximum likelihood method together with the Gauss-Hermite numerical integration method to approximate the integrals involved in the likelihood function. Later, the linear model with random intercepts for doubly censored data is studied. This model is developed under the assumption that errors and random effects follow power-normal and skew-normal distributions. For all the models studied, simulation studies were carried out to study their benefits and limitations. Finally, all proposed methods with real data are illustrated.
230

Ajuste e seleção de modelos na descrição de comunidades arbóreas: estrutura, diversidade e padrões espaciais / Model fit and selection in the description of tree communities: structure, diversity and spatial patterns

Lima, Renato Augusto Ferreira de 15 August 2013 (has links)
A descrição de padrões, i.e., tendências ou arranjos não aleatórios em comunidades, possui um longo histórico em ecologia vegetal. Comumente, a estrutura e diversidade de comunidades vegetais são descritas a partir de sua distribuição em classes de tamanho (SDD), distribuição espacial (SSD) e de sua distribuição abundância de espécies (SAD). Isto porque há um pressuposto de que padrões existentes nestes descritores de comunidades são assinaturas de processos fundamentais na sua organização e funcionamento. Assim, a descrição de padrões é com frequência o primeiro passo para gerar ou testar hipóteses sobre esses processos que regulam a estrutura e diversidade de comunidades. Organizada em diferentes capítulos, esta tese teve como objetivo central descrever e comparar padrões em diferentes comunidades arbóreas Neotropicais, buscando gerar hipóteses sobre os processos que regulam sua organização e funcionamento. Para tanto, buscou-se utilizar uma abordagem de inferência baseada no ajuste e seleção de modelos, que foi realizado usando máxima verossimilhança estatística. Em todos os capítulos, os dados sobre as comunidades arbóreas são oriundos de diferentes parcelas florestais permanentes, quatro delas com 10,24 hectares, localizadas no Brasil, e outra com 50 hectares, localizada no Panamá. Além da introdução geral sobre os conceitos e técnicas utilizadas nesta tese (Capítulo 1), foram avaliados e comparados: (i) os descritores básicos da estrutura florestal (i.e. abundância, área basal e riqueza de espécies por sub-parcela - Capítulo 2); (ii) a SAD e como ela varia com o aumento da escala e tamanho amostral (Capítulo 3); (iii) a SDD e como ela se relaciona com a demografia das espécies (Capítulo 4.1 e 4.2); e, por fim, (iv) a SSD e como ela varia entre parcelas permanentes (Capítulo 5). Apenas a relação entre a SDD e a demografia das espécies foi realizada como os dados da parcela panamenha, enquanto que os demais capítulos se referem as quatro parcelas brasileiras. Cada capítulo utilizou métodos e modelos probabilísticos distintos para a descrição e comparação das variáveis de interesse. O Capítulo 2 mostrou que os descritores básicos florestais foram muito diferentes entre as quatro parcelas brasileiras. Estes descritores foram raramente normais nas escalas estudadas e as diferenças entre as parcelas foram mais evidentes quando a variância é considerada, fornecendo informações extras sobre os processos geradores de variabilidade dentro das parcelas. O Capítulo 3 mostrou que a mudança no formato da SAD com o aumento da escala é predominantemente um efeito indireto do tamanho da amostra. Assim, pode haver um efeito de escala, mas esse efeito é pequeno e parece depender do grau de similaridade de espécies entre amostras. No capítulo 4.1, foi necessária uma combinação de quatro diferentes distribuições de probabilidade para descrever a ampla gama de SDD, visto que os modelos candidatos raramente foram adequados para a maioria das espécies. No capítulo 4.2, verificou-se que o crescimento e recrutamento determinam o formato da SDD, o que não aconteceu com a mortalidade. No geral, curvas decrescentes de crescimento por diâmetro (i.e., maior crescimento juvenil) levaram à SDD menos íngremes, enquanto que taxas altas de recrutamento estiveram relacionadas à SDD mais íngremes. Apesar das previsões da teoria de equilíbrio demográfico terem apresentado relações positivas com as SDD observadas, houve muita variação, fazendo com que as previsões fossem pouco confiáveis. No capítulo 5, confirmou-se que a grande maioria das espécies se distribui de maneira agregada no espaço. No entanto, as parcelas apresentaram diferentes padrões de intensidade e tamanho de agregação. As diferenças nestes padrões entre parcelas foram, em geral, similares àquelas encontradas ao comparar populações de uma mesma espécie entre parcelas. Assim, as parcelas permanentes brasileiras apresentaram padrões bem distintos umas das outras, tanto em termos de estrutura quanto de diversidade de espécies, padrões estes que provavelmente foram determinados pelas condições ambientais as quais estas comunidades estão sujeitas. Diferentes padrões também foram encontrados em relação à distribuição espacial das espécies (i.e. frequência, intensidade e tamanho de agregação). Contudo, os resultados sugeriram que estes padrões estiveram mais ligados a heterogeneidade ambiental interna das parcelas do que com condições de clima e solo as quais estas comunidades estão sujeitas. Por outro lado, os padrões de distribuição espacial das espécies parecem ter influenciado os padrões de diversidade das comunidades. Não houve, entretanto, um número suficiente de parcelas sob as diferentes combinações de condições ambientais para testar estas sugestões ou para fazer generalizações para cada formação florestal, sendo necessário o confronto destas sugestões com outros estudos realizados em condições similares. Já na parcela panamenha, foi confirmada a expectativa teórica de que distribuições diamétricas refletem a demografia das espécies, em especial os padrões de crescimento e recrutamento. Mas, houve grande variação entre as espécies, dificultando a inferência precisa de padrões demográficos passados das espécies a partir de SDD atuais. Por fim, a abordagem analítica baseada no ajuste e seleção de modelos por máxima foi uma alternativa viável, flexível e apropriada, principalmente em relação à comparação simultânea de diferentes modelos e à busca de processos por trás dos padrões encontrados. Apesar de algumas limitações de cunho operacional, a abordagem baseado em modelos é uma alternativa adequada para a descrição de comunidades arbóreas, podendo ser utilizada de maneira consorciada com outras abordagens (e.g. testes de hipóteses) para descrever padrões e para gerar ou testar hipóteses sobre esses processos fundamentais que regulam a estrutura e diversidade destas comunidades. / Pattern description - search for trends or non-random arrangements in communities, has a long history in plant ecology. Commonly, the structure and diversity of plant communities are described based on their size class distribution (SDD), spatial distribution (SSD) and species abundance distribution (SAD). This is because there is an underlying assumption that the existing patterns in these community descriptors are signatures of key processes determining their organization and functioning. Thus, pattern description is often the first step to generate or test hypotheses about the processes governing community structure and diversity. Organized in different chapters, the main goal of this thesis was to describe and compare different patterns in Neotropical tree communities and to generate hypotheses about the processes that regulate them. To do so we used an approach based on model selection, which was performed using maximum likelihood. In all chapters the data on tree communities came from different permanent forest plots, four of them of 10.24 ha located in Brazil and another 50 ha located in Panama. In addition to the general introduction of key concepts and techniques used along the thesis (Chapter 1), it was evaluated and compared: (i) the basic forest descriptors (i.e. abundance, basal area and species richness per subplot - Chapter 2), (ii) the SAD and how it varies with increasing sample size and scale (Chapter 3), (iii) the SDD and how it relates to species demography (Chapter 4.1 and 4.2) and, finally, (iv) the SSD and how it varies between plots (Chapter 5). Only the relationship between SDD and species demography o was performed using the Panama plot data, while the remaining chapters relate the four Brazilian plots. Each chapter used different methods and probabilistic models for the description and comparison of the variables of interest. In Chapter 2, it was found that basic forest descriptors were very different between the four Brazilian plots. These descriptors were rarely normal at the studied scales and differences between plots were more evident when variance is accounted for, which seems to provide information on processes generating within-plot variability. Chapter 3 showed that the change in shape of the SAD due to increasing scale is predominantly an indirect effect of sample size. Thus, there may be an effect of the scale, but this effect is minor and seems to depend on the degree of species turnover between samples. In Chapter 4.1, it was shown that the combination of four different probability distributions was necessary to describe the wide range of SDD, since models were rarely appropriate for the majority of tree species. In Chapter 4.2, it was found that growth and recruitment, but not mortality, shape the SDD. On average, decreasing growth-diameter curves (i.e. higher juvenile growth) were associated to less steep SDD, whereas high recruitment rates were related to steeper SDD. Although the predictions of demographic equilibrium theory were positively related to the observed SDD, there was lots of variation, making predictions quite unreliable. In Chapter 5, it was confirmed that the great majority of species had clumped spatial distributions. However, the results of intensity and size of clumps showed that the patterns of aggregation were different among plots. Species shared between two plots generally showed patterns of spatial distribution that matched the patterns found for individual plots. Therefore, the Brazilian plots presented very distinct patterns, both in terms of structure and species diversity, which were most probably determined by the environmental conditions to which these communities are subjected. Different patterns among plots were also found in respect to species spatial distribution (i.e. frequency, intensity and size of aggregation). However, the results suggested that these patterns were more connected to within-plot environmental heterogeneity than with climate and soil conditions. On the other hand, the spatial distribution of the species seems to have influenced the patterns of diversity of communities. There was not, however, a sufficient number of plots under different combinations of environmental conditions to test these suggestions or to make generalizations for each forest type, being necessary to confront these suggestions with other studies conducted in similar conditions. In the Panamanian plot, it was confirmed the theoretical expectation that diameter distributions reflect the demographics of the species, in particular the patterns of growth and recruitment. But there was great variability among species, making it difficult to infer past demographic patterns from current SDD. Finally, the analytical approach based on model fit and selection by maximum likelihood was a viable, flexible and appropriate approach, particularly in respect to the simultaneous comparison of different models and to the search for mechanisms underlying patterns. Despite some more operational limitations, the model-based approach is an appropriate alternative for the description of tree communities and can be jointly used with other approaches (e.g. hypothesis testing) for pattern description and to generate and test hypotheses on the fundamental processes that determine the structure and diversity of these communities.

Page generated in 0.1675 seconds