Global ETD Search

61	Analysis of Binary Data via Spatial-Temporal Autologistic Regression Models Wang, Zilong 01 January 2012 (has links) Spatial-temporal autologistic models are useful models for binary data that are measured repeatedly over time on a spatial lattice. They can account for effects of potential covariates and spatial-temporal statistical dependence among the data. However, the traditional parametrization of spatial-temporal autologistic model presents difficulties in interpreting model parameters across varying levels of statistical dependence, where its non-negative autocovariates could bias the realizations toward 1. In order to achieve interpretable parameters, a centered spatial-temporal autologistic regression model has been developed. Two efficient statistical inference approaches, expectation-maximization pseudo-likelihood approach (EMPL) and Monte Carlo expectation-maximization likelihood approach (MCEML), have been proposed. Also, Bayesian inference is considered and studied. Moreover, the performance and efficiency of these three inference approaches across various sizes of sampling lattices and numbers of sampling time points through both simulation study and a real data example have been studied. In addition, We consider the imputation of missing values is for spatial-temporal autologistic regression models. Most existing imputation methods are not admissible to impute spatial-temporal missing values, because they can disrupt the inherent structure of the data and lead to a serious bias during the inference or computing efficient issue. Two imputation methods, iteration-KNN imputation and maximum entropy imputation, are proposed, both of them are relatively simple and can yield reasonable results. In summary, the main contributions of this dissertation are the development of a spatial-temporal autologistic regression model with centered parameterization, and proposal of EMPL, MCEML, and Bayesian inference to obtain the estimations of model parameters. Also, iteration-KNN and maximum entropy imputation methods have been presented for spatial-temporal missing data, which generate reliable imputed values with the reasonable efficient imputation time. Autologistic regression models Binary data Imputation Spatial-temporal process Biostatistics Statistical Models
62	Modelos Beta-Binomial/Poisson-Gama para contagens bivariadas repetidas / Beta-binomial/gamma-Poisson regression models for repeated bivariate counts Lora, Mayra Ivanoff 01 December 2008 (has links) Em Lora e Singer (Statistics in Medicine, 2008), propusemos um modelo Beta- Binomial/Poisson p-variado para análise dos dados provenientes de um estudo que consistiu em contar o número de tentativas e acertos de um exercício manual com duração de um minuto realizado por doentes de Parkinson, antes e depois de um treinamento. O objetivo era verificar se o treinamento aumentava o número de tentativas e a porcentagem de acerto, o que destaca o aspecto bivariado do problema. Esse modelo leva tais características em consideração, usa uma distribuição adequada para dados de contagem e ainda acomoda a sobredispersão presente na contagem dos acertos. Como generalização, inicialmente, propomos um modelo Beta-Binomial/Poisson-Gama que acomoda sobredispersão também para as contagens dos totais de tentativas, além incluir covariâncias possivelmente diferentes entre as contagens em diversos instantes de avaliação. Neste novo modelo, introduzimos um parâmetro que relaciona o total de tentativas com a probabilidade de acerto, tornando-o ainda mais geral. Obtemos estimadores de máxima verossimilhança dos parâmetros utilizando um algoritmo de Newton-Raphson. Consideramos um outro conjunto de dados provenientes do mesmo estudo para ilustração da metodologia proposta. / In Lora and Singer (Statistics in Medicine, 2008), we proposed a Beta-Binomial/Poisson p-variate model to analyze data from a study which consists in counting the number of trials and successes of a manual exercise in one minute periods, done by Parkinsons disease patients, before and after a training. The purpose was to verify if the training improves the number of trials and the percentage of success, which emphasizes the bivariate aspect of the problem. This model considers these characteristics, uses an adequate distribution to count data and settles the overdispersion suggested in the number os successes. As a generalization, initially, we propose a Beta-Binomial/Poisson-Gama model which also settles the overdispersion suggested by the total number of trials, besides includes possible different covariances between total trial counts in different evaluation instants. In this new model, we introduce a parameter that links the total trials with the success probability, making it even more general. We obtain maximum likelihood estimators for the parameters using an Newton-Raphson algorithm. We consider another data from the same study to illustrate the proposal methodology. bivariate counts contagens bivariadas dados longitudinais efeitos aleatórios longitudinal data modelos de regressão overdispersion random effects regression models sobredispersão
63	Modelos de regressão para variáveis categóricas ordinais com aplicações ao problema de classificação / Regression models for ordinal categorical variables with applications to the classification problem Okura, Roberta Irie Sumi 11 April 2008 (has links) Neste trabalho, apresentamos algumas metodologias para analisar dados que possuem variável resposta categórica ordinal. Descrevemos os principais Modelos de Regressão conhecidos atualmente que consideram a ordenação das categorias de resposta, entre eles: Modelos Cumulativos e Modelos Sequenciais. Discutimos também o problema de discriminação e classificação de elementos em grupos ordinais, comentando sobre os preditores mais comuns para dados desse tipo. Apresentamos ainda a técnica de Análise Discriminante Ótima e sua versão aprimorada, baseada na utilização de métodos bootstrap. Por fim, aplicamos algumas das técnicas descritas a dados reais da área financeira, com o intuito de classificar possíveis clientes, no momento da aquisição de um cartão de crédito, como futuros bons, médios ou maus pagadores. Para essa aplicação, discutimos as vantagens e desvantagens dos modelos utilizados em termos de qualidade da classificação. / In this work, some methods to analyse data with ordinal categorical response are presented. We describe the most important and widely used Regression Models which consider the ordering of response categories like: Cumulative Models and Sequential Models. We also discuss the problem of how to discriminate and classify elements in ordinal groups, commenting on the most common predictors to this kind of data. Also we present the technique known as optimal discriminant analysis and its improved version, based on the use of bootstrap methods. Finally, we apply some of the described techniques to real financial data, intending to classify possible consumers, on acquistion of a credit card, as high, medium and low risk customers. With this application, we discuss the advantages and disadvantages of the models used in terms of quality of classification. classificação classification discriminação ordinal modelos de regressão ordinais ordinal categorical variables ordinal discrimination ordinal regression models variáveis categóricas ordinais
64	Classificação da variação, tamanho ótimo de parcela e curva de crescimento para experimentos com eucalipto / Lopes, Beatriz Garcia January 2019 (has links) Orientador: Glaucia Amorim Faria / Resumo: O eucalipto é difundido em várias regiões brasileiras e no mundo. Os Estados brasileiros com maiores áreas de plantio do eucalipto são Minas Gerais, Mato Grosso do Sul, São Paulo e Paraná. Com crescente contribuição ao longo dos anos, o seu cultivo tem gerado empregos tanto na área rural quanto na área urbana. O que torna de suma importância maiores pesquisas que visem a melhoria das áreas de plantio, maiores informações para condução e melhoria de produção, o que acarretará em maiores ofertas para o mercado nacional. Neste cenário, estudos que auxiliem o pesquisador a conhecer a variabilidade desta cultura, definir o tamanho ideal de parcela e as curvas de crescimento que melhor representem o conjunto de dados ao longo do tempo, serão essenciais para que se faça a inferência correta, se tenha maior precisão e maximização das informações, garantindo maior eficiência do procedimento experimental, como redução do tempo de espera, permitindo ao pesquisador a comparação do comportamento da planta e seus componentes mais relevantes. Para tanto, o trabalho tem por objetivo: a recomendação de uma tabela de classificação de variação (utilizando os métodos de Garcia, Pimentel-Gomes e Costa, Seraphin e Zimmermann); o tamanho ótimo de parcelas (utilizando o método da máxima curvatura modificada) em experimentos em casa de vegetação; o modelo não-linear (Logístico, Gompertz e Von Bertalanffy) que melhor se adeque ao padrão de crescimento ao longo do tempo, em experimentos com a cultura d... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Eucalyptus is widespread in several Brazilian regions and in the world. The Brazilian states with the largest eucalyptus plantation areas are Minas Gerais, Mato Grosso do Sul, São Paulo, and Paraná. With growing contribution over the years, its cultivation has generated jobs in both rural and urban areas. This makes more important research to improve the planting areas, greater information for conducting and improving production, which will lead to greater offers for the domestic market. In this scenario, studies that help the researcher to know the variability of this crop, to define the ideal plot size and the growth curves that best represent the data set over time, will be essential for correct inference, if greater accuracy and maximization of information, guaranteeing greater efficiency of the experimental procedure, such as reduction of waiting time, allowing the researcher to compare the behavior of the plant and its most relevant components. To do so, the objective of the study is: to recommend a variation classification table (using the methods of Garcia, Pimentel-Gomes and Costa, Seraphin and Zimmermann); the optimal size of plots (using the modified maximum curvature method) in greenhouse experiments; the non-linear model (Logistic, Gompertz and Von Bertalanffy) that best fit the pattern of growth over time, in experiments with the Eucalyptus crop. / Mestre Precisão experimental Máxima curvatura modificado Modelos de regressão não lineares Experimental precision Maximum modified curvature Non-linear regression models
65	Dados hiperespectrais para predição do teor foliar de nitrogênio em cana-de-açúcar / Hyperspectral data to predict sugarcane leaf nitrogen content Martins, Juliano Araújo 17 February 2016 (has links) Uma das alternativas bastante abordada na literatura para a melhoria do gerenciamento da adubação nitrogenada nas culturas é o sensoriamento remoto, tendo destaque a utilização de sensores espectrais na região do visível e infravermelho. Neste trabalho, buscou-se estabelecer as relações existentes entre variações no teor foliar de nitrogênio (TFN) e a resposta espectral da folha de cana-de-açúcar, utilizando um sensor hiperespectral, com avaliações em três áreas experimentais do estado de São Paulo, com diferentes solos e variedades. Cada experimento foi alocado em blocos ao acaso, com parcelas subdividas e quatro repetições. Foram aplicadas doses de 0, 50, 100 e 150 kg de nitrogênio por hectare. A análise espectral foi realizada na folha \"+1\" em laboratório, sendo coletadas 10 folhas por subparcela, estas foram posteriormente submetidas a análise química para o TFN. Observou-se que existe correlação significativa entre o TFN e as variações na resposta espectral da cana-de-açúcar, sendo que a região do verde e de transição entre o vermelho e o infravermelho próximo (\"red-edge\") foram as mais consistentes e estáveis entre as áreas em estudo e safras avaliadas. A análise de componentes principais permitiu reforçar estes resultados, uma vez que as pontuações (\"scores\") dos componentes que apresentaram correlações significativas com o TFN, tiveram maiores pesos (\"loadings\") nas regiões espectrais citadas anteriormente. A partir das curvas espectrais foram também realizados os cálculos dos índices de vegetação já descritos em literatura, e estes submetidos a análise de regressão simples para predição do TFN, sendo os modelos calibrados com dados da safra 2012/13 e validados com os dados da safra 2013/14. Índices espectrais calculados com a combinação dos comprimentos de onda do verde e/ou \"red-edge\" com comprimentos de onda do infravermelho próximo tiveram bom desempenho na fase de validação, sendo que os cinco mais estáveis foram os índices BNi (500, 705 e 750 nm), GNDVI (550 e 780 nm), NDRE (790 e 720 nm), RI-1db (735 e 720 nm) e VOGa (740 e 720 nm). A variedade SP 81 3250 foi cultivada nas três áreas experimentais, o que permitiu a comparação do potencial de modelos calibrados por área, com um modelo generalista para uma mesma variedade cultivada em diferentes condições edáficas. Observou-se que embora o modelo generalista apresente parâmetros estatísticos significativos, existe redução expressiva da sensibilidade de predição quando comparado aos modelos calibrados por área experimental. Empregou-se também nesta pesquisa a análise de regressão linear múltipla por \"stepwise\" (RLMS) que gerou modelos com boa precisão na estimativa do TFN, mesmo quando calibrados por área experimental, independentes da variedade, utilizando de 5 a 6 comprimentos de onda. Concluímos com a presente pesquisa que comprimentos de onda específicos estão associados a variação do TFN em cana-de-açúcar, e estes são reportados na região do verde (próximos a 550 nm) e na região de transição entre os comprimentos de onda do vermelho e infravermelho próximo (680 a 720 nm). Apesar da baixa correlação entre a região do infravermelho próximo com o TFN, índices de vegetação calculados a partir destes comprimentos de onda ou a inserção destes na geração de modelos lineares foram importantes para melhorar a precisão da predição. / An alternative method, quite cited in literature to improve nitrogen fertilization management on crops is the remote sensing, highlighted with the use of spectral sensors in the visible and infrared region. In this work, we sought to establish the relationship between variations in leaf nitrogen content and the spectral response of sugarcane leaf using a hyperspectral sensor, with assessments in three experimental areas of São Paulo state, Brazil, with evaluations in different soils and varieties. Each experimental area was allocated in randomized block, with splitted plots and four repetition, hence, receiving doses of 0, 50, 100 and 150 kg of nitrogen per hectare. Spectral analysis was performed on the \"+1\" leaf in laboratory; we collected 10 leaves per subplots; which were subsequently subjected to chemical analysis to leaf nitrogen content determination. We observed a significant correlation between leaf nitrogen content and variations in sugarcane spectral response, we noticed that the region of the green light and red-edge were the most consistent and stable among the studied area and the crop seasons evaluated. The principal component analysis allowed to reinforce these results, since that the scores for principal components showed significant correlations with the leaf nitrogen content, had higher loadings values for the previous spectral regions mentioned. From the spectral curves were also performed calculations of spectral indices previously described in literature, being these submitted to simple regression analysis to direct prediction of leaf nitrogen content. The models were calibrated with 2012/13 and validated with 2013/14 crop season data. Spectral indices that were calculated with green and/or red-edge, combined with near-infrared wavelengths performed well in the validation phase, and the five most stable were the BNi (500, 705 and 750 nm), GNDVI (550 and 780 nm), NDRE (790 and 720 nm), IR-1dB (735 and 720 nm) and VOGa (740 and 720 nm). The variety SP 81 3250 was cultured in the three experimental areas, allowing to compare the performance of a specific site model with a general model for the same variety growing on different soil conditions. Although the general model presents meaningful statistical parameters, there is a significant reduction in sensitivity to predict leaf nitrogen content of sugarcane when compared with specific site calibrated models. We also used on this research the stepwise multiple linear regression (SMLR) that generated models with good precision to estimate the leaf nitrogen content, even when models are calibrated for an experimental area, regardless of spectral differences between varieties, using 5 to 6 wavelengths. This study shows that specific wavelengths are associated with variation in leaf nitrogen content of sugarcane, and these are reported in the region of green (near to 550 nm) and red-edge (680 to 720nm). Despite the low correlation observed between the infrared wavelengths to the leaf nitrogen content of sugarcane, vegetation indices calculated from these wavelengths, or its insertion on linear models generation were important to improve prediction accuracy. Adubação nitrogenada Índices de Vegetação Modelos de regressão Nitrogen fertilization Regression models Seleção de variáveis Sensores Sensors Variable selection Vegetation index
66	Modelos de regressão beta-binomial/poisson para contagens bivariadas / Beta-binomial/Poisson regression models for repeated bivariate counts Lora, Mayra Ivanoff 01 April 2004 (has links) Propomos um modelo Beta-Binomial/Poisson para dados provenientes de um estudo com doentes de Parkinson, que consistiu em contar durante um minuto quantas tarefas foram realizadas e destas, quantas de maneira correta, antes e depois de um treinamento. O objetivo era verificar se o treinamento aumentava o número de tentativas e a porcentagem de acerto, o que destaca o aspecto bivariado do problema. Esse modelo considera tal aspecto, usa uma distribuição mais adequada a dados de contagem e ainda suporta a sobredispersão presente nos dados. Obtemos estimadores de máxima verossimilhança dos parâmetros utilizando um algoritmo de Newton-Raphson. Ilustramos a aplicação da metodologia desenvolvida aos dados do estudo. / We propose a Beta-Binomial/Poisson model to the data from a study with Parkinson disease patients, which consisted in counting for one minute how many trials were attempted and how many of them were successful, before and after a training period. The main goal was to check if training increased the number of trials and success probability, which emphasizes the bivariate aspect of the problem. This model takes this aspect into account, uses a distribution which is usually more adequate to count data and supports the overdispersion present in the data. We obtain the maximum likelihood estimators using a Newton-Raphson algorithm. For illustration, the methodology is applied to the data from study. bivariate counts contagens bivariadas dados longitudinais efeitos aleatórios longitudinal data modelos de regressão overdispersion random effects regression models sobredispersão
67	Modelos de regressão beta-binomial/poisson para contagens bivariadas / Beta-binomial/Poisson regression models for repeated bivariate counts Mayra Ivanoff Lora 01 April 2004 (has links) Propomos um modelo Beta-Binomial/Poisson para dados provenientes de um estudo com doentes de Parkinson, que consistiu em contar durante um minuto quantas tarefas foram realizadas e destas, quantas de maneira correta, antes e depois de um treinamento. O objetivo era verificar se o treinamento aumentava o número de tentativas e a porcentagem de acerto, o que destaca o aspecto bivariado do problema. Esse modelo considera tal aspecto, usa uma distribuição mais adequada a dados de contagem e ainda suporta a sobredispersão presente nos dados. Obtemos estimadores de máxima verossimilhança dos parâmetros utilizando um algoritmo de Newton-Raphson. Ilustramos a aplicação da metodologia desenvolvida aos dados do estudo. / We propose a Beta-Binomial/Poisson model to the data from a study with Parkinson disease patients, which consisted in counting for one minute how many trials were attempted and how many of them were successful, before and after a training period. The main goal was to check if training increased the number of trials and success probability, which emphasizes the bivariate aspect of the problem. This model takes this aspect into account, uses a distribution which is usually more adequate to count data and supports the overdispersion present in the data. We obtain the maximum likelihood estimators using a Newton-Raphson algorithm. For illustration, the methodology is applied to the data from study. contagens bivariadas dados longitudinais efeitos aleatórios modelos de regressão sobredispersão bivariate counts longitudinal data overdispersion random effects regression models
68	Modelos de regressão para variáveis categóricas ordinais com aplicações ao problema de classificação / Regression models for ordinal categorical variables with applications to the classification problem Roberta Irie Sumi Okura 11 April 2008 (has links) Neste trabalho, apresentamos algumas metodologias para analisar dados que possuem variável resposta categórica ordinal. Descrevemos os principais Modelos de Regressão conhecidos atualmente que consideram a ordenação das categorias de resposta, entre eles: Modelos Cumulativos e Modelos Sequenciais. Discutimos também o problema de discriminação e classificação de elementos em grupos ordinais, comentando sobre os preditores mais comuns para dados desse tipo. Apresentamos ainda a técnica de Análise Discriminante Ótima e sua versão aprimorada, baseada na utilização de métodos bootstrap. Por fim, aplicamos algumas das técnicas descritas a dados reais da área financeira, com o intuito de classificar possíveis clientes, no momento da aquisição de um cartão de crédito, como futuros bons, médios ou maus pagadores. Para essa aplicação, discutimos as vantagens e desvantagens dos modelos utilizados em termos de qualidade da classificação. / In this work, some methods to analyse data with ordinal categorical response are presented. We describe the most important and widely used Regression Models which consider the ordering of response categories like: Cumulative Models and Sequential Models. We also discuss the problem of how to discriminate and classify elements in ordinal groups, commenting on the most common predictors to this kind of data. Also we present the technique known as optimal discriminant analysis and its improved version, based on the use of bootstrap methods. Finally, we apply some of the described techniques to real financial data, intending to classify possible consumers, on acquistion of a credit card, as high, medium and low risk customers. With this application, we discuss the advantages and disadvantages of the models used in terms of quality of classification. classificação discriminação ordinal modelos de regressão ordinais variáveis categóricas ordinais classification ordinal categorical variables ordinal discrimination ordinal regression models
69	Modelos Beta-Binomial/Poisson-Gama para contagens bivariadas repetidas / Beta-binomial/gamma-Poisson regression models for repeated bivariate counts Mayra Ivanoff Lora 01 December 2008 (has links) Em Lora e Singer (Statistics in Medicine, 2008), propusemos um modelo Beta- Binomial/Poisson p-variado para análise dos dados provenientes de um estudo que consistiu em contar o número de tentativas e acertos de um exercício manual com duração de um minuto realizado por doentes de Parkinson, antes e depois de um treinamento. O objetivo era verificar se o treinamento aumentava o número de tentativas e a porcentagem de acerto, o que destaca o aspecto bivariado do problema. Esse modelo leva tais características em consideração, usa uma distribuição adequada para dados de contagem e ainda acomoda a sobredispersão presente na contagem dos acertos. Como generalização, inicialmente, propomos um modelo Beta-Binomial/Poisson-Gama que acomoda sobredispersão também para as contagens dos totais de tentativas, além incluir covariâncias possivelmente diferentes entre as contagens em diversos instantes de avaliação. Neste novo modelo, introduzimos um parâmetro que relaciona o total de tentativas com a probabilidade de acerto, tornando-o ainda mais geral. Obtemos estimadores de máxima verossimilhança dos parâmetros utilizando um algoritmo de Newton-Raphson. Consideramos um outro conjunto de dados provenientes do mesmo estudo para ilustração da metodologia proposta. / In Lora and Singer (Statistics in Medicine, 2008), we proposed a Beta-Binomial/Poisson p-variate model to analyze data from a study which consists in counting the number of trials and successes of a manual exercise in one minute periods, done by Parkinsons disease patients, before and after a training. The purpose was to verify if the training improves the number of trials and the percentage of success, which emphasizes the bivariate aspect of the problem. This model considers these characteristics, uses an adequate distribution to count data and settles the overdispersion suggested in the number os successes. As a generalization, initially, we propose a Beta-Binomial/Poisson-Gama model which also settles the overdispersion suggested by the total number of trials, besides includes possible different covariances between total trial counts in different evaluation instants. In this new model, we introduce a parameter that links the total trials with the success probability, making it even more general. We obtain maximum likelihood estimators for the parameters using an Newton-Raphson algorithm. We consider another data from the same study to illustrate the proposal methodology. contagens bivariadas dados longitudinais efeitos aleatórios modelos de regressão sobredispersão bivariate counts longitudinal data overdispersion random effects regression models
70	[en] FORECASTING OF JUDICIAL CONTINGENCY IN ELECTRIC SECTOR COMPANIES: AN APPROACH VIA DYNAMIC REGRESSION AND EXPONENTIAL SMOOTHING / [pt] PREVISÃO DE CONTINGÊNCIA JUDICIAL EM EMPRESAS DO SETOR ELÉTRICO: UMA ABORDAGEM VIA REGRESSÃO DINÂMICA E AMORTECIMENTO EXPONENCIAL BRUNO AGRÉLIO RIBEIRO 03 October 2012 (has links) [pt] Esta dissertação tem como objetivo principal a proposição de modelos para previsão, em um curto prazo, do número de processos que são ajuizados em desfavor de uma empresa do setor elétrico. A metodologia utilizada consiste em, a partir de uma análise exploratória dos dados, construir modelos usando uma estratégia bottom-up, ou seja, parte-se de um modelo simples e processa-se seu refinamento até encontrar um modelo apropriado que mais se adeque à realidade. Partiu-se então de um modelo auto projetivo indo até uma formulação de um modelo de regressão dinâmica. Os modelos são então comparados segundo alguns critérios, basicamente no que tange à sua eficiência preditiva. Conclui-se ao final sobre a eficiência de se utilizar modelos de regressão dinâmica para este tipo de previsão tendo em vista a presença de correlação serial dos resíduos, comumente presentes nas séries econômicas. Propõe-se, ao final, uma ferramenta para, a partir dos valores estimados, analisar a viabilidade econômica de estimular ou desestimular as medidas responsáveis pela geração de processos contra a empresa. / [en] The aim of this dissertation is to develop short term models to forecast the number of judicial process in electric sector companies. From the methodology point of view, data is analyzed and models using bottom-up strategy is developed. In other words, a simple model is improved step by step until a proper model that fits well the reality is found. From a univariate model it ends up in a dynamic regression model. The models obtained in this study are compared according to some criterion, mainly forecast accuracy. In the end the conclusion is about the efficiency of dynamic regression models for this kind of forecast, which one presents data with serial correlation of residues, commonly present in economic series. In the end, from the estimated values, it´s proposed a mechanism to analyze the economic viability, to encourage or not, actions which are responsible for instigating judicial processes against the company. [pt] AMORTECIMENTO EXPONENCIAL [en] EXPONENTIAL SMOOTHING [pt] MODELOS DE REGRESSAO DINAMICA [en] DYNAMIC REGRESSION MODELS [pt] PREVISAO DE CONTINGENCIA JUDICIAL [en] JUDICIAL CONTINGENCY FORECASTING

Search results