• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1104
  • 49
  • 25
  • 4
  • 4
  • 4
  • 3
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 1199
  • 791
  • 437
  • 269
  • 230
  • 223
  • 200
  • 192
  • 182
  • 156
  • 130
  • 129
  • 121
  • 119
  • 111
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1031

Regressão logística e análise discriminante na predição da recuperação de portfólios de créditos do tipo non-performing loans / Logistic regression and discriminant analysis in prediction of the recovery of non-performing loans credits portfolio

Silva, Priscila Cristina 23 February 2017 (has links)
Submitted by Nadir Basilio (nadirsb@uninove.br) on 2017-08-04T21:33:38Z No. of bitstreams: 1 Priscila Cristina Silva.pdf: 2177666 bytes, checksum: a8d3c5290664fa16f138371def86fcdd (MD5) / Made available in DSpace on 2017-08-04T21:33:38Z (GMT). No. of bitstreams: 1 Priscila Cristina Silva.pdf: 2177666 bytes, checksum: a8d3c5290664fa16f138371def86fcdd (MD5) Previous issue date: 2017-02-23 / Customers with credit agreement in arrears for more than 90 days are characterized as non-performing loans and cause concerns in credit companies because the lack of guarantee of discharge debtor's amount. To treat this type of customer are applied collection scoring models that have as main objective to predict those debtors who have propensity to honor their debts, that is, this model focuses on credit recovery. Models based on statistical prediction techniques can be applied to the recovery of these credits, such as logistic regression and discriminant analysis. Therefore, the aim of this paper was to apply logistic regression and discriminant analysis models in predicting the recovery of non-performing loans credit portfolios. The database used was provided by the company Serasa Experian and contains a sample of ten thousand customers with twenty independent variables and a variable binary response (dependent) indicating whether or not the defaulting customer paid their debt. The sample was divided into training, validation and test and the models cited in the objective were applied individually. Then, two new logistic regression models and discriminant analysis were implemented from the outputs of the individually implemented models. The both models applied individually as the new models had generally good performance form, highlighting the new model of discriminant analysis that got correct classification of percentage higher than the new logistic regression model. It was concluded, then, based on the results that the models are a good option for predicting the credit portfolio recovery. / Os clientes que possuem contrato de crédito em atraso há mais de 90 dias são caracterizados como non-performing loans e preocupam as instituições financeiras fornecedoras de crédito pela falta de garantia da quitação desse montante devedor. Para tratar este tipo de cliente são aplicados modelos de collection scoring que têm como principal objetivo predizer aqueles devedores que possuem propensão em quitar suas dívidas, ou seja, esse modelo busca a recuperação de crédito. Modelos baseados em técnicas estatísticas de predição podem ser aplicados na recuperação como a regressão logística e a análise discriminante. Deste modo, o objetivo deste trabalho foi aplicar os modelos de regressão logística e análise discriminante na predição da recuperação de portfólios de crédito do tipo non-performing loans. A base de dados utilizada foi cedida pela empresa Serasa Experian e contém uma amostra de dez mil indivíduos com vinte variáveis independentes e uma variável resposta (dependente) binária indicando se o cliente inadimplente pagou ou não sua dívida. A amostra foi dividida em treinamento, validação e teste e foram aplicados os modelos citados de forma individual. Em seguida, dois novos modelos de regressão logística e análise discriminante foram implementados a partir das saídas (outputs) dos modelos aplicados individualmente. Com base nos resultados, tanto os modelos aplicados individualmente quanto os novos modelos apresentaram bom desempenho, com destaque para o novo modelo de análise discriminante que apresentou um percentual de classificações corretas superior ao novo modelo de regressão logística. Concluiu-se, então, que os modelos são uma boa opção para predição da recuperação de portfólios de crédito do tipo non-performing loans.
1032

Avaliação dos modelos Probit e Logit com aplicação na longevidade de sementes de soja /

Faria, Rute Quelvia de January 2019 (has links)
Orientador: Maria Márcia Pereira Sartori / Resumo: O estudo da longevidade é uma ferramenta importante na análise da qualidade fisiológica em sementes. A modelagem da curva de sobrevivência em sementes permite a predição do seu período de vida, que baliza os mais variados estudos em conservação e tecnologia de sementes. O modelo de Probit foi inicialmente proposto como o modelo ideal para predição da longevidade das sementes, contudo, estudos têm reportado certa dificuldade de predição do modelo em diferentes condições de estresse e armazenagem a que as sementes são submetidas. A equação da viabilidade em sementes a partir do modelo de Probit permite calcular o valor do P50, que é o período em que um lote de sementes leva para perder 50% da sua viabilidade. O modelo de Logit é similar ao de Probit, com a vantagem de ser mais simples, e de se adequar melhor ao comportamento dos dados com caudas pesadas. Assim, o objetivo deste estudo foi avaliar os modelos de Probit e Logit quanto a sua robustez na predição da longevidade das sementes. Para tanto, sementes de soja foram selecionadas quanto ao seu vigor, em delineamento inteiramente casualizado, e armazenadas à 35°C e 75% de umidade relativa, até que fosse constatada sua morte, por meio de testes de germinação realizados periodicamente. A construção das curvas de sobrevivência, após o experimento encerrado, permitiu a análise dos modelos de Probit e Logit, por meio dos parâmetros R2, Rajustado, e do coeficiente de correlação de Pearson. O estudo da normalidade dos resíduos tamb... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The study of longevity is an important tool in the analysis of physiological quality in seeds. The modeling of the survival curve in seeds allows the prediction of their half time life, which could be used to reference for the most varied studies on conservation and seed technology. The Probit model was initially proposed as the ideal model for seed longevity prediction, however, studies have reported about some errors found after applying the model under different stress and storage conditions in which seeds are submitted. The seed viability equation from the Probit model allows to calculate the value of P50, which is the period in which a seed lot loss 50% of its viability. The Logit model is similar to the Probit model, with the advantage of being simpler and better suited to heavy tails data, as occurs in seed longevity data. The aim of this study was to evaluate the Probit and Logit models for their robustness in predicting seed longevity. For this purpose, soybean seeds were selected according to their vigor, in a completely randomized design, and stored in 35 °C and 75% relative humidity until their death was verified by periodic germination tests. The construction of survival curves, after the experiment ended, allowed the analysis of Probit and Logit models, through the parameters R2 , Radjusted, and the Pearson correlation coefficient. The study of the normality of the residues was also performed to evaluate the models. The results showed the superiority of the Logi... (Complete abstract click electronic access below) / Doutor
1033

Modelagem empírica para ajuste, correção e análise de confiabilidade de parâmetros de reatores UASB /

Serra, Antonio Marcos Galvez January 2019 (has links)
Orientador: Rodrigo Braga Moruzzi / Resumo: A falha humana é um evento indesejado para os engenheiros, e a população que se vê refém destes empreendimentos, (visto os diversos incidentes que ocorrem no Brasil) por fatores como omissão de informações, medições equivocadas ou mesmo erros técnicos, passam despercebidos durante as vistorias. Na área de Saneamento, em se tratando de esgoto sanitário, os riscos não são menores e também devem ser evitados considerando o número de doenças que são proliferadas por falhas no saneamento de esgoto. A partir deste pressuposto, a presente pesquisa visou desenvolver um modelo preditor, usando ferramentas matemáticas que viabilizassem identificar e corrigir erros técnicos no registro e medições realizadas em parâmetros físicos, químicos e biológicos de dois reatores UASB da Estação Candeia da cidade de Bauru- SP. Para isto, após uma revisão sobre a tecnologia de reatores UASB e de estudos probabilísticos baseados no conceito de confiabilidade aplicado a ETEs (Estações de Tratamento de Esgotos), definiu-se, por meio de análise de regressão, um modelo multilinear, acoplado a um algoritmo de otimização, capaz de prever e corrigir parâmetros de entrada e saídas (inconsistentes ou ausentes) no registro do monitoramento da estação referentes ao tratamento de reatores UASB. Com este procedimento matemático, através de uma análise estatística conceitual de confiabilidade do sistema, foi possível corrigir dados e estimar informações de parâmetros ausentes, em 22% das coletas de medidas e regis... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Human failure is an unwanted event for engineers, and the population that is hostage to these endeavors, (due to the various incidents that occur in Brazil) due to factors such as omission of information, wrong measurements or even technical errors, go unnoticed during surveys. . In the Sanitation area, when it comes to sanitary sewage, the risks are no less and should also be avoided considering the number of diseases that are proliferated by sewage sanitation failures. From this assumption, the present research aimed to develop a predictor model, using mathematical tools that could identify and correct technical errors in the recording and measurements performed on physical, chemical and biological parameters of two UASB reactors at Candeia Station of Bauru- SP. For this, after a review of UASB reactor technology and probabilistic studies based on the concept of reliability applied to sewage treatment plants (SEP), a multilinear model coupled to a optimization algorithm, capable of predicting and correcting input and output parameters (inconsistent or absent) in the station monitoring register for the treatment of UASB reactors. With this mathematical procedure, through a conceptual statistical analysis of system reliability, it was possible to correct data and estimate missing parameter information in 22% of the measurement collections and records in the technical reports that were made available for this study. / Mestre
1034

Avaliação de modelos de permeabilidade em meios porosos não consolidados / Evaluation of permeability in unconsolidated porous media

Hugo Emerich Maciel 11 September 2015 (has links)
Conselho Nacional de Desenvolvimento Científico e Tecnológico / As simulações computacionais tem sido amplamente empregadas no estudo do escoamento darciano e não-darciano em meios porosos consolidados e não-consolidados. Neste trabalho, através de uma nova formulação para a equação de Forchheimer, foram identificadas duas novas propriedades denominados fator de comportamento do fluido, que atua paralelamente a permeabilidade, e permeabilidade equivalente global, resultado da relação anterior. Este comportamento foi estudado e validado através da implementação de um aparato experimental e um código computacional baseado no modelo de regressão-linear que, além disso, demonstrou que o escoamento, ainda que em regime não darciano, comporta-se linearmente como a equação de Darcy, ainda que o coeficiente angular desta diminuiu de acordo com a faixa do número de Reynolds atingida, sendo esta dependente do tipo de leito empregado. Ainda neste trabalho, foi implementado o método de otimização R2W para estimar os parâmetros da equação de Kozeny-Carman a partir de dados experimentais obtidos por Dias et al, a fim de simular o escoamento darciano em meios porosos. Por fim, foi alcançada excelente concordância entre os dados simulados pelo método R2W / equação de Kozeny-Carman e os dados reais. / Computer simulations have been widely used in the study of Darcys flow and non-Darcy porous media in consolidated and non-consolidated. In this work, through a new formulation for the Forchheimer equation, we have been identified two new called Fluid Factor Behavior properties, which acts parallel to permeability, and overall equivalent permeability result of the previous relationship. This behavior has been studied and validated through implementation of an experimental apparatus and a computer code based on the linear regression model, moreover, it demonstrated that flow, even in non darciano system behaves linearly as the Darcy, however, the slope of this decreased according to the range of Reynolds numbers reached, this being dependent on the type of bed used. Although this work was implemented R2W optimization method to estimate the parameters of Kozeny-Carman equation from experimental data provided in the literature in order to simulate the darciano flow in porous media. Finally, it achieved excellent agreement between the data simulated by R2W method / Kozeny-Carman equation and actual data.
1035

Invariant tests in an instrumental variables model with unknown data generating process

Castro, Gustavo Rabello de 28 April 2015 (has links)
Submitted by Gustavo Rabello de Castro (grdcastro@outlook.com) on 2016-01-17T15:36:58Z No. of bitstreams: 1 Dissertacao Final.pdf: 1716177 bytes, checksum: 6516904780e3dae7837ee9b481d63ba7 (MD5) / Approved for entry into archive by BRUNA BARROS (bruna.barros@fgv.br) on 2016-01-21T17:18:28Z (GMT) No. of bitstreams: 1 Dissertacao Final.pdf: 1716177 bytes, checksum: 6516904780e3dae7837ee9b481d63ba7 (MD5) / Approved for entry into archive by Maria Almeida (maria.socorro@fgv.br) on 2016-02-11T17:59:08Z (GMT) No. of bitstreams: 1 Dissertacao Final.pdf: 1716177 bytes, checksum: 6516904780e3dae7837ee9b481d63ba7 (MD5) / Made available in DSpace on 2016-02-11T17:59:18Z (GMT). No. of bitstreams: 1 Dissertacao Final.pdf: 1716177 bytes, checksum: 6516904780e3dae7837ee9b481d63ba7 (MD5) Previous issue date: 2015-04-28 / In this work we focus on tests for the parameter of an endogenous variable in a weakly identi ed instrumental variable regressionmodel. We propose a new unbiasedness restriction for weighted average power (WAP) tests introduced by Moreira and Moreira (2013). This new boundary condition is motivated by the score e ciency under strong identi cation. It allows reducing computational costs of WAP tests by replacing the strongly unbiased condition. This latter restriction imposes, under the null hypothesis, the test to be uncorrelated to a given statistic with dimension given by the number of instruments. The new proposed boundary condition only imposes the test to be uncorrelated to a linear combination of the statistic. WAP tests under both restrictions to perform similarly numerically. We apply the di erent tests discussed to an empirical example. Using data from Yogo (2004), we assess the e ect of weak instruments on the estimation of the elasticity of inter-temporal substitution of a CCAPM model. / Este trabalho trata de testes para o parâmetro de uma variável endógena em modelos de regressão com variáveis instrumentais fracas. Propomos uma nova restrição para o viés dos testes weighted average power (WAP), desenvolvidos em Moreira e Moreira (16, 2013). A motivação para essa nova restrição se baseia na eficiência do teste score sob a hipótese de identificação forte. Essa hipótese permite reduzir o custo computacional dos testes WAP, substituindo a restrição de strongly unbiased. Esta ultima demanda que, sob a hipótese nula, o teste seja ortogonal a uma dada estatística com sua dimensão dada pelo número de instrumentos. A restrição aqui proposta exige somente que o teste seja não correlacionado com uma combinação linear dessa estatística. Nas simulações, ambos os testes apresentam um desempenho numericamente similar. Aplicamos ainda os testes discutidos neste trabalho na estimação da elasticidade de substituição intertemporal de um modelo CCAPM.
1036

Análise de dados longitudinais para variáveis binárias

Rodrigues, José Tenylson Gonçalves 05 March 2009 (has links)
Made available in DSpace on 2016-06-02T20:06:02Z (GMT). No. of bitstreams: 1 2447.pdf: 2730026 bytes, checksum: 0c7b575bbfeb3fed2fc6c929b9785516 (MD5) Previous issue date: 2009-03-05 / Financiadora de Estudos e Projetos / The objective of this work is to present techniques of regression analysis for longitudinal data when the response variable is binary. Initially, there is a review of generalized linear models, marginal models, transition models, mixed models, and logistic regression methods of estimation, which will be necessary for the development of work. In addition to the methods of estimation, some structures of correlation will be studied in an attempt to capture the intra-individual serial dependence over time. These methods were applied in two situations, one where the response variable is continuous and normal distribution, and another when the response variable has the Bernoulli distribution. It was also sought to explore and present techniques for selection of models and diagnostics for the two cases. Finally, an application of the above methodology will be presented using a set of real data. / O objetivo deste trabalho é apresentar técnicas de análise de regressão para dados longitudinais quando a variável resposta é binária. Inicialmente, é feita uma revisão sobre modelos lineares generalizados, modelos marginais, modelos de transição, modelos mistos, regressão logística e métodos de estimação, pois serão necessários para o desenvolvimento do trabalho. Além dos métodos de estimação, algumas estruturas de correlação serão estudadas, na tentativa de captar a dependência serial intra-indivíduo ao longo do tempo. Estes métodos foram aplicados em duas situações; uma quando a variável resposta é contínua, e se assume ter distribuição normal, e a outra quando a variável resposta assume ter distribuição de Bernoulli. Também se procurou pesquisar e apresentar técnicas de seleção de modelos e de diagnósticos para os dois casos. Ao final, uma aplicação com a metodologia pesquisada será apresentada utilizando um conjunto de dados reais.
1037

Avaliação de modelos de permeabilidade em meios porosos não consolidados / Evaluation of permeability in unconsolidated porous media

Hugo Emerich Maciel 11 September 2015 (has links)
Conselho Nacional de Desenvolvimento Científico e Tecnológico / As simulações computacionais tem sido amplamente empregadas no estudo do escoamento darciano e não-darciano em meios porosos consolidados e não-consolidados. Neste trabalho, através de uma nova formulação para a equação de Forchheimer, foram identificadas duas novas propriedades denominados fator de comportamento do fluido, que atua paralelamente a permeabilidade, e permeabilidade equivalente global, resultado da relação anterior. Este comportamento foi estudado e validado através da implementação de um aparato experimental e um código computacional baseado no modelo de regressão-linear que, além disso, demonstrou que o escoamento, ainda que em regime não darciano, comporta-se linearmente como a equação de Darcy, ainda que o coeficiente angular desta diminuiu de acordo com a faixa do número de Reynolds atingida, sendo esta dependente do tipo de leito empregado. Ainda neste trabalho, foi implementado o método de otimização R2W para estimar os parâmetros da equação de Kozeny-Carman a partir de dados experimentais obtidos por Dias et al, a fim de simular o escoamento darciano em meios porosos. Por fim, foi alcançada excelente concordância entre os dados simulados pelo método R2W / equação de Kozeny-Carman e os dados reais. / Computer simulations have been widely used in the study of Darcys flow and non-Darcy porous media in consolidated and non-consolidated. In this work, through a new formulation for the Forchheimer equation, we have been identified two new called Fluid Factor Behavior properties, which acts parallel to permeability, and overall equivalent permeability result of the previous relationship. This behavior has been studied and validated through implementation of an experimental apparatus and a computer code based on the linear regression model, moreover, it demonstrated that flow, even in non darciano system behaves linearly as the Darcy, however, the slope of this decreased according to the range of Reynolds numbers reached, this being dependent on the type of bed used. Although this work was implemented R2W optimization method to estimate the parameters of Kozeny-Carman equation from experimental data provided in the literature in order to simulate the darciano flow in porous media. Finally, it achieved excellent agreement between the data simulated by R2W method / Kozeny-Carman equation and actual data.
1038

Análise hiperespectral de folhas de Brachiaria brizantha cv. Marandú submetidas a doses crescentes de nitrogênio / Hyperspectral analysis of Brachiaria brizantha cv. Marandú leaves under contrasting nitrogen levels

Takushi, Mitsuhiko Reinaldo Hashioka 14 February 2019 (has links)
O sensoriamento remoto é uma estratégia que pode ajudar no monitoramento da qualidade das pastagens. Objetivou-se com esse estudo analisar a resposta espectral das folhas de Brachiaria brizantha cv. Marandú, adubada com doses crescentes de ureia, para diferenciar e predizer teores foliares de nitrogênio (TFN). Os tratamentos foram distribuídos em blocos ao acaso (DBC), composto por quatro blocos e quatro tratamentos, totalizando 16 parcelas. Foram utilizadas doses crescentes de adubação com ureia: 0, 25, 50, 75 kg de N/ha/corte. Ao longo do experimento foram realizadas 7 coletas, sendo coletadas 8 folhas por parcela. Essas folhas foram submetidas à análise hiperespectral e posterior análise química do teor de nitrogênio. Ao analisar a resposta espectral das folhas, observou-se diferenças estatísticas entre os tratamentos na região do visível em todas as coletas, com ênfase na região de 550 nm (verde). Por meio de análise discriminante linear (LDA) realizada para cada coleta, os centróides gerados por todos os tratamentos apresentaram diferenças significativas, com exceção do LD1 nas coletas 6 e 7 que não apresentou distinção entre os tratamentos de 50 e 75 kg de N/ha/corte, e LD2 na coleta 5 que não apresentou distinção entre os tratamentos de 0 e 50 kg de N/ha/corte. As equações de regressão multivariada obtidas pelo método de quadrados mínimos parciais (PLSR), geraram valores razoáveis a bons de R2 (0,53 a 0,83) na predição dos TFN, onde os comprimentos de onda com maior peso nessas regressões estão na região do red edge (715 a 720 nm). Por fim, ao testar a performance de alguns Índices de Vegetação da literatura, as coletas 4, 6 e 7 apresentaram bons coeficientes de determinação (R2) que variaram de 0,65 a 0,73; uma característica em comum nos índices que melhor estimaram os TFN é a presença de comprimentos de ondas que fazem parte da região do red edge. / Remote sensing is a set of techniques that can help to monitor pasture quality. The object of this study is to analyze the spectral response from Brachiaria brizantha cv. Marandú leaves, under contrasting nitrogen levels, to differentiate and predict leaf nitrogen content. The treatments were set in a Randomized Block Design, composed of four blocks and four treatments, totaling 16 plots. Increasing doses of urea fertilization were used: 0, 25, 50, 75 kg N/ha/mowing. During the experiment, 7 data collections were performed, and 8 leaves per plot were extracted for each data collection. These leaves were submitted to hyperspectral data extraction and subsequent chemical analysis to quantify the nitrogen content. When analyzing the spectral pattern of the leaves, statistical differences among samples with different nitrogen levels were noticeable in the visible range of the spectrum in all the collections, with emphasis on the 550 nm region (green). Through linear discriminant analysis (LDA), performed for each collection, the generated centroids by the samples of each nitrogen level presented significant differences, except for LD1 in collections 6 and 7, which did not present a distinction between treatments of 50 and 75 kg of N/ha/mowing, and LD2 in collection 5 that did not distinguish between treatments of 0 and 50 kg of N/ha/mowing. The partial least square regression (PLSR) method generated reasonable to good values of R2 (0.53 to 0.83) for the prediction of leaf nitrogen content, where the wavelengths with the highest coefficient in these models are in the red edge region of the spectrum (715 to 720 nm). Finally, when testing the performance of some Vegetation Indexes from literature, collections 4, 6 and 7 presented good determination coefficients (R2) ranging from 0.65 to 0.73; a common feature in the indexes that best estimate the nitrogen content is the presence of wavelengths from the red edge region of the spectrum.
1039

Contribuições em modelos de regressão com erro de medida multiplicativo / Contributions in regression models with multiplicative measurement error

Silva, Eveliny Barroso da 04 February 2016 (has links)
Em modelos de regressão em que uma covariável é medida com erro, é comum o uso de estruturas que relacionam a covariável observada com a verdadeira covariável não observada. Essas estruturas são usualmente aditivas ou multiplicativas. Na literatura existem diversos trabalhos interessantes que tratam de modelos de regressão com erro de medida aditivo, muitos dos quais são modelos lineares com covariáveis e erro de medida normalmente distribuídos. Para modelos em que o erro de medida é multipicativo, não se encontra na literatura o mesmo desenvolvimento teórico encontrado para modelos em que o erro de medida é aditivo. O mesmo vale para situações em que as suposições de normalidade para as covariáveis e erro de medida não se aplicam. Este trabalho propõe a construção, definição, métodos de estimação e análise de diagnóstico para modelos de regressão com erro de medida multiplicativo em uma das covariáveis. Para esses modelos, consideramos que a variável resposta possa pertencer ou à classe de modelos de regressão série de potências modificadas ou à família exponencial. O rol de distribuições pertencentes à família série de potências modificada é bem abrangente, portanto, neste trabalho, desenvolvemos a teoria de estimação e validação do modelo primeiramente de forma geral e, para exemplificar, apresentamos o modelo de regressão binomial negativa com erro de medida. para o caso em que a variável resposta pertença à família exponencial. apresentamos o modelo de regressão beta com erro de medida multiplicativo. Todos os modelos propostos foram analisados através de estados de simulação e aplicados a conjuntos de dados reais. / In regression models in which a covariate is measured with erros, it is common to use structures that correlate the observed covariate with the true non-observed covariate. Such structures are usually additive or multiplicative. In the literatue there are several interesting works that deal with regression models having an additive measuremsnt error, many of which are linear models with covariate and measurement error normally distributed. For models having a multiplicative measurement error, one does not find in the literature the same theoretical amount of works as one finds for models in which the measurement error is additive. The same happens in situations where the supositions of normality for the covariates and the measurement errors do not apply. The presente work proposes the construction,definition, estimation methods, and diagnostic analysis for the regression models with a multiplicative measurement error in one of the covariates. For these models it is considered that the response variable may belong either to the class of modified power series regression models or to the exponential family. The list of distributions belonging to the family modified power series is rather comprehensive; for this reason this work develops, firstly and in a general way, the models estimation and validation theory, and, as an example, presents the model of negative binomial regression with measurement error. In the case where response variable belongs to the exponential family, the model of beta regression with multiplicative measurement error is presented. All proposed models were analysed through simulationb studies and applied to real data sets.
1040

Comparação entre métodos de imputação de dados em diferentes intensidades amostrais na série homogênea de precipitação pluvial da ESALQ / Comparison between data imputation methods at different sample intensities in the ESALQ homogeneous rainfall series

Gasparetto, Suelen Cristina 07 June 2019 (has links)
Problemas frequentes nas análises estatísticas de informações meteorológicas são a ocorrência de dados faltantes e ausência de conhecimento acerca da homogeneidade das informações contidas no banco de dados. O objetivo deste trabalho foi testar e classificar a homogeneidade da série de precipitação pluvial da estação climatológica convencional da ESALQ, no período de 1917 a 1997, e comparar três métodos de imputação de dados, em diferentes intensidades amostrais (5%, 10% e 15%) de informações faltantes, geradas de forma aleatória. Foram utilizados três testes de homogeneidade da série: Pettitt, Buishand e normal padrão. Para o \"preenchimento\" das informações faltantes, foram comparados três métodos de imputação múltipla: PMM (Predictive Mean Matching), random forest e regressão linear via método bootstrap, em cada intensidade amostral de informações faltantes. Os métodos foram utilizados por meio do pacote MICE (Multivariate Imputation by Chained Equations) do R. A comparação entre cada procedimento de imputação foi feita por meio da raiz do erro quadrático médio, índice de exatidão de Willmott e o índice de desempenho. A série de chuva foi entendida como de classe 1, ou seja, \"útil\" - Nenhum sinal claro de falta de homogeneidade foi aparente e, o método que resultou em menores valores da raiz quadrada dos erros e maiores índices foi o PMM, em especial na intensidade de 10% de informações faltantes. O índice de desempenho para os três métodos de imputação de dados em todas as intensidades de observações faltantes foi considerado \"Péssimo\" / Frequent problems in the statistical analyzes of meteorological information are the occurrence of missing data and missing of knowledge about the homogeneity of the information contained in the data base. The objective of this work was to test and classify the homogeneity of the rainfall series of the conventional climatological station of the ESALQ from 1917 to 1997 and to compare three methods of data imputation in different sample intensities (5%, 10% and 15%), of missing data, generated in a random way. Three homogeneity tests were used: Pettitt, Buishand and standard normal. For the \"filling\" of missing information, three methods of multiple imputation were compared: PMM (Predictive Mean Matching), random forest and linear regression via bootstrap method, in each sampling intensity of missing information. The methods were used by means of the MICE (Multivariate Imputation by Chained Equations) package of R. The comparison of each imputation procedure was done by root mean square error, Willmott\'s accuracy index and performance index. The rainfall series was understood to be class 1 \"useful\" - No clear sign of lack of homogeneity was apparent and the method that resulted in smaller values of the square root of the errors and higher indexes was the PMM, in particular the intensity of 10% of missing information. The performance index for the three methods of imputation the data at all missing observation intensities was considered \"Terrible\"

Page generated in 0.0662 seconds