• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1104
  • 49
  • 25
  • 4
  • 4
  • 4
  • 3
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 1199
  • 791
  • 437
  • 269
  • 230
  • 223
  • 200
  • 192
  • 182
  • 156
  • 130
  • 129
  • 121
  • 119
  • 111
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
501

Modelos preditivos para LGD / Predictive models for LGD

Silva, João Flávio Andrade 04 May 2018 (has links)
As instituições financeiras que pretendem utilizar a IRB (Internal Ratings Based) avançada precisam desenvolver métodos para estimar a componente de risco LGD (Loss Given Default). Desde a década de 1950 são apresentadas propostas para modelagem da PD (Probability of default), em contrapartida, a previsão da LGD somente recebeu maior atenção após a publicação do Acordo Basileia II. A LGD possui ainda uma literatura pequena, se comparada a PD, e não há um método eficiente em termos de acurácia e interpretação como é a regressão logística para a PD. Modelos de regressão para LGD desempenham um papel fundamental na gestão de risco das instituições financeiras. Devido sua importância este trabalho propõe uma metodologia para quantificar a componente de risco LGD. Considerando as características relatadas sobre a distribuição da LGD e na forma flexível que a distribuição beta pode assumir, propomos uma metodologia de estimação da LGD por meio do modelo de regressão beta bimodal inflacionado em zero. Desenvolvemos a distribuição beta bimodal inflacionada em zero, apresentamos algumas propriedades, incluindo momentos, definimos estimadores via máxima verossimilhança e construímos o modelo de regressão para este modelo probabilístico, apresentamos intervalos de confiança assintóticos e teste de hipóteses para este modelo, bem como critérios para seleção de modelos, realizamos um estudo de simulação para avaliar o desempenho dos estimadores de máxima verossimilhança para os parâmetros da distribuição beta bimodal inflacionada em zero. Para comparação com nossa proposta selecionamos os modelos de regressão beta e regressão beta inflacionada, que são abordagens mais usuais, e o algoritmo SVR , devido a significativa superioridade relatada em outros trabalhos. / Financial institutions willing to use the advanced Internal Ratings Based (IRB) need to develop methods to estimate the LGD (Loss Given Default) risk component. Proposals for PD (Probability of default) modeling have been presented since the 1950s, in contrast, LGDs forecast has received more attention only after the publication of the Basel II Accord. LGD also has a small literature, compared to PD, and there is no efficient method in terms of accuracy and interpretation such as logistic regression for PD. Regression models for LGD play a key role in the risk management of financial institutions, due to their importance this work proposes a methodology to quantify the LGD risk component. Considering the characteristics reported on the distribution of LGD and in the flexible form that the beta distribution may assume, we propose a methodology for estimation of LGD using the zero inflated bimodal beta regression model. We developed the zero inflated bimodal beta distribution, presented some properties, including moments, defined estimators via maximum likelihood and constructed the regression model for this probabilistic model, presented asymptotic confidence intervals and hypothesis test for this model, as well as selection criteria of models, we performed a simulation study to evaluate the performance of the maximum likelihood estimators for the parameters of the zero inflated bimodal beta distribution. For comparison with our proposal we selected the beta regression models and inflated beta regression, which are more usual approaches, and the SVR algorithm, due to the significant superiority reported in other studies.
502

Modelos de regressão beta inflacionados truncados / The truncated inflated beta regression

Pereira, Gustavo Henrique de Araujo 24 May 2012 (has links)
Os modelos de regressão beta e beta inflacionados conseguem ajustar adequadamente grande parte das variáveis do tipo proporção. No entanto, esses modelos não são úteis quando a variável resposta não pode assumir valores no intervalo (0,c) e assume o valor c com probabilidade positiva. Variáveis relacionadas a algum tipo de pagamento limitado entre dois valores, quando estudadas em relação ao seu valor máximo, possuem essas características. Para ajustar essas variáveis, introduzimos a distribuição beta inflacionada truncada (BIZUT), que é uma mistura de uma distribuição beta com suporte no intervalo (c,1) e uma distribuição trinomial que assume os valores zero, um e c. Propomos ainda um modelo de regressão para as situações em que a variável resposta tem distribuição BIZUT. Admitimos que todos os parâmetros da distribuição podem variar em função de variáveis preditoras. Além disso, o modelo permite que o parâmetro conhecido c varie entre as unidades populacionais. Para esse modelo são desenvolvidos diversos aspectos inferenciais, são obtidos resultados para as situações em que c é variável e são conduzidos estudos de simulação de Monte Carlo. Além disso, discutimos análise de resíduos, desenvolvemos análise de influência local e realizamos uma aplicação a dados reais de cartão de crédito. / The beta regression model or the inflated beta regression model may be a reasonable choice to fit a proportion in most situations. However, they do not fit well variables that do not assume values in the open interval (0,c), 0 < c < 1 and assume the c value with positive probability. Variables related to a kind of double bounded payment amount when studied as a proportion of the maximum payment amount have this feature. For these variables, we introduce the truncated inflated beta distribution (TBEINF). This proposed distribution is a mixture of the beta distribution bounded in the open interval (c,1) and a trinomial distribution that assumes the values zero, one and c. This work also proposes a regression model where the response variable is TBEINF distributed. The model allows all the unknown parameters of the conditional distribution of the response variable to be modeled as functions of explanatory variables. Moreover, the model allows nonconstant known parameter c across population units. For this model, some inferential aspects are developed, some results when c is not constant are obtained and Monte Carlo simulation studies are performed. In addition, residual and local influence analysis are discussed and an application to credit card data is presented.
503

Regressão logística com erro de medida: comparação de métodos de estimação / Logistic regression model with measurement error: a comparison of estimation methods

Rodrigues, Agatha Sacramento 27 June 2013 (has links)
Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos os métodos em relação à estimação, através do viés e da raiz do erro quadrático médio, e em relação à predição de novas observações, através das medidas de desempenho sensibilidade, especificidade, verdadeiro preditivo positivo, verdadeiro preditivo negativo, acurácia e estatística de Kolmogorov-Smirnov. Os estudos de simulação evidenciam o melhor desempenho do método de máxima pseudoverossimilhança na estimação. Para as medidas de desempenho na predição não há diferença entre os métodos de estimação. Por fim, utilizamos nossos resultados em dois conjuntos de dados reais de diferentes áreas: área médica, cujo objetivo está na estimação da razão de chances, e área financeira, cujo intuito é a predição de novas observações. / We study the logistic model when explanatory variables are measured with error. Three estimation methods are presented, namely maximum pseudo-likelihood obtained through a Monte Carlo expectation-maximization type algorithm, regression calibration, SIMEX and naïve, which ignores the measurement error. These methods are compared through simulation. From the estimation point of view, we compare the different methods by evaluating their biases and root mean square errors. The predictive quality of the methods is evaluated based on sensitivity, specificity, positive and negative predictive values, accuracy and the Kolmogorov-Smirnov statistic. The simulation studies show that the best performing method is the maximum pseudo-likelihood method when the objective is to estimate the parameters. There is no difference among the estimation methods for predictive purposes. The results are illustrated in two real data sets from different application areas: medical area, whose goal is the estimation of the odds ratio, and financial area, whose goal is the prediction of new observations.
504

Modelos de regressão beta com erro nas variáveis / Beta regression model with measurement error

Carrasco, Jalmar Manuel Farfan 25 May 2012 (has links)
Neste trabalho de tese propomos um modelo de regressão beta com erros de medida. Esta proposta é uma área inexplorada em modelos não lineares na presença de erros de medição. Abordamos metodologias de estimação, como máxima verossimilhança aproximada, máxima pseudo-verossimilhança aproximada e calibração da regressão. O método de máxima verossimilhança aproximada determina as estimativas maximizando diretamente o logaritmo da função de verossimilhança. O método de máxima pseudo-verossimilhança aproximada é utilizado quando a inferência em um determinado modelo envolve apenas alguns mas não todos os parâmetros. Nesse sentido, dizemos que o modelo apresenta parâmetros de interesse como também de perturbação. Quando substituímos a verdadeira covariável (variável não observada) por uma estimativa da esperança condicional da variável não observada dada a observada, o método é conhecido como calibração da regressão. Comparamos as metodologias de estimação mediante um estudo de simulação de Monte Carlo. Este estudo de simulação evidenciou que os métodos de máxima verossimilhança aproximada e máxima pseudo-verossimilhança aproximada tiveram melhor desempenho frente aos métodos de calibração da regressão e naïve (ingênuo). Utilizamos a linguagem de programação Ox (Doornik, 2011) como suporte computacional. Encontramos a distribuição assintótica dos estimadores, com o objetivo de calcular intervalos de confiança e testar hipóteses, tal como propõem Carroll et. al.(2006, Seção A.6.6), Guolo (2011) e Gong e Samaniego (1981). Ademais, são utilizadas as estatísticas da razão de verossimilhanças e gradiente para testar hipóteses. Num estudo de simulação realizado, avaliamos o desempenho dos testes da razão de verossimilhanças e gradiente. Desenvolvemos técnicas de diagnóstico para o modelo de regressão beta com erros de medida. Propomos o resíduo ponderado padronizado tal como definem Espinheira (2008) com o objetivo de verificar as suposições assumidas ao modelo e detectar pontos aberrantes. Medidas de influência global, tais como a distância de Cook generalizada e o afastamento da verossimilhança, são utilizadas para detectar pontos influentes. Além disso, utilizamos a técnica de influência local conformal sob três esquemas de perturbação (ponderação de casos, perturbação da variável resposta e perturbação da covariável com e sem erros de medida). Aplicamos nossos resultados a dois conjuntos de dados reais para exemplificar a teoria desenvolvida. Finalmente, apresentamos algumas conclusões e possíveis trabalhos futuros. / In this thesis, we propose a beta regression model with measurement error. Among nonlinear models with measurement error, such a model has not been studied extensively. Here, we discuss estimation methods such as maximum likelihood, pseudo-maximum likelihood, and regression calibration methods. The maximum likelihood method estimates parameters by directly maximizing the logarithm of the likelihood function. The pseudo-maximum likelihood method is used when the inference in a given model involves only some but not all parameters. Hence, we say that the model under study presents parameters of interest, as well as nuisance parameters. When we replace the true covariate (observed variable) with conditional estimates of the unobserved variable given the observed variable, the method is known as regression calibration. We compare the aforementioned estimation methods through a Monte Carlo simulation study. This simulation study shows that maximum likelihood and pseudo-maximum likelihood methods perform better than the calibration regression method and the naïve approach. We use the programming language Ox (Doornik, 2011) as a computational tool. We calculate the asymptotic distribution of estimators in order to calculate confidence intervals and test hypotheses, as proposed by Carroll et. al (2006, Section A.6.6), Guolo (2011) and Gong and Samaniego (1981). Moreover, we use the likelihood ratio and gradient statistics to test hypotheses. We carry out a simulation study to evaluate the performance of the likelihood ratio and gradient tests. We develop diagnostic tests for the beta regression model with measurement error. We propose weighted standardized residuals as defined by Espinheira (2008) to verify the assumptions made for the model and to detect outliers. The measures of global influence, such as the generalized Cook\'s distance and likelihood distance, are used to detect influential points. In addition, we use the conformal approach for evaluating local influence for three perturbation schemes: case-weight perturbation, respose variable perturbation, and perturbation in the covariate with and without measurement error. We apply our results to two sets of real data to illustrate the theory developed. Finally, we present our conclusions and possible future work.
505

Comparação entre regressão linear, redes neurais artificiais e árvores de regressão para quantificação do impacto harmônico de múltiplas cargas em redes elétricas de distribuição. / Comparison between linear regression, artificial neural networks and regression trees to quantify the harmonic impact of multiple loads on distribution networks.

PAIXÃO JÚNIOR, Ulisses Carvalho 19 November 2018 (has links)
Submitted by Luciclea Silva (luci@ufpa.br) on 2018-12-12T12:27:30Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_comparacaoregressaolinear.pdf: 10372922 bytes, checksum: 6a29cea1a5e1de013de1e246179fb197 (MD5) / Approved for entry into archive by Luciclea Silva (luci@ufpa.br) on 2018-12-12T12:28:06Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_comparacaoregressaolinear.pdf: 10372922 bytes, checksum: 6a29cea1a5e1de013de1e246179fb197 (MD5) / Made available in DSpace on 2018-12-12T12:28:06Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_comparacaoregressaolinear.pdf: 10372922 bytes, checksum: 6a29cea1a5e1de013de1e246179fb197 (MD5) Previous issue date: 2018-11-19 / Nos últimos anos, o desenvolvimento socioeconômico da população, o crescimento dos setores comercial e industrial, assim como a instalação cada vez mais crescente de novas cargas, têm gerado grande evolução na demanda do consumo de energia elétrica. Por sua vez, buscando obter sistemas mais eficientes, os fabricantes têm produzido equipamentos energeticamente mais eficientes para utilização residencial, comercial e industrial. No entanto, essas cargas, devido à sua não linearidade, têm contribuído significativamente para o aumento dos níveis de distorção harmônica de tensão e corrente, elevando a preocupação dos gestores do setor elétrico quanto a qualidade de energia elétrica (QEE), principalmente, pela dificuldade na identificação da origem da distorção harmônica. Logo, visando antecipar os efeitos harmônicos e atender a regulamentação vigente, por meio de técnicas computacionais, no presente trabalho dá-se ênfase no ponto de acoplamento comum (PAC), independente das características de consumo e cargas, com o intuito de avaliar os impactos harmônicos em sua rede, além de comparar o nível de confiabilidade das técnicas por meio do erro absoluto médio (EAM). A metodologia proposta utiliza o software de Sistema de Qualidade de Energia Elétrica (SISQEE) que possibilita a utilização de três técnicas computacionais distintas, sendo Regressão Linear, Redes Neurais Artificiais e Árvores de Regressão, para avaliar a contribuição harmônica de cada alimentador no ponto de interesse das redes elétricas escolhidas. Para comprovar a validade da metodologia, são elaborados dois estudos de caso baseadas em medições reais em uma universidade e em um polo industrial. As medições foram realizadas com o período mínimo amostral de sete dias através de analisadores de QEE, conforme procedimentos de distribuição da ANEEL (PRODIST). Como resultado da QEE, verificou-se o quanto cada alimentador impacta a distorção de tensão e corrente no PAC, além de classificar os alimentadores com relação a seu respectivo impacto na rede elétrica estudada. Também como resultado, os estudos propiciaram a avaliação de desempenho entre as diferentes técnicas, com diferentes intervalos de tempo (semanal, diário e por patamar de carga), permitindo classificar o comportamento e a confiabilidade de cada técnica em cada período. Como conclusão do trabalho, os métodos propostos e as análises apresentadas dão subsídios aos gestores para efetuar uma ação mitigadora mais eficiente dos impactos harmônicos causados na rede elétrica e, também, identificar as diferenças entre as técnicas e seu grau de confiabilidade, de acordo com os intervalos temporais estudados. / In recent years, the socio-economic development of the population, the growth of commercial and industrial sectors, as well as the ever-increasing installation of new electrical loads, have generated great evolution in demand of electricity consumption. In turn, to obtain more efficient systems, the manufacturers have produced equipment more energy efficient for residential, commercial and industrial use. However, these loads due their non-linearities, have contributed significantly to the increase in harmonic distortion levels of voltage and current, raising the concern of the power sector managers with respect to the power quality, mainly, due to the difficulty in the identification of the origin of the harmonic distortion. Therefore, to anticipate the harmonic effects and meet the current legislation, through computational techniques, this work emphasis is placed on the common coupling point (CCP) of consumers and utility, regardless of consumption characteristics and loads, to assess the harmonic impacts in his grid, besides comparing the reliability level of the techniques through the mean absolute error (MAE). The proposed methodology uses the Electrical Power Quality System (SISQEE) software that allows the use of three different computational techniques, such as Linear Regression, Artificial Neural Networks and Regression Trees, to evaluate the harmonic contribution of each feeder at the point of interest of the chosen electric grid. To prove the validity of the methodology, two case studies, based on real measurements at a university and at an industrial district, was carried out with a minimum sampling period of seven days using power quality analyzers, according to the distribution procedures by ANEEL (PRODIST). As a result of the power quality, it was verified how much each feeder impacts the voltage and current distortion at the CCP, besides classifying the feeders in relation to their respective impacts in the studied electrical grid. Also, as a result, the studies allowed the evaluation of performance between the different techniques, with different time intervals (weekly, daily and per load level), allowing to classify the behavior and reliability of each technique in each period. As a conclusion of the work, the proposed methods and analyzes presented allow managers to perform a more efficient mitigation action of the harmonic impacts caused in the electrical network and, also, to identify the differences between the techniques and their degree of reliability, in accordance with the time intervals studied.
506

Modelos para relacionar variáveis de solos e área basal de espécies florestais em uma área de vegetação natural / Models to relate variable soil and basal area of forest species in an area of natural vegeration

Grego, Simone 08 October 2014 (has links)
O padrão espacial de ocorrência de atributos de espécies florestais, tal como a área basal das árvores, pode fornecer informações para o entendimento da estrutura da comunidade vegetal. Uma vez que fatores ambientais podem influenciar tanto o padrão espacial de ocorrência quanto os atributos das espécies em florestas nativas. Desse modo, investigar a relação entre as características ambientais e o padrão espacial de espécies florestais pode ajudar a entender a dinâmica das florestas. Especificamente, neste trabalho, o objetivo é avaliar métodos estatísticos que permitam identificar quais atributos do solo são capazes de explicar a variação da área basal de cada espécie de árvore. A área basal foi considerada como variável resposta e como covariáveis, um grande número de atributos físicos e químicos do solo, medidos em uma malha de localizações cobrindo a área de estudo. Foram revisados e utilizados os métodos de regressão linear múltipla com método de seleção stepwise, modelos aditivos generalizados e árvores de regressão. Em uma segunda fase das análises, adicionou-se um efeito espacial aos modelos, com o intuito de verificar se havia ainda padrões na variabilidade, não capturados pelos modelos. Com isso, foram considerados os modelos autoregressivo simultâneo, condicional autoregressivo e geoestatístico. Dado o grande número de atributos do solo, as análises foram também conduzidas utilizando-se as covariáveis originais, fatores identificados em uma análise fatorial prévia dos atributos de solo. A seleção de modelos com melhor ajuste foi utilizada para identificar os atributos de solo relevantes, bem como a presença e melhor descrição de padrões espaciais. A área de estudo foi a Estação Ecológica de Assis, da Unidade de Conservação do Estado de São Paulo em parcelas permanentes, dentro do projeto \"Diversidade, Dinâmica e Conservação em Florestas do Estado de São Paulo: 40 ha de parcelas permanentes\", do programa Biota da FAPESP. As análises reportadas aqui se referem à área basal das espécies Copaifera langsdorffii, Vochysia tucanorum e Xylopia aromatica. Com os atributos de solo reduzidos e consistentemente associados à área basal, a declividade, altitude, saturação por alumínio e potássio mostraram-se relevantes para duas das espécies. Resultados obtidos mostraram a presença de um padrão na variabilidade, mesmo levando-se em consideração os efeitos das covariáveis, ou seja, os atributos do solo explicam parcialmente a variabilidade da área basal, mas existe um padrão que ocorre no espaço que não é capturado por essas covariáveis. / The spatial pattern of occurrenceis of forest species and their attributes, such as the basal area of trees, can provide information for understanding the structure of the vegetable community. Considering the environmental factors can influence the spatial pattern of occurrences of species in native forests and related attributes, describing relationship between environmental characteristics and spatial pattern of forest species can be associated with the dynamics of forests. The objective of the present study is to assess different statistical methods used to identify which soil attributes are associated with the basal area of each tree selected species. The basal area was considered as the response variable and the covariates are given by a large number of physical and chemical attributes of the soil, measured at a grid of locations covering the study area. The methods considered are the multiple linear regression with stepwise model selection, generalized additive models and regression trees. Spatial effects were added to the models, in order to ascertain whether there is residual spatial patterns not captured by the covariates. Thus, simultaneous autoregressive model, autoregressive conditional and geostatistical were considered. Considering the large number of soil attributes, analysis were were conducted both ways, using the original covariates, and using factors identified in a preliminar factor analysis of the soil attributes. Model selection was used to identify the relevant attributes of soil as well as the presence and better description of spatial patterns. The study area was the Ecological Station of Assis, the Conservation Unit of the State of São Paulo in permanent plots within the \"Diversity Dynamics and Conservation Forests in the State of São Paulo: 40 ha of permanent plots\" project, under the research project FAPESP biota. The analyzes reported here refer to the basal area of the species Copaifera langsdorffii, Vochysia tucanorum and Xylopia aromatica. Results differ among the considered methods reinforcing the reccomendation of considering differing modeling strategies. Covariates consistently associated with basal area are slope, altitude and aluminum saturation, potassium, relevant to at least two of the species. Results obtained showed the presence of patterns in residual variability, even taking into account the effects of covariates. The soil characteristics only partially explain the variability of the basal area and there are spatial patterns not captured by these covariates.
507

Predição de fator de simultaneidade através de modelos de regressão para proporções contínuas / Prediction of simultaneity factor using regression models for continuous proportions.

Zerbinatti, Luiz Fernando Molinari 29 February 2008 (has links)
O fator de simultaneidade é fundamental no planejamento de redes de distribuição de gás natural. Trata-se de um multiplicador entre 0 e 1 que ajusta o consumo total teórico de um número de aparelhos de utilização em condições reais. Em 2005 o Instituto de Pesquisas Tecnológicas (IPT) e a Companhia de Gás de São Paulo (COMGÁS) realizaram um estudo no qual determinou-se o fator de simultaneidade em um conjunto de edificações residenciais. Um modelo de regressão foi proposto para expressar o fator de simultaneidade em termos da potência total instalada. O modelo ajustado pode ser utilizado para predizer o fator de simultaneidade em novas edificações. O modelo em questão é um modelo de regressão linear normal no qual a variável resposta é o logaritmo do fator de simultaneidade. Nesta dissertação, o objetivo é investigar outras possibilidades de modelos de regressão adequados aos dados obtidos pelo IPT e pela COMGÁS. Especial atenção é dada ao modelo de regressão beta proposto por Ferrari e Cribari-Neto (Journal of Applied Statistics, 2004) por possuir vantagens sobre o modelo de regressão linear normal. O modelo de regressão beta assume que, dadas as covariáveis, a variável resposta possui distribuição beta, sendo adequado para modelar dados observados no intervalo unitário. Desta forma, a transformação na variável resposta - o fator de simultaneidade - é desnecessária. Além disso, é proposta uma nova abordagem para a predição do fator de simultaneidade, diferente de todas as abordagens pesquisadas na literatura, utilizando a técnica de bootstrap. / The simultaneity factor is fundamental in planning gas distribution networks. It is a multiplicator between 0 and 1 that adjusts the theoretical total consumption of a number of devices to realistic conditions. In 2005, the Instituto de Pesquisas Tecnológicas (IPT) and the Companhia de Gás de São Paulo (COMGÁS) performed a study in which the simultaneity factor of gas consumption in a set of residential buildings have been determined. A regression model was proposed to express the simultaneity factor in terms of the total power of installed equipment. The fitted model can be used to predict the simultaneity factor in new buildings. The model they proposed is a normal linear regression model in which the response variable is the logarithm of the simultaneity factor. In the present dissertation, our aim is to investigate other possible regression models suitable to the data obtained by IPT and CONGÁS. Emphasis is given to the beta regression model proposed by Ferrari and Cribari-Neto (Journal of Applied Statistics, 2004) which has a number of advantages over normal linear regression models. The beta regression model assumes that, given the covariates, the response variable has a beta distribution, which is adequate to model data observed in the unit interval. Therefore, no transformation in the response variable, the simultaneity factor, is needed. Additionally, we present a new approach for the prediction of the simultaneity factor, that is different from all the approaches shown in the literature, using the bootstrap technique.
508

Modelo de regressão para sistemas reparáveis: um estudo da confiabilidade de colhedoras de cana-de-açúcar / Regression model for reparable systems: a study of the reliability of sugarcane harvesters

Bruna Aparecida Wruck Verssani 15 October 2018 (has links)
A análise de confiabilidade desempenha um papel fundamental para estudos de durabilidade e otimização de tempos de reparo em sistemas reparáveis. Equipamentos como colhedoras de cana-de-açúcar que após a falha e um reparo voltam a exercer sua função objetivo são classificados como sistemas reparáveis. O objetivo deste trabalho consistiu em propor alternativas de modelagem para sistemas complexos, que apresentam grande variabilidade no comportamento da função intensidade de falha. Foi proposta a nova distribuição odd log-logística Weibull flexível generalizada (GOLLFW) e um modelo de regressão Weibull aplicado ao processo lei de potência usado para analisar sistemas reparáveis. Para a nova distribuição foi apresentada a família de distribuições odd log-logística generalizada, realizado um estudo de simulação para verificar algumas propriedades dos estimadores de máxima verossimilhança e incluídas covariáveis na análise dos tempos de falha através do modelo de regressão GOLLFW. Para a análise de regressão considerando os sistemas reparáveis, foram apresentados os principais modelos de contagem para um único sistema reparável e realizado a análise deles de forma separada e, em seguida, foram considerados mais de dois sistemas e acrescentado um modelo de regressão Weibull ao processo lei de potência (PLP). A característica de bimodalidade da distribuição GOLLFW garantiu a adequabilidade e um melhor ajuste aos dados. Já a inclusão de covariáveis através do modelo de regressão Weibull no PLP permitiu modelar sistemas que antes somente os processos de contagens tradicionais, processo lei de potência e processo de renovação, não se adequariam bem. / The confiability analysis carries out an important role for durability studies and optimization of repair time in repairable systems. Repairable systems are equipments that returns to execute its function after a fail, for example, sugarcane harvester. This work aimed to propose modeling alternatives for complex systems with great variability in the behaviour of fail intensity function. It was proposed a new distribution on generalized odd log-logistic flexible Weibull (GOLLFW) and an Weibull regression model applied to potential law used to analyze repairable systems.It was presented the distribution family generalized odd log-logistic, was carried out a simulation study to verify some properties of maximum likelihood estimators and was included covariables in the fail time by regression model GOLLFW. To the regression analysis considering repairable systems, it was presented the main counting models for a single repairable system and it was performed an analysis of each model singly, then, it was considered more than two systems and it was added a Weibull regression model to the potential law process (PLP). The bimodality characteristic of GOLLFW distribution guaranteed the suitability and a better adjust to tested datas. While, the inclusion of covariables by regression model GOLLFW in the PLP allowed to model systems which traditionals counting process, PLP and renewal process, would not fit well.
509

Modelos de regressão beta inflacionados truncados / The truncated inflated beta regression

Gustavo Henrique de Araujo Pereira 24 May 2012 (has links)
Os modelos de regressão beta e beta inflacionados conseguem ajustar adequadamente grande parte das variáveis do tipo proporção. No entanto, esses modelos não são úteis quando a variável resposta não pode assumir valores no intervalo (0,c) e assume o valor c com probabilidade positiva. Variáveis relacionadas a algum tipo de pagamento limitado entre dois valores, quando estudadas em relação ao seu valor máximo, possuem essas características. Para ajustar essas variáveis, introduzimos a distribuição beta inflacionada truncada (BIZUT), que é uma mistura de uma distribuição beta com suporte no intervalo (c,1) e uma distribuição trinomial que assume os valores zero, um e c. Propomos ainda um modelo de regressão para as situações em que a variável resposta tem distribuição BIZUT. Admitimos que todos os parâmetros da distribuição podem variar em função de variáveis preditoras. Além disso, o modelo permite que o parâmetro conhecido c varie entre as unidades populacionais. Para esse modelo são desenvolvidos diversos aspectos inferenciais, são obtidos resultados para as situações em que c é variável e são conduzidos estudos de simulação de Monte Carlo. Além disso, discutimos análise de resíduos, desenvolvemos análise de influência local e realizamos uma aplicação a dados reais de cartão de crédito. / The beta regression model or the inflated beta regression model may be a reasonable choice to fit a proportion in most situations. However, they do not fit well variables that do not assume values in the open interval (0,c), 0 < c < 1 and assume the c value with positive probability. Variables related to a kind of double bounded payment amount when studied as a proportion of the maximum payment amount have this feature. For these variables, we introduce the truncated inflated beta distribution (TBEINF). This proposed distribution is a mixture of the beta distribution bounded in the open interval (c,1) and a trinomial distribution that assumes the values zero, one and c. This work also proposes a regression model where the response variable is TBEINF distributed. The model allows all the unknown parameters of the conditional distribution of the response variable to be modeled as functions of explanatory variables. Moreover, the model allows nonconstant known parameter c across population units. For this model, some inferential aspects are developed, some results when c is not constant are obtained and Monte Carlo simulation studies are performed. In addition, residual and local influence analysis are discussed and an application to credit card data is presented.
510

Modelos de regressão beta com erro nas variáveis / Beta regression model with measurement error

Jalmar Manuel Farfan Carrasco 25 May 2012 (has links)
Neste trabalho de tese propomos um modelo de regressão beta com erros de medida. Esta proposta é uma área inexplorada em modelos não lineares na presença de erros de medição. Abordamos metodologias de estimação, como máxima verossimilhança aproximada, máxima pseudo-verossimilhança aproximada e calibração da regressão. O método de máxima verossimilhança aproximada determina as estimativas maximizando diretamente o logaritmo da função de verossimilhança. O método de máxima pseudo-verossimilhança aproximada é utilizado quando a inferência em um determinado modelo envolve apenas alguns mas não todos os parâmetros. Nesse sentido, dizemos que o modelo apresenta parâmetros de interesse como também de perturbação. Quando substituímos a verdadeira covariável (variável não observada) por uma estimativa da esperança condicional da variável não observada dada a observada, o método é conhecido como calibração da regressão. Comparamos as metodologias de estimação mediante um estudo de simulação de Monte Carlo. Este estudo de simulação evidenciou que os métodos de máxima verossimilhança aproximada e máxima pseudo-verossimilhança aproximada tiveram melhor desempenho frente aos métodos de calibração da regressão e naïve (ingênuo). Utilizamos a linguagem de programação Ox (Doornik, 2011) como suporte computacional. Encontramos a distribuição assintótica dos estimadores, com o objetivo de calcular intervalos de confiança e testar hipóteses, tal como propõem Carroll et. al.(2006, Seção A.6.6), Guolo (2011) e Gong e Samaniego (1981). Ademais, são utilizadas as estatísticas da razão de verossimilhanças e gradiente para testar hipóteses. Num estudo de simulação realizado, avaliamos o desempenho dos testes da razão de verossimilhanças e gradiente. Desenvolvemos técnicas de diagnóstico para o modelo de regressão beta com erros de medida. Propomos o resíduo ponderado padronizado tal como definem Espinheira (2008) com o objetivo de verificar as suposições assumidas ao modelo e detectar pontos aberrantes. Medidas de influência global, tais como a distância de Cook generalizada e o afastamento da verossimilhança, são utilizadas para detectar pontos influentes. Além disso, utilizamos a técnica de influência local conformal sob três esquemas de perturbação (ponderação de casos, perturbação da variável resposta e perturbação da covariável com e sem erros de medida). Aplicamos nossos resultados a dois conjuntos de dados reais para exemplificar a teoria desenvolvida. Finalmente, apresentamos algumas conclusões e possíveis trabalhos futuros. / In this thesis, we propose a beta regression model with measurement error. Among nonlinear models with measurement error, such a model has not been studied extensively. Here, we discuss estimation methods such as maximum likelihood, pseudo-maximum likelihood, and regression calibration methods. The maximum likelihood method estimates parameters by directly maximizing the logarithm of the likelihood function. The pseudo-maximum likelihood method is used when the inference in a given model involves only some but not all parameters. Hence, we say that the model under study presents parameters of interest, as well as nuisance parameters. When we replace the true covariate (observed variable) with conditional estimates of the unobserved variable given the observed variable, the method is known as regression calibration. We compare the aforementioned estimation methods through a Monte Carlo simulation study. This simulation study shows that maximum likelihood and pseudo-maximum likelihood methods perform better than the calibration regression method and the naïve approach. We use the programming language Ox (Doornik, 2011) as a computational tool. We calculate the asymptotic distribution of estimators in order to calculate confidence intervals and test hypotheses, as proposed by Carroll et. al (2006, Section A.6.6), Guolo (2011) and Gong and Samaniego (1981). Moreover, we use the likelihood ratio and gradient statistics to test hypotheses. We carry out a simulation study to evaluate the performance of the likelihood ratio and gradient tests. We develop diagnostic tests for the beta regression model with measurement error. We propose weighted standardized residuals as defined by Espinheira (2008) to verify the assumptions made for the model and to detect outliers. The measures of global influence, such as the generalized Cook\'s distance and likelihood distance, are used to detect influential points. In addition, we use the conformal approach for evaluating local influence for three perturbation schemes: case-weight perturbation, respose variable perturbation, and perturbation in the covariate with and without measurement error. We apply our results to two sets of real data to illustrate the theory developed. Finally, we present our conclusions and possible future work.

Page generated in 0.0488 seconds