• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 103
  • 67
  • 36
  • 32
  • 20
  • 20
  • 18
  • 6
  • 6
  • 4
  • 4
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 341
  • 341
  • 71
  • 65
  • 63
  • 53
  • 53
  • 40
  • 34
  • 33
  • 32
  • 27
  • 26
  • 25
  • 24
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
121

Penalized regression models for compositional data / Métodos de regressão penalizados para dados composicionais

Shimizu, Taciana Kisaki Oliveira 10 December 2018 (has links)
Compositional data consist of known vectors such as compositions whose components are positive and defined in the interval (0,1) representing proportions or fractions of a whole, where the sum of these components must be equal to one. Compositional data is present in different areas, such as in geology, ecology, economy, medicine, among many others. Thus, there is great interest in new modeling approaches for compositional data, mainly when there is an influence of covariates in this type of data. In this context, the main objective of this thesis is to address the new approach of regression models applied in compositional data. The main idea consists of developing a marked method by penalized regression, in particular the Lasso (least absolute shrinkage and selection operator), elastic net and Spike-and-Slab Lasso (SSL) for the estimation of parameters of the models. In particular, we envision developing this modeling for compositional data, when the number of explanatory variables exceeds the number of observations in the presence of large databases, and when there are constraints on the dependent variables and covariates. / Dados composicionais consistem em vetores conhecidos como composições cujos componentes são positivos e definidos no intervalo (0,1) representando proporções ou frações de um todo, sendo que a soma desses componentes totalizam um. Tais dados estão presentes em diferentes áreas, como na geologia, ecologia, economia, medicina entre outras. Desta forma, há um grande interesse em ampliar os conhecimentos acerca da modelagem de dados composicionais, principalmente quando há a influência de covariáveis nesse tipo de dado. Nesse contexto, a presente tese tem por objetivo propor uma nova abordagem de modelos de regressão aplicada em dados composicionais. A ideia central consiste no desenvolvimento de um método balizado por regressão penalizada, em particular Lasso, do inglês least absolute shrinkage and selection operator, elastic net e Spike-e-Slab Lasso (SSL) para a estimação dos parâmetros do modelo. Em particular, visionamos o desenvolvimento dessa modelagem para dados composicionais, com o número de variáveis explicativas excedendo o número de observações e na presença de grandes bases de dados, e além disso, quando há restrição na variável resposta e nas covariáveis.
122

Modelo de regressão log-Weibull modificado e a nova distribuição Weibull modificada generalizada / Log-modified Weibull regression models and a new generalized modified Weibull distribution

Farfán Carrasco, Jalmar Manuel 09 November 2007 (has links)
Neste trabalho propomos um modelo de regress~ao utilizando a distribuição Weibull modificado, esta distribuição pode ser usada para modelar dados de sobrevivência quando a de função de risco tem forma de U ou banheira. Assumindo dados censurados, é considerado os estimadores de máxima verossimilhança e Jackknife para os parâmetros do modelo proposto. Foram derivadas as matrizes apropriadas para avaliar influiência local sobre os parâmetros estimados considerando diferentes peturbações e também é apresen- tada alguma medidas de influência global. Para diferentes parâmetros fixados, tamanhos de amostra e porcentagem de censuras, varia simulações foram feitas para avaliar a distribuição empírica do resíduo deviance modificado e comparado coma distribuição normal padrão. Esses estudos sugerem que a distribuição empírica do resíduo devianve modificado para o modelo de regressão log-Weibull modificado com dados censurados aproxima-se de uma dis- tribuição normal padrão. Finalmente analisamos um conjunto de dados utilizando o modelo de regressão log-Weibull modificado. Uma nova distribuição de quatro parâmetros é definida para modelar dados de tempo de vida. Algumas propriedades da distribuição é discutida, assim como ilustramos com exemplos a aplicação dessa nova distribuição. Palavras-chaves: Modelo de regressão; Distribuição Weibull modificada; Distribuição weibull modificada generalizada; Análise de sensibilidade; Dados censurados; Análise de resíduo / In this paperwork are proposed a regression model considering the modified Weibull distribution. This distribution can be used to model bathtub-shaped failure rate functions. Assuming censored data, we consider a classic and Jackknife estimator for the parameters of the model. We derive the appropriate matrices for assessing local influence on the parameter estimates under diferent perturbation schemes and we also present some ways to perform global influence. Besides, for diferent parameter settings, sample sizes and censoring percentages, various simulations are performed and the empirical distribution of the deviance modified residual is displayed and compared with the standard normal distribution. These studies suggest that the residual analysis usually performed in normal linear regression models can be straightforwardly extend for a martingale-type residual in log-modifiedWeibull regression models with censored data. Finally, we analyze a real data set under log-modified Weibull regression models. A diagnostic analysis and a model checking based on the deviance modified residual are performed to select an appropriate model. A new four-parameter distribution is introduced. Various properties the new distribution are discussed. Illustrative examples based on real data are also given.
123

Associação entre tempestades geomagnéticas e internações por infarto agudo do miocárdio / Association between geomagnetic activity and daily hospitalization by acute myocardial infarction.

Kutschenko, Andressa 19 December 2012 (has links)
Os diversos fenômenos solares mostram que a sua atividade não é constante, sendo as manchas solares observadas em sua fotosfera um indicador de atividade do Sol. Os números dessas manchas seguem um ciclo de 11 anos que alterna entre máximos e mínimos; quanto maior o número de manchas, maior o número de erupções no Sol. A literatura médica vem mostrando algumas evidências de que a atividade solar possui alguma relação com a predisposição das pessoas a algumas doenças. As tempestades geomagnéticas são associadas a doenças cardiovasculares, mudanças na pressão arterial sistólica, gravidade da crise de enxaqueca, distúrbios psiquiátricos. As condições da atividade geomagnética são classificadas segundo Batista (2003) em uma escala de Calma, Transição, Ativo, Tempestade fraca, Tempestade intensa ou Tempestade muito intensa. No presente projeto de pesquisa, objetiva-se investigar a associação entre atividade geomagnética e internações diárias por infarto nos hospitais de Ribeirão Preto e região, no período de 1998 a 2007. A hipótese em estudo é que em dias de condições de atividade geomagnética muito perturbada, o número médio de internações por doenças isquêmicas do coração é maior. Para a análise dos dados foi utilizado o modelo de regressão de Poisson com função logarítmica com o auxílio do software SAS 9.2, utilizando o procedimento PROC GENMOD. Observa-se que há evidências de associação entre tempestades geomagnéticas e internações por IAM. / Numerous solar phenomena demonstrate that their activities are not continual, and sunspots noticed in their photosphere are considered an indicator by Suns activity. Numbers linked with these sunspots follow an eleven-year cycle, which alternates between high and low, it means, the greater the number of sunspots, the greater the number of Sun eruptions. Medical Literature has produced evidences that solar activity has some association with people predisposing to some diseases. Geomagnetic storms are related with cardiovascular disease, changes in systolic blood pressure, severity and psychiatric disorders. According to Batista (2003), geomagnetic activity conditions are categorized on a scale of Quiet, Transition, Acting, Weak Storm, Intense Storm or Very Intense Storm. This study intends to investigate the association between geomagnetic activity and daily hospitalization by acute myocardial infarction (AMI) in Ribeirão Preto and its region from 1998 to 2007. The hypothesis being studied is that: day which has unquiet geomagnetic condition, the average number of hospitalizations originated by ischemic heart disease is higher. In order to get on with data analysis, it was used Poissons regression model, with logarithmic function through SAS 9.2, using PROC GENMOD procedure. In consequence, it is observed that there are evidences between geomagnetic storms and hospitalizations by AMI.
124

Análise da dinâmica do potássio e nitrato em colunas de solo não saturado por meio de modelos não lineares e multiresposta / Analysis of the dynamics of potassium and nitrate in soil columns unsaturated through nonlinear model and multi-response

Peixoto, Ana Patricia Bastos 02 August 2013 (has links)
Nos últimos anos grande número de modelos computacionais tem sido propostos com o intuito de descrever o movimento de solutos no perfil do solo, apesar disso, o que se observa é que existe grande dificuldade em se modelar esses fenômenos, para que o modelo possa predizer o processo de deslocamento e retenção dos solutos na natureza. Para tanto, o objetivo deste trabalho foi utilizar um modelo estatístico para descrever o transporte dos solutos no perfil do solo. Dessa forma, foi realizado um experimento em laboratório e observado os níveis de potássio e nitrato ao longo do perfil dos solos Latossolo Vermelho Amarelo e Nitossolo Vermelho. Para inferir sobre essas variáveis foram consideradas duas abordagens. Para a primeira abordagem foi utilizado um modelo de regressão não linear para cada uma das variáveis, cujos parâmetros do modelo apresentam uma interpretação prática, na área de solos. Para esse modelo foi realizado um esboço sobre a não linearidade do mesmo para verificar as propriedades assintóticas dos estimadores dos parâmetros. Para o método de estimação foi considerado, o método de mínimos quadrados e o método de bootstrap. Além disso, foi realizada uma análise de diagnóstico para verificar a adequação do modelo, bem como identificar pontos discrepantes. Por outro lado, para outra abordagem, foi utilizado um modelo multiresposta para analisar o comportamento das variáveis nitrato e potássio ao longo do perfil dos solos, conjuntamente. Para esse modelo foi utilizado o método da máxima verossimilhança para encontrar as estimativas dos parâmetros do modelo. Em ambas as situações, observou-se a adequação dos modelos para descrever o comportamento dos solutos nos solos, sendo uma alternativa para os pesquisadores que trabalham com estudo de solos. O modelo logístico com quatro parâmetros se destacou por apresentar melhores propriedades, como medidas de não linearidade e boa qualidade de ajuste. / In the last years, several computational models have been proposed to describe the movement of solutes in the soil profile, but what is observed is that there is great difficulty in model these phenomena, so that model can predict the displacement process and retention of solutes in nature. Thus, the aim of this study was to use a statistical model to describe the transport of solutes in the soil profile. Therefore, an experiment was conducted in the laboratory and observed levels of potassium and nitrate along the depth of soil Oxisol (Haplustox) and Hapludox,. To make inferences about these variables were considered two approaches. For the first approach was utilized a non-linear regression model for each variable and the model parameters have a practical interpretation on soil. For this model we performed a sketch on the nonlinearity of the model to check the asymptotic properties of parameter estimators. To estimate the parameters were considered the least squares method and the bootstrap method. In addition, we performed a diagnostic analysis to verify the adequacy of the model and identify outliers. In the second approach considered was using a multi-response model to analyze the behavior of the variables nitrate and potassium throughout the soil profile together. For this model we used the maximum likelihood method to estimate the model parameters. In both cases, we observed the suitability of the models to describe the behavior of solutes in soils, being an alternative for researchers working on the study of soils. The logistic model with four parameters stood out with better properties, such as non-linearity and good fit.
125

Caracterização da chuva estimada pelo radar durante eventos de alagamento na cidade de São Paulo / Characterization of precipitation estimated by radar during flooding events in São Paulo

Lopez, Andrea Salome Viteri 30 July 2018 (has links)
Este projeto de mestrado apresenta uma caracterização das chuvas estimadas pelo radar meteorológico Doppler de dupla polarização banda S (SPOL) do Departamento de Águas e Energia Elétrica (DAEE) e Fundação Centro Tecnológico de Hidráulica (FCTH) durante eventos com ou sem alagamento para cada bairro da cidade de São Paulo durante o ano de 2015. A caracterização foi determinada a partir da função densidade de probabilidade (PDF) da chuva acumulada e da taxa de precipitação, duração da chuva e fração da área de cada bairro onde ocorreu a chuva. Na média, os eventos de alagamento estavam associados com um volume de chuva maior que 30mm e taxa precipitação máxima maior que 30mm/h. Com relação à duração não foi possível encontrar um padrão médio, pois a chuva teve duração mínima de 20 minutos e máxima de 23 horas. Por outro lado, eventos de alagamento tinham alcançado mais de 27% da área do bairro com taxa de precipitação maior que 30 mm/h e 50 mm/h. Destaca-se ao longo desta análise que os bairros localizados próximos aos rios Tietê e Pinheiros e a região central da cidade de São Paulo apresentaram maior probabilidade de ocorrência de alagamento com volumes de chuva mais baixos do que a média de 30 mm por dia e também registraram maior recorrência de pontos alagados. Por último foi desenvolvido um método de regressão logística binária para calcular a probabilidade de ocorrência de alagamentos nos diversos bairros da cidade São Paulo. Este modelo utiliza como parâmetros de entrada a duração da chuva, a taxa de precipitação máxima e a chuva acumulada nas últimas 24 horas. O modelo apresentou uma probabilidade de detecção (POD) média de 1% e uma taxa de falso alarme média (FAR) de 0,6 para os eventos de alagamento, já para eventos sem alagamento o POD médio foi de 96% e a FAR foi de 2,5%. Portanto o modelo consegue prever os casos sem alagamento. / This dissertation project presents a characterization of the rainfall estimated from a dual-polarization S-band Doppler meteorological radar (SPOL) of the Department of Water and Electric Energy (DAEE) and Foundation Technological Center of Hydraulics (FCTH) during with or without flooding events for each neighborhood of the city of São Paulo over the year 2015. The characterization was determined by the probability density function (PDF) of the accumulated rainfall and the precipitation rate, rainfall duration and rainfall-area fraction in the neighborhoods. In average, flood events were associated with a rainfall volume greater than 30mm and a maximum rainfall rate greater than 30mm/h. Regarding the duration, it was not possible to find an average pattern, because the rain had a minimum duration of 20 minutes and a maximum of 23 hours. On the other hand, flood events had reached more than 27% of the neighborhood\'s area with a precipitation rate greater than 30 mm/h and 50 mm/h. It is highlighted throughout this analysis that the neighborhoods located near the Tietê and Pinheiros rivers and central region of the city of São Paulo presented a higher probability of flood occurrence with rainfall volumes lower than the average of 30 mm per day and also recorded higher recurrence of flooded spots. Finally, a binary logistic regression method was developed to estimate the probability of occurrence of flooding in the various neighborhoods of the city of São Paulo. This model uses as input parameters rainfall duration, maximum rainfall rate and accumulated rainfall in the last 24 hours. The model presented a mean probability of detection (POD) of 1% and a mean false alarm rate (FAR) of 0,6 for flood events. On the other hand, for events without occurrence of flood a mean POD was 96% and FAR 2,5. Therefore, the model can predict the events without flooding.
126

Is financial health a determinant of sport success?

Malmqvist, Albin, Hammarström, Marcus January 2019 (has links)
The purpose of this study is to find the relationship between financial health in an ice hockey club and its sport success. The study answers the research question: How can financial health of Swedish ice hockey clubs be able to explain the sport success in the Swedish Hockey League? Based on the research question, the study uses the theory Benchmarking and a more specific benchmarking terminology called Financial benchmarking. The study selects eight financial variables in order to benchmark the icehockey clubs in the Swedish Hockey League (SHL). A particular methodology within financial benchmarking, called Grey Relational Analysis (GRA), is used in order to determine the financial health of the clubs in relation to each other and therefore be able to rank the clubs based on each individual variable. The same financial variables, with the addition of four non-financial variables and exclusion of two financial variables, are used in a selected Logistic Regression model to explain how the variables contribute to the sport success of the clubs. The main conclusions which can be drawn from the study are as follows: The variables Net sales and Net profit are the two only variables which are statistically significant and are able to contribute to sport success. Secondly, the club HV71 is overall the club with the most optimal financial health in SHL, among the 12 clubs investigated. Lastly, accounting trends within this industry affects the financial outcome and further how it explained sport success. Trends such as a minimal or no amount of long-term liabilities is common among the clubs, where instead the total amount of liabilities mainly consists of current liabilities. It can be further concluded that profitability, revenue and equity are financial corner stones in a hockey club which participates in SHL.
127

Caracterização da chuva estimada pelo radar durante eventos de alagamento na cidade de São Paulo / Characterization of precipitation estimated by radar during flooding events in São Paulo

Andrea Salome Viteri Lopez 30 July 2018 (has links)
Este projeto de mestrado apresenta uma caracterização das chuvas estimadas pelo radar meteorológico Doppler de dupla polarização banda S (SPOL) do Departamento de Águas e Energia Elétrica (DAEE) e Fundação Centro Tecnológico de Hidráulica (FCTH) durante eventos com ou sem alagamento para cada bairro da cidade de São Paulo durante o ano de 2015. A caracterização foi determinada a partir da função densidade de probabilidade (PDF) da chuva acumulada e da taxa de precipitação, duração da chuva e fração da área de cada bairro onde ocorreu a chuva. Na média, os eventos de alagamento estavam associados com um volume de chuva maior que 30mm e taxa precipitação máxima maior que 30mm/h. Com relação à duração não foi possível encontrar um padrão médio, pois a chuva teve duração mínima de 20 minutos e máxima de 23 horas. Por outro lado, eventos de alagamento tinham alcançado mais de 27% da área do bairro com taxa de precipitação maior que 30 mm/h e 50 mm/h. Destaca-se ao longo desta análise que os bairros localizados próximos aos rios Tietê e Pinheiros e a região central da cidade de São Paulo apresentaram maior probabilidade de ocorrência de alagamento com volumes de chuva mais baixos do que a média de 30 mm por dia e também registraram maior recorrência de pontos alagados. Por último foi desenvolvido um método de regressão logística binária para calcular a probabilidade de ocorrência de alagamentos nos diversos bairros da cidade São Paulo. Este modelo utiliza como parâmetros de entrada a duração da chuva, a taxa de precipitação máxima e a chuva acumulada nas últimas 24 horas. O modelo apresentou uma probabilidade de detecção (POD) média de 1% e uma taxa de falso alarme média (FAR) de 0,6 para os eventos de alagamento, já para eventos sem alagamento o POD médio foi de 96% e a FAR foi de 2,5%. Portanto o modelo consegue prever os casos sem alagamento. / This dissertation project presents a characterization of the rainfall estimated from a dual-polarization S-band Doppler meteorological radar (SPOL) of the Department of Water and Electric Energy (DAEE) and Foundation Technological Center of Hydraulics (FCTH) during with or without flooding events for each neighborhood of the city of São Paulo over the year 2015. The characterization was determined by the probability density function (PDF) of the accumulated rainfall and the precipitation rate, rainfall duration and rainfall-area fraction in the neighborhoods. In average, flood events were associated with a rainfall volume greater than 30mm and a maximum rainfall rate greater than 30mm/h. Regarding the duration, it was not possible to find an average pattern, because the rain had a minimum duration of 20 minutes and a maximum of 23 hours. On the other hand, flood events had reached more than 27% of the neighborhood\'s area with a precipitation rate greater than 30 mm/h and 50 mm/h. It is highlighted throughout this analysis that the neighborhoods located near the Tietê and Pinheiros rivers and central region of the city of São Paulo presented a higher probability of flood occurrence with rainfall volumes lower than the average of 30 mm per day and also recorded higher recurrence of flooded spots. Finally, a binary logistic regression method was developed to estimate the probability of occurrence of flooding in the various neighborhoods of the city of São Paulo. This model uses as input parameters rainfall duration, maximum rainfall rate and accumulated rainfall in the last 24 hours. The model presented a mean probability of detection (POD) of 1% and a mean false alarm rate (FAR) of 0,6 for flood events. On the other hand, for events without occurrence of flood a mean POD was 96% and FAR 2,5. Therefore, the model can predict the events without flooding.
128

Regression models to assess the thermal performance of Brazilian low-cost houses: consideration of opaque envelope / Modelos de regressão para avaliação do desempenho térmico de habitações de interesse social: considerações da envolvente opaca

Favretto, Ana Paula Oliveira 26 January 2016 (has links)
This study examines the potential to conduct building thermal performance simulation (BPS) of unconditioned low-cost housing during the early design stages. By creating a set of regression models (meta-models) based on EnergyPlus simulations, this research aims to promote and simplify BPS in the building envelope design process. The meta-models can be used as tools adapted for three Brazilian cities: Curitiba, São Paulo and Manaus, providing decision support to designers by enabling rapid feedback that links early design decisions to the buildings thermal performance. The low-cost housing unit studied is a detached onestory house with an area of approximately 51m2, which includes two bedrooms, a combined kitchen and living room, and one bathroom. This representative configuration is based on collected data about the most common residence options in some Brazilian cities. This naturally ventilated residence is simulated in the Airflow Network module in EnergyPlus, which utilizes the average wind pressure coefficients provided by the software. The parametric simulations vary the house orientation, U-value, heat capacity and absorptance of external walls and the roof, the heat capacity of internal walls, the window-to-wall ratio, type of window (slider or casement), and the existence of horizontal and/or vertical shading devices with varying dimensions. The models predict the resulting total degree-hours of discomfort in a year due to heat and cold, based on comfort limits defined by the adaptive method for naturally ventilated residences according to ANSI ASHRAE Standard 55. The methodology consists of (a) analyzing a set of Brazilian low-cost housing projects and defining a geometric model that can represent it; (b) determining a list of design parameters relevant to thermal comfort and defining value ranges to be considered; (c) defining the input data for the 10.000 parametric simulations used to create and test the meta-models for each analyzed climate; (d) simulating thermal performance using Energy Plus; (e) using 60% of the simulated cases to develop the regression models; and (f) using the remaining 40% data to validate the meta-models. Except by Heat discomfort regression models for the cities of Curitiba and São Paulo the meta-models show R2 values superior to 0.9 indicating accurate predictions when compared to the discomfort predicted with the output data from EnergyPlus, the original simulation software. Meta-models application tests are performed and the meta-models show great potential to guide designers decisions during the early design. / Esta pesquisa avalia as potencialidades do uso de simulações do desempenho térmico (SDT) nas etapas iniciais de projetos de habitações de interesse social (HIS) não condicionadas artificialmente. Busca-se promover e simplificar o uso de SDT no processo de projeto da envolvente de edificações através da criação de modelos de regressão baseados em simulações robustas através do software EnergyPlus. Os meta-modelos são adaptados ao clima de três cidades brasileiras: Curitiba, São Paulo e Manaus, e permitem uma rápida verificação do desconforto térmico nas edificações podendo ser usados como ferramentas de suporte às decisões de projeto nas etapas iniciais. A HIS considerada corresponde a uma unidade térrea com aproximadamente 51m2, composta por dois quartos, um banheiro e cozinha integrada à sala de jantar. Esta configuração é baseada em um conjunto de projetos representativos coletados em algumas cidades brasileiras (como São Paulo, Curitiba e Manaus). Estas habitações naturalmente ventiladas são simuladas pelo módulo Airflow Network utilizando o coeficiente médio de pressão fornecido pelo EnergyPlus. As simulações consideram a parametrização da orientação da edificação, transmitância térmica (U), capacidade térmica (Ct) e absortância () das paredes externas e cobertura; Ct e U das paredes internas; relação entre área de janela e área da parede; tipo da janela (basculante ou de correr); existência e dimensão de dispositivos verticais e horizontais de sombreamento. Os meta-modelos desenvolvidos fornecem a predição anual dos graus-hora de desconforto por frio e calor, calculados com base nos limites de conforto definidos pelo método adaptativo para residências naturalmente ventiladas (ANSI ASHRAE, 2013). A metodologia aplicada consiste em: (a) análise de um grupo de projetos de HIS brasileiras e definição de um modelo geométrico que os represente; (b) definição dos parâmetros relevantes ao conforto térmico, assim como seus intervalos de variação; (c) definição dos dados de entrada para as 10.000 simulações paramétricas utilizadas na criação e teste de confiabilidade dos meta-modelos para cada clima analisado; (d) simulação do desempenho térmico por meio do software EnergyPlus; (e) utilização de 60% dos casos simulados para o desenvolvimento dos modelos de regressão; e (f) uso dos 40% dos dados restantes para testar a confiabilidade do modelo. Exceto pelos modelos para predição do desconforto por calor para Curitiba e São Paulo, os demais meta-modelos apresentaram valores de R2 superiores a 0.9, indicando boa adequação das predições de desconforto dos modelos gerados ao desconforto calculado com base no resultado das simulações no EnergyPlus. Um teste de aplicação dos meta-modelos foi realizado, demonstrando seu grande potencial para guiar os projetistas nas decisões tomadas durante as etapas inicias de projeto.
129

Regressão binária nas abordagens clássica e Bayesiana / Binary regression in the classical and Bayesian approaches

Fernandes, Amélia Milene Correia 16 December 2016 (has links)
Este trabalho tem como objetivo estudar o modelo de regressão binária nas abordagens clássica e bayesiana utilizando as funções de ligações probito, logito, complemento log-log, transformação box-cox e probito-assimétrico. Na abordagem clássica apresentamos as suposições e o procedimento para ajustar o modelo de regressão e verificamos a precisão dos parâmetros estimados, construindo intervalos de confiança e testes de hipóteses. Enquanto que, na inferência bayesiana fizemos um estudo comparativo utilizando duas metodologias. Na primeira metodologia consideramos densidades a priori não informativas e utilizamos o algoritmo Metropolis-Hastings para ajustar o modelo. Na segunda metodologia utilizamos variáveis auxiliares para obter a distribuição a posteriori conhecida, facilitando a implementação do algoritmo do Amostrador de Gibbs. No entanto, a introdução destas variáveis auxiliares podem gerar valores correlacionados, o que leva à necessidade de se utilizar o agrupamento das quantidades desconhecidas em blocos para reduzir a autocorrelação. Através do estudo de simulação mostramos que na inferência clássica podemos usar os critérios AIC e BIC para escolher o melhor modelo e avaliamos se o percentual de cobertura do intervalo de confiança assintótica está de acordo com o esperado na teoria assintótica. Na inferência bayesiana constatamos que o uso de variáveis auxiliares resulta em um algoritmo mais eficiente segundo os critérios: erro quadrático médio (EQM), erro percentual absoluto médio (MAPE) e erro percentual absoluto médio simétrico (SMAPE). Como ilustração apresentamos duas aplicações com dados reais. Na primeira, consideramos um conjunto de dados da variação do Ibovespa e a variação do valor diário do fechamento da cotação do dólar no período de 2013 a 2016. Na segunda aplicação, trabalhamos com um conjunto de dados educacionais (INEP-2013), focando nos estudos das variáveis que influenciam a aprovação do aluno. / The objective of this work is to study the binary regression model under the frequentist and Bayesian approaches using the probit, logit, log-log complement, Box-Cox transformation and skewprobit as link functions. In the classical approach we presented assumpti- ons and procedures used in the regression modeling. We verified the accuracy of the estimated parameters by building confidence intervals and conducting hypothesis tests. In the Bayesian approach we made a comparative study using two methodologies. For the first methodology, we considered non-informative prior distributions and the Metropolis-Hastings algorithm to estimate the model. In the second methodology we used auxiliary variables to obtain the known a posteriori distribution, allowing the use of the Gibbs Sampler algorithm. However, the introduction of these auxiliary variables can generate correlated values and needs the use of clustering of unknown quantities in blocks to reduce the autocorrelation. In the simulation study we used the AIC and BIC information criteria to select the most appropriate model and we evaluated whether the coverage probabilities of the confidence interval is in agre- ement with that expected by the asymptotic theory. In Bayesian approach we found that the inclusion of auxiliary variables in the model results in a more efficient algoritm according to the MSE, MAPE and SMAPE criteria. In this work we also present applications to two real datasets. The first dataset used is the variation of the Ibovespa and variation of the daily value of the American dollar at the time of closing the 2013 to 2016. The second dataset, used is an educational data set (INEP-2013), where we are interested in studying the factors that influence the approval of the student.
130

Melhor preditor empírico aplicado aos modelos beta mistos / Empirical best predictor for mixed beta regression models

Zerbeto, Ana Paula 21 February 2014 (has links)
Os modelos beta mistos são amplamente utilizados na análise de dados que apresentam uma estrutura hierárquica e que assumem valores em um intervalo restrito conhecido. Com o objetivo de propor um método de predição dos componentes aleatórios destes, os resultados previamente obtidos na literatura para o preditor de Bayes empírico foram estendidos aos modelos de regressão beta com intercepto aleatório normalmente distribuído. O denominado melhor preditor empírico (MPE) proposto tem aplicação em duas situações diferentes: quando se deseja fazer predição sobre os efeitos individuais de novos elementos de grupos que já fizeram parte da base de ajuste e quando os grupos não pertenceram à tal base. Estudos de simulação foram delineados e seus resultados indicaram que o desempenho do MPE foi eficiente e satisfatório em diversos cenários. Ao utilizar-se da proposta na análise de dois bancos de dados da área da saúde, observou-se os mesmos resultados obtidos nas simulações nos dois casos abordados. Tanto nas simulações, quanto nas análises de dados reais, foram observados bons desempenhos. Assim, a metodologia proposta se mostrou promissora para o uso em modelos beta mistos, nos quais se deseja fazer predições. / The mixed beta regression models are extensively used to analyse data with hierarquical structure and that take values in a restricted and known interval. In order to propose a prediction method for their random components, the results previously obtained in the literature for the empirical Bayes predictor were extended to beta regression models with random intercept normally distributed. The proposed predictor, called empirical best predictor (EBP), can be applied in two situations: when the interest is predict individuals effects for new elements of groups that were already analysed by the fitted model and, also, for elements of new groups. Simulation studies were designed and their results indicated that the performance of EBP was efficient and satisfatory in most of scenarios. Using the propose to analyse two health databases, the same results of simulations were observed in both two cases of application, and good performances were observed. So, the proposed method is promissing for the use in predictions for mixed beta regression models.

Page generated in 0.0371 seconds