Spelling suggestions: "subject:"additive models"" "subject:"dditive models""
31 |
Modelos aditivos generalizados para a avaliação da intenção de compra de consumidoresSouza, Erivaldo Lopes de 21 December 2012 (has links)
Made available in DSpace on 2015-05-08T14:53:27Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 1842165 bytes, checksum: 59f17268b1e23252f9bc9e0e37474638 (MD5)
Previous issue date: 2012-12-21 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In recent years, several studies have been published dealing on factors that influence consumer purchase intent in various economic sectors. In this line of work, we are specifically for the sector of collective buying, obtain regression models that could contribute to the study of the relationship between the purchase intention and the characteristics of market segments. The aim is to assist in the inclusion of this variable purchase intention in the process of choosing a target group, guiding decisions to meet more effectively service consumers. To achieve this goal, initially interviewed 384 Internet users in the city of João Pessoa, Paraíba, Brazil. Then the data obtained from interviews, were used to estimate those models. These models were based on assumptions of theories of the cognitive approach of consumer behavior, especially the Theory of Reasoned Action. The instrument used for data collection was a questionnaire containing market research questions related to psychological factors, socio-cultural and situational consumer. The most successful model was a generalized additive model with nine variables and nonparametric one end, obtained from smoothing splines. This model had a pseudo-R2 of 0,89 and allowed to reach a percentage of correct trials of the observations of the sample equal to 94%. With the aid of simulations, it was observed how the proposed model type is capable of assisting in selection of a target with a higher interest in the use of the service. It was also shown how the model can be used to evaluate production systems, in relation to more efficient service to customers intend to use the service. The generalized additive models were effective for identifying the presence of nonlinear relationships and were able to generate a high explanatory power of the propensity of individuals to use specific service. / Nos últimos anos, vários estudos foram publicados versando sobre fatores que influenciam a intenção de compra do consumidor em diversos setores econômicos. Nesta linha de trabalho, procurou-se, especificamente para o setor de compra coletivas, obter modelos de regressão que pudessem contribuir para o estudo da relação entre a intenção de compra e as características de segmentos de mercado. Visa-se com isso auxiliar na inclusão da variável intenção de compras no processo de escolha de um público-alvo, orientando decisões para satisfazer com maior eficiência consumidores do serviço. Para alcançar o objetivo, entrevistaram-se inicialmente 384 usuários de Internet da cidade de João Pessoa, Paraíba, Brasil. Em seguida os dados obtidos a partir de entrevistas, foram usados para estimar aqueles modelos. Esses modelos foram baseados em pressupostos de teorias da abordagem cognitiva do comportamento do consumidor, especialmente da Teoria da Ação Racional. O instrumento usado para a coleta de dados foi um questionário de pesquisa de mercado contendo questões ligadas a fatores psicológicos, sócio-culturais e situacionais do consumidor. O modelo mais bem sucedido foi um modelo aditivo generalizado com nove variáveis e com um termo não paramétrico, obtido a partir do método de suavização splines. Esse modelo apresentou um pseudo-R2 igual a 0,89 e possibilitou alcançar um percentual de acertos nos julgamentos das observações da amostra igual a 94%. Com o auxílio de simulações, verificou-se de que modo o tipo de modelo proposto é capaz de auxiliar na escolha de um público-alvo com maior interesse no uso do serviço. Apresentou-se ainda a maneira pela qual o modelo pode ser usado para avaliar sistemas produtivos, em relação ao atendimento mais eficiente de clientes que têm a intenção de utilizar o serviço. Os modelos aditivos generalizados mostraram-se eficientes para identificar a presença de relações não lineares e foram capazes de gerar um poder explicativo alto da propensão de indivíduos para utilizar um serviço específico.
|
32 |
Inferência estatística para regressão múltipla h-splines / Statistical inference for h-splines multiple regressionMorellato, Saulo Almeida, 1983- 25 August 2018 (has links)
Orientador: Ronaldo Dias / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-25T00:25:46Z (GMT). No. of bitstreams: 1
Morellato_SauloAlmeida_D.pdf: 32854783 bytes, checksum: 040664acd0c8f1efe07cedccda8d11f6 (MD5)
Previous issue date: 2014 / Resumo: Este trabalho aborda dois problemas de inferência relacionados à regressão múltipla não paramétrica: a estimação em modelos aditivos usando um método não paramétrico e o teste de hipóteses para igualdade de curvas ajustadas a partir do modelo. Na etapa de estimação é construída uma generalização dos métodos h-splines, tanto no contexto sequencial adaptativo proposto por Dias (1999), quanto no contexto bayesiano proposto por Dias e Gamerman (2002). Os métodos h-splines fornecem uma escolha automática do número de bases utilizada na estimação do modelo. Estudos de simulação mostram que os resultados obtidos pelos métodos de estimação propostos são superiores aos conseguidos nos pacotes gamlss, mgcv e DPpackage em R. São criados dois testes de hipóteses para testar H0 : f = f0. Um teste de hipóteses que tem sua regra de decisão baseada na distância quadrática integrada entre duas curvas, referente à abordagem sequencial adaptativa, e outro baseado na medida de evidência bayesiana proposta por Pereira e Stern (1999). No teste de hipóteses bayesiano o desempenho da medida de evidência é observado em vários cenários de simulação. A medida proposta apresentou um comportamento que condiz com uma medida de evidência favorável à hipótese H0. No teste baseado na distância entre curvas, o poder do teste foi estimado em diversos cenários usando simulações e os resultados são satisfatórios. Os procedimentos propostos de estimação e teste de hipóteses são aplicados a um conjunto de dados referente ao trabalho de Tanaka e Nishii (2009) sobre o desmatamento no leste da Ásia. O objetivo é escolher um entre oito modelos candidatos. Os testes concordaram apontando um par de modelos como sendo os mais adequados / Abstract: In this work we discuss two inference problems related to multiple nonparametric regression: estimation in additive models using a nonparametric method and hypotheses testing for equality of curves, also considering additive models. In the estimation step, it is constructed a generalization of the h-splines method, both in the sequential adaptive context proposed by Dias (1999), and in the Bayesian context proposed by Dias and Gamerman (2002). The h-splines methods provide an automatic choice of the number of bases used in the estimation of the model. Simulation studies show that the results obtained by proposed estimation methods are superior to those achieved in the packages gamlss, mgcv and DPpackage in R. Two hypotheses testing are created to test H0 : f = f0. A hypotheses test that has a decision rule based on the integrated squared distance between two curves, for adaptive sequential approach, and another based on the Bayesian evidence measure proposed by Pereira and Stern (1999). In Bayesian hypothesis testing the performance measure of evidence is observed in several simulation scenarios. The proposed measure showed a behavior that is consistent with evidence favorable to H0. In the test based on the distance between the curves, the power of the test was estimated at various scenarios using simulations, and the results are satisfactory. At the end of the work the proposed procedures of estimation and hypotheses testing are applied in a dataset concerning to the work of Tanaka and Nishii (2009) about the deforestation in East Asia. The objective is to choose one amongst eight models. The tests point to a pair of models as being the most suitableIn this work we discuss two inference problems related to multiple nonparametric regression: estimation in additive models using a nonparametric method and hypotheses testing for equality of curves, also considering additive models. In the estimation step, it is constructed a generalization of the h-splines method, both in the sequential adaptive context proposed by Dias (1999), and in the Bayesian context proposed by Dias and Gamerman (2002). The h-splines methods provide an automatic choice of the number of bases used in the estimation of the model. Simulation studies show that the results obtained by proposed estimation methods are superior to those achieved in the packages gamlss, mgcv and DPpackage in R. Two hypotheses testing are created to test H0 : f = f0. A hypotheses test that has a decision rule based on the integrated squared distance between two curves, for adaptive sequential approach, and another based on the Bayesian evidence measure proposed by Pereira and Stern (1999). In Bayesian hypothesis testing the performance measure of evidence is observed in several simulation scenarios. The proposed measure showed a behavior that is consistent with evidence favorable to H0. In the test based on the distance between the curves, the power of the test was estimated at various scenarios using simulations, and the results are satisfactory. At the end of the work the proposed procedures of estimation and hypotheses testing are applied in a dataset concerning to the work of Tanaka and Nishii (2009) about the deforestation in East Asia. The objective is to choose one amongst eight models. The tests point to a pair of models as being the most suitable / Doutorado / Estatistica / Doutor em Estatística
|
33 |
Predictive Habitat Models for Four Cetaceans in the Mid-Atlantic BightCross, Cheryl L. 27 May 2010 (has links)
This study focuses on the habitats of cetaceans in the Mid-Atlantic Bight, a region characterized by bathymetric diversity and the presence of distinct water masses (i.e. the shelf water, slope water, and Gulf Stream). The combination of these features contributes to the hydrographic complexity of the area, which furthermore influences biological productivity and potential prey available for cetaceans. The collection of cetacean sighting data together with physical oceanographic data can be used to examine cetacean habitat associations. Cetacean habitat modeling is a mechanism for predicting cetacean distribution patterns based on environmental variables such as bathymetric and physical properties, and for exploring the potential ecological implications that contribute to cetacean spatial distributions. We can advance conservation efforts of cetacean populations by expanding our knowledge of their habitats and distribution.
Generalized additive models (GAMs) were developed to predict the spatial distribution patterns of sperm whales (Physeter macrocephalus), pilot whales (Globicephala spp.), bottlenose dolphins (Tursiops truncatus), and Atlantic spotted dolphins (Stenella frontalis) based on significant physical parameters along the continental shelf-break region in the Mid-Atlantic Bight. Data implemented in the GAMs were collected in the summer of 2006 aboard the NOAA R/V Gordon Gunter. These included visual cetacean survey data collected along with physical data at depth via expendable bathythermograph (XBT), and conductivity-temperature-depth (CTD) instrumentation. Additionally, continual surface data were collected via the ship’s flow through sensor system. Interpolations of physical data were created from collected point data using the inverse distant weighted method (IDW) to estimate the spatial distribution of physical data within the area of interest. Interpolated physical data, as well as bathymetric (bottom depth and slope) data were extracted to overlaid cetacean sightings, so that each sighting had an associated value for nine potentially significant physical habitat parameters.
A grid containing 5x5 km grid cells was created over the study area and cetacean sightings along with the values for each associated habitat parameter were summarized in each grid cell. Redundant parameters were reduced, resulting in a full model containing temperature at 50 m depth, mixed layer depth, bottom depth, slope, surface temperature, and surface salinity. GAMs were fit for each species based on these six potentially significant parameters. The resultant fit models for each species predicted the number of individuals per km2 based on a unique combination of environmental parameters. Spatial prediction grids were created based on the significant habitat parameters for each species to illustrate the GAM outputs and to indicate predicted regions of high density. Predictions were consistent with observed sightings. Sperm whale distribution was predicted by a combination of depth, sea surface temperature, and sea surface salinity. The model for pilot whales included bottom slope, and temperature at 50 m depth. It also indicated that mixed layer depth, bottom depth and surface salinity contributed to group size. Similarly, temperature at 50 m depth was significant for Atlantic spotted dolphins. Predicted bottlenose dolphin distribution was determined by a combination of bottom slope, surface salinity, and temperature at 50 m depth, with mixed layer depth contributing to group size.
Distribution is most likely a sign of prey availability and ecological implications can be drawn from the habitat parameters associated with each species. For example, regions of high slope can indicate zones of upwelling, enhanced vertical mixing and prey availability throughout the water column. Furthermore, surface temperature and salinity can be indicative of patchy zones of productivity where potential prey aggregations occur.
The benefits of these models is that collected point data can be used to expand our knowledge of potential cetacean “hotspots” based on associations with physical parameters. Data collection for abundance estimates, higher resolution studies, and future habitat surveys can be adjusted based on these model predictions. Furthermore, predictive habitat models can be used to establish Marine Protected Areas with boundaries that adapt to dynamic oceanographic features reflecting potential cetacean mobility. This can be valuable for the advancement of cetacean conservation efforts and to limit potential vessel and fisheries interactions with cetaceans, which may pose a threat to the sustainability of cetacean populations.
|
34 |
ESSAYS ON SCALABLE BAYESIAN NONPARAMETRIC AND SEMIPARAMETRIC MODELSChenzhong Wu (18275839) 29 March 2024 (has links)
<p dir="ltr">In this thesis, we delve into the exploration of several nonparametric and semiparametric econometric models within the Bayesian framework, highlighting their applicability across a broad spectrum of microeconomic and macroeconomic issues. Positioned in the big data era, where data collection and storage expand at an unprecedented rate, the complexity of economic questions we aim to address is similarly escalating. This dual challenge ne- cessitates leveraging increasingly large datasets, thereby underscoring the critical need for designing flexible Bayesian priors and developing scalable, efficient algorithms tailored for high-dimensional datasets.</p><p dir="ltr">The initial two chapters, Chapter 2 and 3, are dedicated to crafting Bayesian priors suited for environments laden with a vast array of variables. These priors, alongside their corresponding algorithms, are optimized for computational efficiency, scalability to extensive datasets, and, ideally, distributability. We aim for these priors to accommodate varying levels of dataset sparsity. Chapter 2 assesses nonparametric additive models, employing a smoothing prior alongside a band matrix for each additive component. Utilizing the Bayesian backfitting algorithm significantly alleviates the computational load. In Chapter 3, we address multiple linear regression settings by adopting a flexible scale mixture of normal priors for coefficient parameters, thus allowing data-driven determination of the necessary amount of shrinkage. The use of a conjugate prior enables a closed-form solution for the posterior, markedly enhancing computational speed.</p><p dir="ltr">The subsequent chapters, Chapter 4 and 5, pivot towards time series dataset model- ing and Bayesian algorithms. A semiparametric modeling approach dissects the stochastic volatility in macro time series into persistent and transitory components, the latter addi- tional component addressing outliers. Utilizing a Dirichlet process mixture prior for the transitory part and a collapsed Gibbs sampling algorithm, we devise a method capable of efficiently processing over 10,000 observations and 200 variables. Chapter 4 introduces a simple univariate model, while Chapter 5 presents comprehensive Bayesian VARs. Our al- gorithms, more efficient and effective in managing outliers than existing ones, are adept at handling extensive macro datasets with hundreds of variables.</p>
|
35 |
Advances on the Birnbaum-Saunders distribution / Avanços na distribuição Birnbaum-SaundersNakamura, Luiz Ricardo 26 August 2016 (has links)
The Birnbaum-Saunders (BS) distribution is the most popular model used to describe lifetime process under fatigue. Throughout the years, this distribution has received a wide ranging of applications, demanding some more flexible extensions to solve more complex problems. One of the most well-known extensions of the BS distribution is the generalized Birnbaum- Saunders (GBS) family of distributions that includes the Birnbaum-Saunders special-case (BSSC) and the Birnbaum-Saunders generalized t (BSGT) models as special cases. Although the BS-SC distribution was previously developed in the literature, it was never deeply studied and hence, in this thesis, we provide a full Bayesian study and develop a tool to generate random numbers from this distribution. Further, we develop a very flexible regression model, that admits different degrees of skewness and kurtosis, based on the BSGT distribution using the generalized additive models for location, scale and shape (GAMLSS) framework. We also introduce a new extension of the BS distribution called the Birnbaum-Saunders power (BSP) family of distributions, which contains several special or limiting cases already published in the literature, including the GBS family. The main feature of the new family is that it can produce both unimodal and bimodal shapes depending on its parameter values. We also introduce this new family of distributions into the GAMLSS framework, in order to model any or all the parameters of the distribution using parametric linear and/or nonparametric smooth functions of explanatory variables. Throughout this thesis we present five different applications in real data sets in order to illustrate the developed theoretical results. / A distribuição Birnbaum-Saunders (BS) é o modelo mais popular utilizado para descrever processos de fadiga. Ao longo dos anos, essa distribuição vem recebendo aplicações nas mais diversas áreas, demandando assim algumas extensões mais flexíveis para resolver problemas mais complexos. Uma das extensões mais conhecidas na literatura é a família de distribuições Birnbaum-Saunders generalizada (GBS), que inclui as distribuições Birnbaum-Saunders casoespecial (BS-SC) e Birnbaum-Saunders t generalizada (BSGT) como modelos especiais. Embora a distribuição BS-SC tenha sido previamente desenvolvida na literatura, nunca foi estudada mais profundamente e, assim, nesta tese, um estudo bayesiano é desenvolvido acerca da mesma além de um novo gerador de números aleatórios dessa distribuição ser apresentado. Adicionalmente, um modelo de regressão baseado na distribuição BSGT é desenvolvido utilizando-se os modelos aditivos generalizados para locação, escala e forma (GAMLSS), os quais apresentam grande flexibilidade tanto para a assimetria como para a curtose. Uma nova extensão da distribuição BS também é apresentada, denominada família de distribuições Birnbaum-Saunders potência (BSP), que contém inúmeros casos especiais ou limites já publicados na literatura, incluindo a família GBS. A principal característica desta nova família é que ela é capaz de produzir formas tanto uni como bimodais dependendo do valor de seus parâmetros. Esta nova família também é introduzida na estrutura dos modelos GAMLSS para fornecer uma ferramenta capaz de modelar todos os parâmetros da distribuição como funções lineares e/ou não-lineares suavizadas de variáveis explicativas. Ao longo desta tese são apresentadas cinco diferentes aplicações em conjuntos de dados reais para ilustrar os resultados teóricos obtidos.
|
36 |
Uso de área pelo boto-cinza, Sotalia guianensis, no estuário de Cananeia / Are use by Guiana dolphins, Sotalia guianensis, in the Cananeia estuaryMolina, Julia Maria Borges 30 June 2017 (has links)
A percepção e interpretação da interação de indivíduos e populações com o ambiente e a forma como tal relação condiciona sua distribuição espacial é questão-chave e recorrente em estudos ecológicos. Padrões de uso de área observados para populações emergem em ultima análise da variabilidade entre seus indivíduos em selecionar habitats e interagir com os mesmos. Este estudo teve como foco o uso de área pela população do boto-cinza, Sotalia guianensis, e sua variabilidade individual no estuário de Cananeia, localizado na costa sudeste do Brasil (25°03\' S; 47°55\' W), durante o verão e o inverno de 2015 e o verão de 2016. Parâmetros ambientais e geográficos (distâncias da desembocadura de rios, da entrada do estuário e de áreas urbanas, profundidade, maré e autocorrelação espacial) foram testados para explicar a distribuição da população e de seus indivíduos a partir de funções de probabilidade de seleção de recursos (RSPF) em modelos aditivos generalizados (GAM). Onze indivíduos fotoidentificados com 18 ou mais recapturas foram avaliados com o uso de modelos individuais de ocupação e sua interpretação foi subsidiada por estimativas de áreas domiciliares obtidas a partir de kerneis fixos de densidade. Nas três temporadas a população apresentou densidades de grupos desiguais ao longo do estuário e todas as variáveis, com exceção da distância de áreas urbanas, explicaram as probabilidades de presença observadas. Análises individuais revelaram discrepâncias nos tamanhos e disposição geográfica de áreas domiciliares e diferenças na composição e estimativa dos parâmetros selecionados para cada indivíduo. A variabilidade individual na população deve ter papel fundamental em termos de utilização do espaço e seleção de habitat pelo boto-cinza no estuário local. / Understanding and interpreting the interaction of individuals and populations with the environment and how this relationship outlines their spatial distribution is a key question common in ecological studies. Area use patterns observed for populations are ultimately an outcome from individual variability in habitat selection and their interaction with such environments. Are use and habitat selection by the population of Guiana dolphins, Sotalia guianensis, and its individual variability were accessed in the Cananeia estuary (25°03\' S; 47°55\' W), southeastern Brazil, during the summer and winter of 2015 and the summer of 2016. Environmental and geographic parameters were estimated aiming to explain population distribution and differences within individuals. For this purpose, resource selection probability functions (RSPF) were applied in generalized additive models (GAM). Covariates tested included: distance to river mouths, distance to the estuary entrance, distance to urban areas, depth and tide. Geographic coordinates were used to model spatial autocorrelation. Eleven photo-identified individuals had their occupancy modelled and accessed in relation to their home range obtained from fixed kernel densities estimates. The population exhibited patchy group densities throughout the estuary in all seasons. Except from distance to urban areas all variables were selected in our final model for the population\'s RSPF. Individual analysis revealed discrepancies in size and location of home ranges which lead to remarkable differences in the composition and estimates of parameters selected in the models for each individual.
|
37 |
Uso de área pelo boto-cinza, Sotalia guianensis, no estuário de Cananeia / Are use by Guiana dolphins, Sotalia guianensis, in the Cananeia estuaryJulia Maria Borges Molina 30 June 2017 (has links)
A percepção e interpretação da interação de indivíduos e populações com o ambiente e a forma como tal relação condiciona sua distribuição espacial é questão-chave e recorrente em estudos ecológicos. Padrões de uso de área observados para populações emergem em ultima análise da variabilidade entre seus indivíduos em selecionar habitats e interagir com os mesmos. Este estudo teve como foco o uso de área pela população do boto-cinza, Sotalia guianensis, e sua variabilidade individual no estuário de Cananeia, localizado na costa sudeste do Brasil (25°03\' S; 47°55\' W), durante o verão e o inverno de 2015 e o verão de 2016. Parâmetros ambientais e geográficos (distâncias da desembocadura de rios, da entrada do estuário e de áreas urbanas, profundidade, maré e autocorrelação espacial) foram testados para explicar a distribuição da população e de seus indivíduos a partir de funções de probabilidade de seleção de recursos (RSPF) em modelos aditivos generalizados (GAM). Onze indivíduos fotoidentificados com 18 ou mais recapturas foram avaliados com o uso de modelos individuais de ocupação e sua interpretação foi subsidiada por estimativas de áreas domiciliares obtidas a partir de kerneis fixos de densidade. Nas três temporadas a população apresentou densidades de grupos desiguais ao longo do estuário e todas as variáveis, com exceção da distância de áreas urbanas, explicaram as probabilidades de presença observadas. Análises individuais revelaram discrepâncias nos tamanhos e disposição geográfica de áreas domiciliares e diferenças na composição e estimativa dos parâmetros selecionados para cada indivíduo. A variabilidade individual na população deve ter papel fundamental em termos de utilização do espaço e seleção de habitat pelo boto-cinza no estuário local. / Understanding and interpreting the interaction of individuals and populations with the environment and how this relationship outlines their spatial distribution is a key question common in ecological studies. Area use patterns observed for populations are ultimately an outcome from individual variability in habitat selection and their interaction with such environments. Are use and habitat selection by the population of Guiana dolphins, Sotalia guianensis, and its individual variability were accessed in the Cananeia estuary (25°03\' S; 47°55\' W), southeastern Brazil, during the summer and winter of 2015 and the summer of 2016. Environmental and geographic parameters were estimated aiming to explain population distribution and differences within individuals. For this purpose, resource selection probability functions (RSPF) were applied in generalized additive models (GAM). Covariates tested included: distance to river mouths, distance to the estuary entrance, distance to urban areas, depth and tide. Geographic coordinates were used to model spatial autocorrelation. Eleven photo-identified individuals had their occupancy modelled and accessed in relation to their home range obtained from fixed kernel densities estimates. The population exhibited patchy group densities throughout the estuary in all seasons. Except from distance to urban areas all variables were selected in our final model for the population\'s RSPF. Individual analysis revealed discrepancies in size and location of home ranges which lead to remarkable differences in the composition and estimates of parameters selected in the models for each individual.
|
38 |
Modelos lineares parciais aditivos generalizados com suavização por meio de P-splines / Generalized additive partial linear models with P-splines smoothingHolanda, Amanda Amorim 03 May 2018 (has links)
Neste trabalho apresentamos os modelos lineares parciais generalizados com uma variável explicativa contínua tratada de forma não paramétrica e os modelos lineares parciais aditivos generalizados com no mínimo duas variáveis explicativas contínuas tratadas de tal forma. São utilizados os P-splines para descrever a relação da variável resposta com as variáveis explicativas contínuas. Sendo assim, as funções de verossimilhança penalizadas, as funções escore penalizadas e as matrizes de informação de Fisher penalizadas são desenvolvidas para a obtenção das estimativas de máxima verossimilhança penalizadas por meio da combinação do algoritmo backfitting (Gauss-Seidel) e do processo iterativo escore de Fisher para os dois tipos de modelo. Em seguida, são apresentados procedimentos para a estimação do parâmetro de suavização, bem como dos graus de liberdade efetivos. Por fim, com o objetivo de ilustração, os modelos propostos são ajustados à conjuntos de dados reais. / In this work we present the generalized partial linear models with one continuous explanatory variable treated nonparametrically and the generalized additive partial linear models with at least two continuous explanatory variables treated in such a way. The P-splines are used to describe the relationship among the response and the continuous explanatory variables. Then, the penalized likelihood functions, penalized score functions and penalized Fisher information matrices are derived to obtain the penalized maximum likelihood estimators by the combination of the backfitting (Gauss-Seidel) algorithm and the Fisher escoring iterative method for the two types of model. In addition, we present ways to estimate the smoothing parameter as well as the effective degrees of freedom. Finally, for the purpose of illustration, the proposed models are fitted to real data sets.
|
39 |
Modelos lineares parciais aditivos generalizados com suavização por meio de P-splines / Generalized additive partial linear models with P-splines smoothingAmanda Amorim Holanda 03 May 2018 (has links)
Neste trabalho apresentamos os modelos lineares parciais generalizados com uma variável explicativa contínua tratada de forma não paramétrica e os modelos lineares parciais aditivos generalizados com no mínimo duas variáveis explicativas contínuas tratadas de tal forma. São utilizados os P-splines para descrever a relação da variável resposta com as variáveis explicativas contínuas. Sendo assim, as funções de verossimilhança penalizadas, as funções escore penalizadas e as matrizes de informação de Fisher penalizadas são desenvolvidas para a obtenção das estimativas de máxima verossimilhança penalizadas por meio da combinação do algoritmo backfitting (Gauss-Seidel) e do processo iterativo escore de Fisher para os dois tipos de modelo. Em seguida, são apresentados procedimentos para a estimação do parâmetro de suavização, bem como dos graus de liberdade efetivos. Por fim, com o objetivo de ilustração, os modelos propostos são ajustados à conjuntos de dados reais. / In this work we present the generalized partial linear models with one continuous explanatory variable treated nonparametrically and the generalized additive partial linear models with at least two continuous explanatory variables treated in such a way. The P-splines are used to describe the relationship among the response and the continuous explanatory variables. Then, the penalized likelihood functions, penalized score functions and penalized Fisher information matrices are derived to obtain the penalized maximum likelihood estimators by the combination of the backfitting (Gauss-Seidel) algorithm and the Fisher escoring iterative method for the two types of model. In addition, we present ways to estimate the smoothing parameter as well as the effective degrees of freedom. Finally, for the purpose of illustration, the proposed models are fitted to real data sets.
|
40 |
Modelagem da produção industrial de celulose Kraft com modelos aditivos generalizados e redes neurais / Modeling of industrial production of kraft pulp with generalized additive models and neural networksStein, Fabiano da Rocha 08 July 2010 (has links)
Made available in DSpace on 2015-03-26T14:01:04Z (GMT). No. of bitstreams: 1
texto completo.pdf: 2018234 bytes, checksum: 43a78e55f7947551d68ec57851bddcc5 (MD5)
Previous issue date: 2010-07-08 / In this study, data collected on an industrial scale for some years, underwent modeling using generalized additive models (GAM) and artificial neural networks (ANN) as tools to evaluate the influence of some variables, timber and process on production and digester alkali charge. Generalized additive models were fitted using the software R (R Development Core Team, 2010), through the library "mgcv" (Wood, 2006), specific settings for generalized additive models. Significance tests were applied for each model set. In order to supplement the data were analyzed using artificial neural networks.One hundred RNA were adjusted to relate to production and the digester alkali charge, and variables such as wood density, age, precipitation, dry content of wood chips, bulk density of chips, the wood basic density, pulp viscosity and kappa. In this step we employed the software Statistica (Statsoft, Inc., 2007). The results show that the Generalized Additive Model (GAM) is a good choice to represent the phenomena of the pulp industry, where the variables are highly variable and there is strict control, unlike what happens on data from experimental designs. Should the use of RNA to estimate the output from the digester alkali charge and also proved a useful tool, since the correlations between actual and estimated data were above 88% and 60% respectively. Several variables associated with the raw material and the pulping process that were studied showed similar behavior and / or equal to what the majority of experimental studies have found. / No presente trabalho, dados observados em escala industrial, durante alguns anos, foram submetidos à modelagem empregando modelos aditivos generalizados (GAM) e redes neurais artificiais (RNA), como ferramentas para avaliar a influência de algumas variáveis, da madeira e do processo, sobre a produção do digestor e carga alcalina. Os modelos aditivos generalizados foram ajustados utilizando o software R (R DEVELOPMENT CORE TEAM, 2010), através da biblioteca “mgcv” (WOOD, 2006), específica para ajustes de modelos aditivos generalizados. Foram aplicados testes de significância para cada modelo ajustado. De forma complementar os dados foram analisados por meio de redes neurais artificiais. Foram ajustadas 100 RNA para relacionar a produção do digestor e a carga alcalina, com as variáveis: densidade da madeira, idade, precipitação, teor seco dos cavacos, densidade aparente dos cavacos, densidade básica dos cavacos, viscosidade da polpa e kappa. Nesta etapa do trabalho foi empregado o software Statistica (Statsoft, INC, 2007). Os resultados mostram que o Modelo Aditivo Generalizado (MAG) constitui uma boa opção para representar os fenômenos da indústria de celulose, em que as variáveis apresentam alta variabilidade e não há um rigoroso controle, diferentemente do que ocorre em dados provenientes de delineamentos experimentais. No caso do uso de RNA para estimar a produção do digestor e para carga alcalina também mostrou ser uma boa ferramenta, visto que as correlações entre os dados reais e estimados ficaram acima de 88% e 60%, respectivamente. Várias variáveis associadas com a matéria-prima e com o processo de polpação que foram estudadas apresentaram comportamento semelhante e/ou iguais o que a maioria dos estudos experimentais encontraram.
|
Page generated in 0.2843 seconds