• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 66
  • 20
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 97
  • 97
  • 64
  • 63
  • 51
  • 28
  • 24
  • 20
  • 19
  • 16
  • 14
  • 14
  • 14
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

Modelos simétricos transformados não-lineares com diferentes distribuições dos erros: aplicações em ciências florestais

LIMA FILHO, Luiz Medeiros de Araújo 13 February 2009 (has links)
Submitted by (ana.araujo@ufrpe.br) on 2016-08-03T15:09:46Z No. of bitstreams: 1 Luiz Medeiros de Araujo Lima Filho.pdf: 529199 bytes, checksum: 06cae9ad9a02975b786cf55a000dbc5b (MD5) / Made available in DSpace on 2016-08-03T15:09:46Z (GMT). No. of bitstreams: 1 Luiz Medeiros de Araujo Lima Filho.pdf: 529199 bytes, checksum: 06cae9ad9a02975b786cf55a000dbc5b (MD5) Previous issue date: 2009-02-13 / Historically, the wood of the eucalyptus is used for the most varied applications, such as; firewood, charcoal, cellulose, railway sleepers, posts for electrification, bark to tan leather, essential oils, civil construction, etc. The Gypsum Pole of Araripe in Pernambuco is a great firewood consumer for the gypsum production. Due to great need to find economical and environmental alternatives for the area, the sustainable production of eucalyptus that is a fast growth tree with great versatility has an important role. In the planning of the sustainable forest management there is a variable of extreme importance: the growth. To model the growth is fundamental in the prognosis of the productivity, site quality and dynamics of populations. Usually, the growth curves are fitted through nonlinear models developed empirically to relate, for instance, height and age. The Chapman-Richards model is a nonlinear model frequently used to model forest growth. In studies of this type, in general, it is assumed that the errors follow approximately the normal distribution. However, to model the growth assuming that the errors have a normal distribution is quite sensitive to atypical values that can happen, and generate bad estimates of the parameters. To correct that problem a new class of transformed symmetrical models was developed considering for the errors symmetrical continuous distributions with heavier tails than the normal distribution and allowing a possible nonlinear structure for the mean. With the expectation of obtaining better estimates of eucalyptus growth, it was applied to the Chapman-Richards model the following distributions of the errors: normal, t of Student, Cauchy, exponential potency, logistics I and logistics II. The t distribution of Student with 2 degrees of freedom was the most efficient to estimate height and circumference growth of eucalyptus in the Gypsum Pole of Pernambuco. / Historicamente, a madeira do Eucalyptus é usada para os mais variados fins, tais como; lenha, carvão vegetal, celulose, dormentes ferroviários, postes para eletrificação, casca para curtir couro, óleos essenciais, construção civil, etc. O Pólo Gesseiro do Araripe em Pernambuco é um grande consumidor de madeira para produção de gesso. Devido à grande necessidade de se buscar uma alternativa econômica e ambiental para a região é de interesse obter uma produção sustentável para o Eucalyptus, uma vez que esta é uma árvore de rápido crescimento e grande versatilidade. No planejamento do manejo florestal sustentado uma variável é de extrema importância: o crescimento. Sua modelagem é fundamental na prognose da produtividade, qualidade do local e dinâmica de populações. Geralmente, as curvas de crescimento são estudadas por meio de modelos não-lineares desenvolvidos empiricamente para relacionar, por exemplo, altura e idade. Um modelo não-linear bastante utilizado na prática para modelar curvas de crescimento é o modelo de Chapman-Richards. Em estudos deste tipo, em geral, assume-se que os erros seguem distribuição normal. Contudo, a modelagem sob a suposição de erros com distribuição normal é bastante sensível a valores atípicos que por ventura possam ocorrer, podendo distorcer as estimativas dos parâmetros. Para corrigir esse problema Cordeiro et al. (2009) desenvolveram uma nova classe de modelos simétricos transformados considerando para os erros distribuições contínuas simétricas com caudas mais pesadas do que a distribuição normal e permitindo uma possível estrutura não-linear para a média. Dessa forma, com a expectativa de obter melhores estimativas de crescimento de Eucalyptus, aplicaram-se ao modelo de Chapman-Richards as seguintes distribuições dos erros: normal, t de Student, Cauchy, exponencial potência, logística I e logística II que apresentou a distribuição t de Student com 2 graus de liberdade com melhores estimativas de crescimento em altura e circunferência de Eucalyptus no Pólo Gesseiro de Pernambuco.
62

Modelos simétricos não lineares de produção e crescimento em volume de clones de Eucalyptus spp

LIMA FILHO, Luiz Medeiros de Araújo 01 October 2012 (has links)
Submitted by (ana.araujo@ufrpe.br) on 2016-08-03T15:37:53Z No. of bitstreams: 1 Luiz Medeiros de Araujo Lima Filho.pdf: 6714156 bytes, checksum: 8537b197237b8261b5b264ad769ab466 (MD5) / Made available in DSpace on 2016-08-03T15:37:53Z (GMT). No. of bitstreams: 1 Luiz Medeiros de Araujo Lima Filho.pdf: 6714156 bytes, checksum: 8537b197237b8261b5b264ad769ab466 (MD5) Previous issue date: 2012-10-01 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Knowledge of growth and production present and future of trees in forest stands is a key element in sustainable forest management. It is intended in this thesis to estimate the frequency distribution by diameter class, estimate and compare volumetric equations via symmetric nonlinear models as well, propose to compare models and adjust volume growth via symmetrical nonlinear models in Eucalyptus spp. clones in the region of the Araripe - PE. The experiment was conducted at the Experimental Station of the Agricultural Research Company of Pernambuco (IPA), located in the municipality of Araripina - PE. This experiment consists of 15 clones of Eucalyptus spp., species and hybrids resulting from natural crossing and controlled pollination. The database is composed of all the survival trees of the experiment, corresponding to 1189 trees, divided into three groups. To estimate the diameter distributions were adopted probability distributions Normal, with three parameters Weibull, Log-normal and Gamma. The next step was to fit of the model of Schumacher and Hall and Spurr model associated the following symmetric distributions: Normal, Student t, Exponential Power and Logistics II. The volume growth models in this thesis were adjusted with symmetric distributions associated with them. In the estimation of the diameter distributions, the results were similar in the three groups, with emphasis on the Log-normal distribution. This distribution was the most appropriate for most of the period. Analyzing the volumetric equations, it was found that the model was Schumacher and Hall the most suitable, when associated with the Student t distribution with three degrees .of freedom and Exponential Power (t = 0,8) respectively to groups I and II. In group III, the model Spurr associated with Exponential Power (t = 0,8) distribution had the best performance. Comparing the volume growth models, it was observed that the proposed models best fits obtained in this thesis, when the distributions associated with the Student t with three degrees of freedom and Exponential Power (t = 0,8), respectively, in groups I and III. In group II, the Chapman-Richards model associated with Student t distribution with three degrees of freedom had the best performance. / O conhecimento do crescimento e da produção presente e futura de árvores em povoamentos florestais é elemento fundamental no manejo florestal sustentável. Desta forma, pretende-se nesta tese estimar a distribuição de frequência por classe diamétrica, estimar e comparar equações volumétricas via modelos simétricos não lineares, bem como, propor, ajustar e comparar modelos de crescimento em volume via modelos simétricos não lineares em clones de Eucalyptus spp. na região da Chapada do Araripe - PE. O experimento foi desenvolvido na Estação Experimental da Empresa Pernambucana de Pesquisa Agropecuária (IPA), localizada no município de Araripina - PE. Esse experimento é composto por 15 clones de Eucalyptus spp., resultantes de espécies e híbridos de cruzamento natural e polinização controlada. A base de dados foi composta por todas as árvores sobreviventes do experimento, que corresponde a 1189 árvores, dividida em três grupos. Para estimar as distribuições diamétricas foram adotadas as distribuições de probabilidade Normal, Weibull com três parâmetros, Log-normal e Gama. Em seguida, procedeu-se com os ajustes dos modelos volumétricos de Schumacher e Hall e de Spurr associados as seguintes distribuições simétricos: Normal, t de Student, Exponencial Potência e Logística II. Posteriormente, os modelos de crescimento em volume propostos nesta tese foram ajustados associados às mesmas distribuições simétricas. Na estimativa das distribuições diamétricas, os resultados foram similares nos três grupos, com destaque para a distribuição Log-normal. Essa distribuição foi a mais significativa na maior parte do período avaliado. Analisando as equações volumétricas, observou-se que o modelo de Schumacher e Hall obteve o melhor desempenho, quando associado as distribuições t de Student com três graus de liberdade e Exponencial Potência (t = 0,8), respectivamente, para os grupos I e II. No grupo III, o modelo de Spurr associado a distribuição Exponencial Potência (t = 0,8) obteve o melhor desempenho. Comparando os modelos de crescimento em volume, observou-se que os modelos propostos nesta tese obtiveram melhores ajustes, quando associados as distribuições t de Student com três graus de liberdade e Exponencial Potência (t = 0,8), respectivamente, nos grupos I e III. No grupo II, o modelo de Chapman-Richards associado a distribuição t de Student com três graus de liberdade obteve o melhor desempenho.
63

Abordagem bayesiana para curva de crescimento com restrições nos parâmetros

AMARAL, Magali Teresópolis Reis 18 August 2008 (has links)
Submitted by (ana.araujo@ufrpe.br) on 2016-08-04T13:26:23Z No. of bitstreams: 1 Magali Teresopolis Reis Amaral.pdf: 5438608 bytes, checksum: a3ca949533ae94adaf7883fd465a627a (MD5) / Made available in DSpace on 2016-08-04T13:26:23Z (GMT). No. of bitstreams: 1 Magali Teresopolis Reis Amaral.pdf: 5438608 bytes, checksum: a3ca949533ae94adaf7883fd465a627a (MD5) Previous issue date: 2008-08-18 / The adjustment of the weight-age growth curves for animals plays an important role in animal production planning. These adjusted growth curves must be coherent with the biological interpretation of animal growth, which often demands imposition of constraints on model parameters.The inference of the parameters of nonlinear models with constraints, using classical techniques, presents various difficulties. In order to bypass those difficulties, a bayesian approach for adjustment of the growing curves is proposed. In this respect the bayesian proposed approach introduces restrictions on model parameters through choice of the prior density. Due to the nonlinearity, the posterior density of those parameters does not have a kernel that can be identified among the traditional distributions, and their moments can only be obtained using numerical techniques. In this work the MCMC simulation (Monte Carlo chain Markov) was implemented to obtain a summary of the posterior density. Besides, selection model criteria were used for the observed data, based on generated samples of the posterior density.The main purpose of this work is to show that the bayesian approach can be of practical use, and to compare the bayesian inference of the estimated parameters considering noninformative prior density (from Jeffreys), with the classical inference obtained by the Gauss-Newton method. Therefore it was possible to observe that the calculation of the confidence intervals based on the asymptotic theory fails, indicating non significance of certain parameters of some models, while in the bayesian approach the intervals of credibility do not present this problem. The programs in this work were implemented in R language,and to illustrate the utility of the proposed method, analysis of real data was performed, from an experiment of evaluation of system of crossing among cows from different herds, implemented by Embrapa Pecuária Sudeste. The data correspond to 12 measurements of weight of animals between 8 and 19 months old, from the genetic groups of the races Nelore and Canchim, belonging to the genotype AALLAB (Paz 2002). The results reveal excellent applicability of the bayesian method, where the model of Richard presented difficulties of convergence both in the classical and in the bayesian approach (with non informative prior). On the other hand the logistic model provided the best adjustment of the data for both methodologies when opting for non informative and informative prior density. / O ajuste de curva de crescimento peso-idade para animais tem um papel importante no planejamento da produção animal. No entanto, as curvas de crescimento ajustadas devem ser coerentes com as interpretações biológicas do crescimento do animal, o que exige muitas vezes que sejam impostas restrições aos parâmetros desse modelo.A inferência de parâmetros de modelos não lineares sujeito a restrições, utilizando técnicas clássicas apresenta diversas dificuldades. Para contornar estas dificuldades, foi proposta uma abordagem bayesiana para ajuste de curvas de crescimento. Neste sentido,a abordagem bayesiana proposta introduz as restrições nos parâmetros dos modelos através das densidades de probabilidade a priori adotadas. Devido à não linearidade, as densidades a posteriori destes parâmetros não têm um núcleo que possa ser identificado entre as distribuições tradicionalmente conhecidas e os seus momentos só podem ser obtidos numericamente. Neste trabalho, as técnicas de simulação de Monte Carlo Cadeia de Markov (MCMC) foram implementadas para obtenção de um sumário das densidades a posteriori. Além disso, foram utilizados critérios de seleção do melhor modelo para um determinado conjunto de dados baseados nas amostras geradas das densidades a posteriori.O objetivo principal deste trabalho é mostrar a viabilidade da abordagem bayesiana e comparar a inferência bayesiana dos parâmetros estimados, considerando-se densidades a priori não informativas (de Jeffreys), com a inferência clássica das estimativas obtidas pelo método de Gauss-Newton. Assim, observou-se que o cálculo de intervalos de confiança, baseado na teoria assintótica, falha, levando a não significância de certos parâmetros de alguns modelos. Enquanto na abordagem bayesiana os intervalos de credibilidade não apresentam este problema. Os programas utilizados foram implementados no R e para ilustração da aplicabilidade do método proposto, foram realizadas análises de dados reais oriundos de um experimento de avaliação de sistema de cruzamento entre raças bovinas de corte, executado na Embrapa Pecuária Sudeste. Os dados correspondem a 12 mensurações de peso dos 8 aos 19 meses de idade do grupo genético das raças Nelore e Canchim, pertencente ao grupo de genotípico AALLAB, ver (Paz 2002). Os resultados revelaram excelente aplicabilidade do método bayesiano, destacando que o modelo de Richard apresentou dificuldades de convergência tanto na abordagem clássica como bayesiana (com priori não informativa). Por outro lado o modelo Logístico foi quem melhor se ajustou aos dados em ambas metodologias quando se optou por densidades a priori não informativa e informativa.
64

Estimativas de parâmetros genéticos e de ambiente para medidas repetidas de produção de leite e de gordura em bovinos das raças Sindi e Guzerá

CRUZ, George Rodrigo Beltrão da 19 March 2007 (has links)
Submitted by (edna.saturno@ufrpe.br) on 2017-04-12T15:42:49Z No. of bitstreams: 1 George Rodrigo Beltrao da Cruz.pdf: 669412 bytes, checksum: 22996127ce4d96954b1d70d4a176af45 (MD5) / Made available in DSpace on 2017-04-12T15:42:49Z (GMT). No. of bitstreams: 1 George Rodrigo Beltrao da Cruz.pdf: 669412 bytes, checksum: 22996127ce4d96954b1d70d4a176af45 (MD5) Previous issue date: 2007-03-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The objective of this research was to identify the mathematical function that best fits the lactation curve of Guzerá and Sindi cattle. 840 lactations records (467 – Guzerá, 373 – Sindi) were used from animals raised at Carnauba ranch, in the town of Taperoá, Paraíba. Milk production yield was recorded in 35 days intervals, between the years of 1986 and 2004. Six mathematical functions were used to perform fit to the mean curve and individual lactations: the Polynomial Inverse function (FPI), Hyperbolic lineal (FLH), Gamma incomplete (FGI), Quadratic Logarithmic (FQL), Lineal (FL) and Quadratic (FQ) were fitted using interactive processes through Non-lineal regression. The criteria used to verify the fit quality for each function were: Fitted determination coefficient (Ra 2 ), percent of deviation between the total production observed and estimated, and percent of typical curves. Residual distribution graphics were used only to evaluate the mean curve fit. In the mean curve, the values of Ra 2 were more than 0,93 in all functions. Good fits were obtained based on Ra 2 >0,80, respectively in 61,4% and 66.7% of the lactations fitted by FPI and FGI functions for Guzerá cattle. For Sindi cattle, these values were 57,2% and 50,0%, respectively, showing good quality of fit. FPI and FGI were closest to the production oscillations throughout lactation, even though estimated deviations between total productions were observed and estimated that were similar to the other functions. For mean curve, all functions could be used, because the functions were close. For individual lactations, better estimates of total milk production could be obtained by the FPI and FGI. / Com este trabalho objetivou-se comparar algumas funções matemáticas citadas na literatura, identificar a que melhor descreve a produção de leite e estimar alguns componentes da curva de lactação de vacas Guzerá e Sindi criadas na região semi-árida do Estado da Paraíba. Foram utilizadas 840 lactações (467 - Guzerá; 373 - Sindi) de animais pertencentes à Fazenda Carnaúba, município de Taperoá, Paraíba. O controle leiteiro foi feito em intervalos de 35 dias, no período de 1986 a 2004. O ajuste foi feito para a curva média e para lactações individuais, utilizando-se seis funções matemáticas. As funções Polinomial Inversa (FPI), Linear Hiperbólica (FLH), Gama Incompleta (FGI), Quadrática Logarítmica (FQL), Linear (FL) e Quadrática (FQ) foram ajustadas usando-se processos iterativos por meio de regressão não-linear. Os critérios utilizados para verificar a qualidade do ajuste para cada função foram: coeficiente de determinação ajustado (Ra 2 ), porcentagem de desvios entre as produções totais observadas e estimadas e percentagem de curvas típicas. Os gráficos de distribuição de resíduos foram utilizados apenas para avaliar o ajuste para a curva média. Para a curva média, os valores de Ra 2 foram superiores a 0,93 em todas as funções. Bons ajustes baseados nos Ra 2 >0,80 foram obtidos, respectivamente, para 61,4% e 66,7% das lactações ajustadas pelas funções FPI e FGI para vacas Guzerá. Para vacas Sindi, esses valores foram de 57,2% e 55,0%, respectivamente, indicando boa qualidade no ajuste. Para curva média, todas as funções poderiam ser utilizadas, pois os desvios foram muito próximos. Para as lactações individuais, melhores estimativas dos componentes da curva de lactação poderiam ser obtidos pelas funções FPI e FGI.
65

Um estudo sobre separação cega de fontes e contribuições ao caso de misturas não-lineares / A study on blind source separation and contributions to the nonlinear case

Duarte, Leonardo Tomazeli, 1982- 08 February 2006 (has links)
Orientadores: João Marcos Travassos Romano, Romis Ribeiro de Faissol Attux / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-06T23:03:11Z (GMT). No. of bitstreams: 1 Duarte_LeonardoTomazeli_M.pdf: 2778720 bytes, checksum: ff42018b4aa2d824cd1f001655a42ddf (MD5) Previous issue date: 2006 / Resumo: O presente trabalho tem como objetivo a realização de um estudo sobre o problema de separação cega de fontes. Em uma primeira parte, considera-se o caso clássico em que o sistema misturador é de natureza linear. Na seqüência, a extensão ao caso não-linear é tratada. Em particular, enfatizamos uma importante classe de modelos não-lineares, os modelos com não-linearidade posterior (PNL). Com o intuito de contornar uma dificuldade relacionada à convergência para mínimos locais no treinamento de sistemas separadores PNL, uma nova técnica é proposta. Tal solução se baseia no uso de um algoritmo evolutivo na etapa de treinamento e de um estimador de entropia baseado em estatísticas de ordem. A eficácia do algoritmo proposto é verificada através de simulações em diferentes cenários / Abstract: The aim of this work is to study the problem of blind source separation (BSS). In a first part, the classical case in which the mixture system is of linear nature is considered. Afterwards, the nonlinear extension of the BSS problem is addressed. In special, an important class of nonlinear models, the post-nonlinear (PNL) models, is emphasized. In order to overcome a problem related to the convergence to local minima in the training of a PNL separating system, a novel technique is proposed. The bases of such solution are the application of an evolutionary algorithm in the training stage and the use of an entropy estimator based on order statistics. The efficacy of the proposal is attested by simulations conducted in different scenarios / Mestrado / Telecomunicações e Telemática / Mestre em Engenharia Elétrica
66

Análise de resíduos projetados em modelos não-lineares de regressão: uma aplicação em crescimento de frutos / Residual Analysis designed in non-linear regression: an application to fruit growth

Maria Cristina Martins 24 January 2013 (has links)
Alguns aspectos devem ser considerados nos trabalhos com frutíferas como o ponto adequado de colheita e estratégias de conservação, sendo fundamental a análise do crescimento e desenvolvimento dos frutos. Vários tipos de modelos estatísticos podem descrever os processos de crescimento envolvidos no sistema de produção vegetal, sendo os modelos não lineares considerados mais adequados para esse tipo de estudo. Para que os resultados obtidos no ajuste do modelo sejam válidos é necessário verificar a qualidade de ajuste por meio de uma análise dos resíduos. A distribuição dos resíduos ordinários para os modelos de regressão não linear, é matematicamente trabalhosa e os critérios de diagnóstico são falhos, principalmente em pequenas amostras. Diante de tal fato, Cook e Tsai (1985) definiram o resíduo projetado. O comportamento dos resíduos projetados é melhor do que o dos resíduos ordinários, pois suas propriedades são mais próximas das correspondentes ao resíduo ordinário da regressão normal linear. O ganho é substancial se o teste para a medida de não linearidade for significativo. Por meio dos ajustes dos modelos logístico e de Gompertz aos dados de comprimento de peras foi realizada a análise dos resíduos ordinários e dos resíduos projetados, a fim de evidenciar suas vantagens. Os resíduos projetados se mostraram viáveis para diagnóstico dos modelos e descartaram possíveis tendências apresentadas pelos resíduos normalizados. / Some aspects must be considered in the works with fruit tree such as the appropriate point of harvest and conservation strategies, being fundamental the analysis of growth and fruit developments. Several types of statistical models can describe the growth processes involved in plant production system and the non-linear models are considered more suitable for this type of study. For the results obtained from the model fit to be valid is necessary to check the quality of fit through a residual analysis. The distribution of the ordinary residuals in the non-linear regression models is mathematically complicated and the diagnostic criteria are not precise, mainly in small samples. To overcome this fact, Cook and Tsai (1985) defined the projected residual. The behaviour of the projected residuals is better than the ordinary residuals since their properties are closer to those corresponding to the ordinary residuals for the normal linear regression. The gain is substantial if the test for non-linearity is significant. Through the fit of the logistic and Gompertz models to the pears length data, it was performed an analysis of the ordinary and projected residuals in order to demonstrate their advantages. The projected residuals showed more feasible for the diagnostic of the models and ruled out possible trends presented by normalized residuals.
67

Diagnóstico em modelos de regressão linear e não-linear com erros simétricos / Diagnostic in linear and nonlinear regression models with symmetrical errors

Reis, Sandra Santos dos, 1983- 24 August 2018 (has links)
Orientador: Mauricio Enrique Zevallos Herencia / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-24T02:03:22Z (GMT). No. of bitstreams: 1 Reis_SandraSantosdos_M.pdf: 1897835 bytes, checksum: 24e50267c694dbcb380ddcfc9d7bdace (MD5) Previous issue date: 2013 / Resumo: Neste trabalho discutimos a detecção de observações influentes em modelos simétricos lineares e não lineares. Em primeiro lugar é realizado um estudo de simulação para avaliar o desempenho de três métodos de estimação em dados gerados por quatro situações: sem observações influentes, com outliers na variável resposta, com observações influentes de média alavancagem e com observações influentes de alta alavancagem. São analisados dois métodos de máxima verossimilhança e um método robusto. Foram considerados modelos de regressão linear e não linear com erros logísticos tipo II e t-Student. Em segundo lugar é discutida detecção de observações influentes mediante a distância de Cook generalizada, a estatística de Peña e a estatística de Andrews-Pregibon. Em particular é discutida a conveniência de utilizar a metodologia de limiares para caracterizar uma observação como influente ou não influente, assim como o efeito da estimação de parâmetros na construção de limiares. Estas medidas foram aplicadas a conjuntos de dados reais e simulados considerando o ajuste de alguns modelos simétricos com uma adaptação no método de estimação scoring de Fisher / Abstract: We discuss the detection of influential observations in symmetrical linear and nonlinear regression models. First a simulation study is conducted to evaluate the performance of three estimation methods on data generated by four situations: without influential observations with outliers in the response variable, with influential observations average leverage and influential observations with high leverage. Two methods of maximum likelihood and robust method are analyzed. We considered linear and nonlinear regression models with logistic-II and Student-t errors. Secondly detection of influential observations by generalized Cook's distance, the statistic PeÃ?a and Andrews - Pregibon statistic is discussed. In particular the convenience of using the methodology to characterize a threshold observation as influential or not influential, as well as the effect of parameter estimation in the construction of thresholds is discussed. These measures were applied to sets of real and simulated data considering the fit of some symmetrical regression models with an adaptation estimation method of Fisher scoring / Mestrado / Estatistica / Mestra em Estatística
68

Kernel nonnegative matrix factorization : application to hyperspectral imagery / Factorisation en matrices non négatives à noyaux : application à l'imagerie hyperspectrale

Zhu, Fei 19 September 2016 (has links)
Cette thèse vise à proposer de nouveaux modèles pour la séparation de sources dans le cadre non linéaire des méthodes à noyaux en apprentissage statistique, et à développer des algorithmes associés. Le domaine d'application privilégié est le démélange en imagerie hyperspectrale. Tout d'abord, nous décrivons un modèle original de la factorisation en matrices non négatives (NMF), en se basant sur les méthodes à noyaux. Le modèle proposé surmonte la malédiction de préimage, un problème inverse hérité des méthodes à noyaux. Dans le même cadre proposé, plusieurs extensions sont développées pour intégrer les principales contraintes soulevées par les images hyperspectrales. Pour traiter des masses de données, des algorithmes de traitement en ligne sont développés afin d'assurer une complexité calculatoire fixée. Également, nous proposons une approche de factorisation bi-objective qui permet de combiner les modèles de démélange linéaire et non linéaire, où les décompositions de NMF conventionnelle et à noyaux sont réalisées simultanément. La dernière partie se concentre sur le démélange robuste aux bandes spectrales aberrantes. En décrivant le démélange selon le principe de la maximisation de la correntropie, deux problèmes de démélange robuste sont traités sous différentes contraintes soulevées par le problème de démélange hyperspectral. Des algorithmes de type directions alternées sont utilisés pour résoudre les problèmes d'optimisation associés / This thesis aims to propose new nonlinear unmixing models within the framework of kernel methods and to develop associated algorithms, in order to address the hyperspectral unmixing problem.First, we investigate a novel kernel-based nonnegative matrix factorization (NMF) model, that circumvents the pre-image problem inherited from the kernel machines. Within the proposed framework, several extensions are developed to incorporate common constraints raised in hypersepctral images analysis. In order to tackle large-scale and streaming data, we next extend the kernel-based NMF to an online fashion, by keeping a fixed and tractable complexity. Moreover, we propose a bi-objective NMF model as an attempt to combine the linear and nonlinear unmixing models. The decompositions of both the conventional NMF and the kernel-based NMF are performed simultaneously. The last part of this thesis studies a supervised unmixing model, based on the correntropy maximization principle. This model is shown robust to outlier bands. Two correntropy-based unmixing problems are addressed, considering different constraints in hyperspectral unmixing problem. The alternating direction method of multipliers (ADMM) is investigated to solve the related optimization problems
69

Quantile regression for mixed-effects models = Regressão quantílica para modelos de efeitos mistos / Regressão quantílica para modelos de efeitos mistos

Galarza Morales, Christian Eduardo, 1988- 27 August 2018 (has links)
Orientador: Víctor Hugo Lachos Dávila / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-27T06:40:31Z (GMT). No. of bitstreams: 1 GalarzaMorales_ChristianEduardo_M.pdf: 5076076 bytes, checksum: 0967f08c9ad75f9e7f5df339563ef75a (MD5) Previous issue date: 2015 / Resumo: Os dados longitudinais são frequentemente analisados usando modelos de efeitos mistos normais. Além disso, os métodos de estimação tradicionais baseiam-se em regressão na média da distribuição considerada, o que leva a estimação de parâmetros não robusta quando a distribuição do erro não é normal. Em comparação com a abordagem de regressão na média convencional, a regressão quantílica (RQ) pode caracterizar toda a distribuição condicional da variável de resposta e é mais robusta na presença de outliers e especificações erradas da distribuição do erro. Esta tese desenvolve uma abordagem baseada em verossimilhança para analisar modelos de RQ para dados longitudinais contínuos correlacionados através da distribuição Laplace assimétrica (DLA). Explorando a conveniente representação hierárquica da DLA, a nossa abordagem clássica segue a aproximação estocástica do algoritmo EM (SAEM) para derivar estimativas de máxima verossimilhança (MV) exatas dos efeitos fixos e componentes de variância em modelos lineares e não lineares de efeitos mistos. Nós avaliamos o desempenho do algoritmo em amostras finitas e as propriedades assintóticas das estimativas de MV através de experimentos empíricos e aplicações para quatro conjuntos de dados reais. Os algoritmos SAEMs propostos são implementados nos pacotes do R qrLMM() e qrNLMM() respectivamente / Abstract: Longitudinal data are frequently analyzed using normal mixed effects models. Moreover, the traditional estimation methods are based on mean regression, which leads to non-robust parameter estimation for non-normal error distributions. Compared to the conventional mean regression approach, quantile regression (QR) can characterize the entire conditional distribution of the outcome variable and is more robust to the presence of outliers and misspecification of the error distribution. This thesis develops a likelihood-based approach to analyzing QR models for correlated continuous longitudinal data via the asymmetric Laplace distribution (ALD). Exploiting the nice hierarchical representation of the ALD, our classical approach follows the stochastic Approximation of the EM (SAEM) algorithm for deriving exact maximum likelihood (ML) estimates of the fixed-effects and variance components in linear and nonlinear mixed effects models. We evaluate the finite sample performance of the algorithm and the asymptotic properties of the ML estimates through empirical experiments and applications to four real life datasets. The proposed SAEMs algorithms are implemented in the R packages qrLMM() and qrNLMM() respectively / Mestrado / Estatistica / Mestre em Estatística
70

Uso dos métodos clássico e bayesiano para os modelos não-lineares heterocedásticos simétricos / Use of the classical and bayesian methods for nonlinear heterocedastic symmetric models

Márcia Aparecida Centanin Macêra 21 June 2011 (has links)
Os modelos normais de regressão têm sido utilizados durante muitos anos para a análise de dados. Mesmo nos casos em que a normalidade não podia ser suposta, tentava-se algum tipo de transformação com o intuito de alcançar a normalidade procurada. No entanto, na prática, essas suposições sobre normalidade e linearidade nem sempre são satisfeitas. Como alternativas à técnica clássica, foram desenvolvidas novas classes de modelos de regressão. Nesse contexto, focamos a classe de modelos em que a distribuição assumida para a variável resposta pertence à classe de distribuições simétricas. O objetivo geral desse trabalho é a modelagem desta classe no contexto bayesiano, em particular a modelagem da classe de modelos não-lineares heterocedásticos simétricos. Vale ressaltar que esse trabalho tem ligação com duas linhas de pesquisa, a saber: a inferência estatística abordando aspectos da teoria assintótica e a inferência bayesiana considerando aspectos de modelagem e critérios de seleção de modelos baseados em métodos de simulação de Monte Carlo em Cadeia de Markov (MCMC). Uma primeira etapa consiste em apresentar a classe dos modelos não-lineares heterocedásticos simétricos bem como a inferência clássica dos parâmetros desses modelos. Posteriormente, propomos uma abordagem bayesiana para esses modelos, cujo objetivo é mostrar sua viabilidade e comparar a inferência bayesiana dos parâmetros estimados via métodos MCMC com a inferência clássica das estimativas obtidas por meio da ferramenta GAMLSS. Além disso, utilizamos o método bayesiano de análise de influência caso a caso baseado na divergência de Kullback-Leibler para detectar observações influentes nos dados. A implementação computacional foi desenvolvida no software R e para detalhes dos programas pode ser consultado aos autores do trabalho / The normal regression models have been used for many years for data analysis. Even in cases where normality could not be assumed, was trying to be some kind of transformation in order to achieve the normality sought. However, in practice, these assumptions about normality and linearity are not always satisfied. As alternatives to classical technique new classes of regression models were developed. In this context, we focus on the class of models in which the distribution assumed for the response variable belongs to the symmetric distributions class. The aim of this work is the modeling of this class in the bayesian context, in particular the modeling of the nonlinear models heteroscedastic symmetric class. Note that this work is connected with two research lines, the statistical inference addressing aspects of asymptotic theory and the bayesian inference considering aspects of modeling and criteria for models selection based on simulation methods Monte Carlo Markov Chain (MCMC). A first step is to present the nonlinear models heteroscedastic symmetric class as well as the classic inference of parameters of these models. Subsequently, we propose a bayesian approach to these models, whose objective is to show their feasibility and compare the estimated parameters bayesian inference by MCMC methods with the classical inference of the estimates obtained by GAMLSS tool. In addition, we use the bayesian method of influence analysis on a case based on the Kullback-Leibler divergence for detecting influential observations in the data. The computational implementation was developed in the software R and programs details can be found at the studys authors

Page generated in 0.0451 seconds