241 |
Uma família de modelos de regressão com a distribuição original da variável respostaPaula, Marcelo de 05 April 2013 (has links)
Made available in DSpace on 2016-06-02T20:04:52Z (GMT). No. of bitstreams: 1
5021.pdf: 1591649 bytes, checksum: 6798e65e3b572fcfe760f083f660ff50 (MD5)
Previous issue date: 2013-04-05 / Financiadora de Estudos e Projetos / We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates. / É sabido que a área de modelagem estatística por regressão sofreu um grande impulso desde o desenvolvimento dos modelos lineares generalizados (MLGs) no início da década de 70 do Século XX, propostos por Nelder e Wedderburn (1972). A teoria dos MLGs pode ser interpretada como uma generalização do modelo de regressão linear tradicional, em que a variável resposta não precisa necessariamente assumir a distribuição normal, e sim, qualquer distribuição pertencente à família exponencial de distribuições. Em algumas situações, porém, a distribuição da variável resposta Se originalmente fruto de uma outra distribuição discreta ou contínua, ou seja, a variável resposta tem uma distribuição original que não Se a usualmente considerada. Um exemplo desta situação Se a dicotomização de uma variável discreta ou contínua por meio de um ponto de corte arbitrário. Além disso, a variável resposta pode estar relacionada, de alguma forma, com uma outra variável de interesse. Nesse trabalho propomos uma família de modelos de regressão com a informação da variável resposta original, cuja distribuição de probabilidades ou função densidade de probabilidade pertence à família exponencial. O modelo de regressão logística com resposta normal e log-normal desenvolvido por Suissa e Blais (1995) Se apresentado como caso particular dos modelos de regressão com resposta de origem. Para a resposta de origem normal consideramos os modelos logístico, exponencial, geométrico, Poisson e log-normal. Para a resposta de origem exponencial consideramos os modelos logístico, normal, geométrico, Poisson e log-normal. Em contribuição ao trabalho de Suissa e Blais atribuímos duas respostas discretas ao modelo logístico, geométrico e de Poisson, e também consideramos uma resposta contínua normal com estrutura heteroscedástica. Adicionalmente, propomos também o modelo logístico com resposta pertencente à classe de distribuições séries de potências inflacionadas considerando o caso particular da resposta geométrica zero inflacionada. Realizamos vários estudos com dados artificiais comparando o modelo de regressão proposto com a informação da distribuição de origem e o modelo de regressão usual. Dois conjuntos de dados reais também são considerados. Assumindo uma distribuição corretamente especificada, o modelo produz estimativas de máxima verossimilhança mais eficientes e estimativas intervalares mais precisas para os coeficientes de regressão.
|
242 |
Modelos de regressão logística clássica, Bayesiana e redes neurais para Credit ScoringMendonça, Tiago Silva 15 February 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:03Z (GMT). No. of bitstreams: 1
2410.pdf: 5430269 bytes, checksum: 6eb0e35f94b3108e492df5a93a5b0c34 (MD5)
Previous issue date: 2008-02-15 / Important advances have been achieved in the granting of credit, however, the problem of identifying good customers for the granting of credit does not provide a definitive solution. Several techniques were presented and are being developed, each presents its characteristics, advantages and disadvantages as to their discrimination power, robustness, ease of implementation and possibility of interpretation. This work presents three techniques for the classification of defaults in models of Credit Score, Classical Logistic Regression, Bayesian Logistic Regression with no prior information and Artificial Neural Networks with a few different architectures. The main objective of the study is to compare the performance of these techniques in the identification of customers default. For this, four metrics were used for comparison of models: predictive capacity, ROC Curve, Statistics of Kolmogorov Smirnov and capacity of hit models. Two data bases were used, an artificial bank and a real bank. The database was constructed artificially based on an article by Breiman that generates the explanatory variables from a multivariate normal distribution and the actual database used is a problem with Credit Score of a financial institution that operates in the retail Brazilian market more than twenty years. / Importantes avanços vêm sendo conquistados na área de concessão de crédito, não obstante, o problema de identificação de bons clientes para a concessão de crédito não apresenta uma solução definitiva. Diversas técnicas foram apresentadas e vêm sendo desenvolvidas, cada uma apresenta suas características, com vantagens e desvantagens no tocante ao seu poder de discriminação, robustez, facilidade de implementação e possibilidade de interpretação. Este trabalho apresenta três técnicas para a classificação de inadimplência em modelos de Credit Score, Regressão Logística Clássica, Regressão Logística Bayesiana com priori não informativa e Redes Neurais Artificiais com algumas diferentes arquiteturas. O objetivo principal do trabalho é comparar o desempenho destas técnicas na identificação de clientes inadimplentes. Para isto, Foram utilizadas quatro métricas para a comparação dos modelos: Capacidade Preditiva, Curva ROC, Estatística de Kolmogorov Smirnov e a Capacidade de Acerto dos modelos. Dois bancos de dados foram utilizados, um banco artificial e um banco real. O banco de dados artificial foi construído baseado em um artigo de Breiman que gera as variáveis explicativas a partir de uma distribuição normal multivariada e o banco de dados real utilizado trata-se de um problema de Credit Score de uma instituição financeira que atua no mercado varejista brasileiro há mais de vinte anos.
|
243 |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)Casagrande, Marcelo Henrique 29 April 2016 (has links)
Submitted by Bruna Rodrigues (bruna92rodrigues@yahoo.com.br) on 2016-10-06T11:48:12Z
No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:41Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:47Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Made available in DSpace on 2016-10-20T13:58:52Z (GMT). No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5)
Previous issue date: 2016-04-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This paper presents a comparative study of the predictive power of four suitable regression
methods for situations in which data, arranged in the planning matrix, are very
poorly multicolinearity and / or high dimensionality, wherein the number of covariates is
greater the number of observations.
In this study, the methods discussed are: principal component regression, partial least
squares regression, ridge regression and LASSO.
The work includes simulations, wherein the predictive power of each of the techniques
is evaluated for di erent scenarios de ned by the number of covariates, sample size and
quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between
the methods and allowing for the creating a guide for the user to choose which method
to use based on some prior knowledge that it may have.
An application on real data (not simulated) is also addressed. / Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro
m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz
de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade,
em que o n umero de covari aveis e maior do que o n umero de observa c~oes.
No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais,
regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO.
O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e
avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra
e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais
diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario
possa escolher qual metodologia usar com base em algum conhecimento pr evio que o
mesmo possa ter.
Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordada
|
244 |
Estimação e diagnostico em modelos Birnbaum-Saunders skew-normal / Estimation and diagnostic in Birnbaum-Saunders skew-normal modelsSantana, Lucia Rolim 13 August 2018 (has links)
Orientador: Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-13T12:05:21Z (GMT). No. of bitstreams: 1
Santana_LuciaRolim_M.pdf: 2777481 bytes, checksum: 1fc4e9545174b66579970259631b5d20 (MD5)
Previous issue date: 2009 / Resumo: A classe de modelos Birnbaum-Saunders (BS) surgiu em problemas de fadiga dos materiais (que 'e um dano estrutural que ocorre quando um material é exposto a estresse e tensão). Nos últimos tempos, este modelo tem sido aplicado em áreas fora do contexto de fadiga dos materiais e engenharia, como por exemplo, em ciências da saúde, ambiental, florestal, demográficas, atuarial, financeira, entre outras. Tendo em vista que a distribuição BS tem a propriedade de descrever processos de degradação acumulativa. Neste trabalho, apresentamos um estudo do modelo BS baseado na distribuição skewnormal. Como subproduto consideramos o modelo de regressão linear log-Birnbaum-Saunders (log-BS). Para obter as estimativas de máxima verossimilhança usamos o algoritmo EM. Além disso, apresentamos um estudo de análise de influência global e local, através da metodologia de Zhu e Lee (2001) para dados incompletos. Ilustramos a metodologia proposta com dados encontrados na literatura. / Abstract: The class of models Birnbaum-Saunders (BS) appeared in problems of fatigue of materials (which is a structural damage that occurs when a material is exposed to stress and tension). Recently, this model has been applied in areas outside the context of fatigue of materials and engineering, for example in health sciences, environmental, forestry, demographic, actuarial, financial, among others. As the BS distribution has the property to describe cumulative degradation processes. In this work we present a study of the BS model based on Skew-normal distribution. As a byproduct consider the model of linear regression log-Birnbaum-Saunders (log-BS). To obtain estimates of maximum likelihood we use the EM algorithm. Furthermore, we present a study of the analysis of global and local influence, through the method of Zhu and Lee (2001) to incomplete data. Illustrate the proposed methodology with data found in literature. / Mestrado / Inferencia / Mestre em Estatística
|
245 |
Inferência em um modelo de regressão com resposta binária na presença de sobredispersão e erros de medição / Inference in a regression model with overdispersed binary response and measurement errorsSandra Maria Tieppo 15 February 2007 (has links)
Modelos de regressão com resposta binária são utilizados na solução de problemas nas mais diversas áreas. Neste trabalho enfocamos dois problemas comuns em certos conjuntos de dados e que requerem técnicas apropriadas que forneçam inferências satisfatórias. Primeiro, em certas aplicações uma mesma unidade amostral é utilizada mais de uma vez, acarretando respostas positivamente correlacionadas, responsáveis por uma variância na variável resposta superior ao que comporta a distribuição binomial, fenômeno conhecido como sobredispersão. Por outro lado, também encontramos situações em que a variável explicativa contém erros de medição. É sabido que utilizar técnicas que desconsideram esses erros conduz a resultados inadequados (estimadores viesados e inconsistentes, por exemplo). Considerando um modelo com resposta binária, utilizaremos a distribuição beta-binomial para representar a sobredispersão. Os métodos de máxima verossimilhança, SIMEX, calibração da regressão e máxima pseudo-verossimilhança foram usados na estimação dos parâmetros do modelo, que são comparados através de um estudo de simulação. O estudo de simulação sugere que os métodos de máxima verossimilhança e calibração da regressão são melhores no sentido de correção do viés, especialmente para amostras de tamanho 50 e 100. Também estudaremos testes de hipóteses assintóticos (como razão de verossimilhanças, Wald e escore) a fim de testar hipóteses de interesse. Apresentaremos também um exemplo com dados reais / Regression models with binary response are used for solving problems in several areas. In this work we approach two common problems in some data sets and they need appropriate techniques to achieve satisfactory inference. First, in some applications, the same sample unity is utilized more than once, bringing positively correlated responses, which are responsible for the response variable variance be greater than an assumption binomial distribution, phenomenon known as overdispersion. On the other hand, also we find situations where the explanatory variable has measurement errors. It is known that the use of techniques which ignores these measurement errors brings inadequate results (e. g., biased and inconsistent estimators). Taking a model with binary response, we will use a beta-binomial distribution for modeling the overdispersion. The methods of maximum likelihood, SIMEX, regression calibration and maximum pseudo-likelihood were used in the estimation of the parameters, which are compared through a simulation study. The simulation studies suggest that the maximum likelihood and regression calibration methods are better for bias correcting, especially for larger sample size. Likelihood ratio, Wald and score statistics are used in order to test hypothesis of interest. We will illustrate the techniques with an application to a real data set
|
246 |
Relacionamento com clientes no mercado de serviços: um estudo exploratório na atividade de facilities centersMartins, Hellio Calian 29 January 2013 (has links)
Submitted by Hellio Martins (hcalian@hotmail.com) on 2013-03-12T18:49:49Z
No. of bitstreams: 1
DISSERTAÇÃO.pdf: 4358310 bytes, checksum: 412fadf3a784d22533796bbc1198a1a2 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2013-03-20T18:47:55Z (GMT) No. of bitstreams: 1
DISSERTAÇÃO.pdf: 4358310 bytes, checksum: 412fadf3a784d22533796bbc1198a1a2 (MD5) / Approved for entry into archive by Marcia Bacha (marcia.bacha@fgv.br) on 2013-03-27T17:03:31Z (GMT) No. of bitstreams: 1
DISSERTAÇÃO.pdf: 4358310 bytes, checksum: 412fadf3a784d22533796bbc1198a1a2 (MD5) / Made available in DSpace on 2013-03-27T17:04:40Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO.pdf: 4358310 bytes, checksum: 412fadf3a784d22533796bbc1198a1a2 (MD5)
Previous issue date: 2013-01-29 / A satisfação do cliente se apresenta como objeto de inúmeros estudos e pesquisas acadêmicas sobre o comportamento do consumidor muito em função da sua implicação gerencial direta para fidelização, retenção do cliente, estabelecimento de relações duradouras e a consequente sustentabilidade do negócio. Em função da experiência profissional do autor, essa dissertação compara as percepções de satisfação de lojistas de dois shopping centers com os respectivos serviços de facilities dada a decisão gerencial de terceirização ou internalização dessas atividades. Os dados coletados junto aos consumidores organizacionais através de entrevistas presenciais foram analisados com base estatística e os resultados mostram indícios de que essa opção gerencial tem significativa relevância na formação da satisfação do cliente. Além dessa conclusão principal, são oferecidas ainda discussões entre as perspectivas teóricas e os resultados da pesquisa de campo bem como possibilidades de aprofundamento do estudo. Por fim, apresentam-se algumas implicações e contribuições teóricas e gerenciais do presente estudo para acadêmicos e gestores de negócios, respectivamente. / Customer satisfaction is subject of numerous researches on consumer behavior mainly due to its direct managerial implications regarding loyalty, customer retention, enduring relationships establishment and, consequently, business sustainability. As a result of the author’s professional experience, this dissertation compares satisfaction perceptions of stores from two distinct shopping centers given the management decision considering the outsource of these activities or provide them with its own manpower. The data collected from industrial buyers making use of face to face interviews were statiscally analyzed and the results evidence that this managerial option has significant relevance in the formation of costumer satisfaction. Besides the main conclusion, this academic report also offers discussions between theoretical perspectives and the results obtained from field research as well as possibilities for further study. At last, it is presented some implications and contribuitions from theoretical and practical point of views for the Academy and business managers, respectively.
|
247 |
Abordagem bayesiana de modelos de regressão com platô de resposta / Bayesian approach of regression models with response plateauMangueira, Rick Anderson Freire 08 February 2019 (has links)
Estudos para estabelecer níveis de nutrientes adequados em dietas de animais são bastante comuns no meio científico. Tais estudos são realizados utilizando a média da variável resposta nos diferentes níveis da variável independente e, geralmente, por meio de abordagem frequentista. Sendo assim, muita informação é perdida ou até mesmo as médias influenciadas por valores extremos nos resultados das repetições. O objetivo do presente trabalho foi realizar um estudo de simulação de modelos de regressão com platô de resposta, considerando diversos cenários de diferentes tamanhos amostrais, além da homogeneidade e heterogeneidade de variância entre níveis do fator dosagem levando em consideração as repetições em cada dosagem, por meio de abordagem bayesiana. Também foi realizado ajustes dos modelos de regressão quadrático com platô de resposta e do não linear com platô de resposta utilizando a metodologia bayesiana para estimar os parâmetros dos modelos. Os dados simulados representavam o teor de Zinco (Zn) depositado na tíbia de frangos, que receberam as dosagens 0, 15, 30, 45, 60, 75, 90, 105 e 120 ppm de Zn na ração. Nos cenários 1, 2 e 3 foi atribuído variância constante, com tamanhos amostrais de n=16, n=30 e n=100, respectivamente. Nos cenários 4, 5 e 6, foram considerados também os tamanhos amostrais n=16, n=30 e n=100, respectivamente, mas com diferentes variâncias ao longo do fator dose. Os dados utilizados para o estudo sobre os modelos de regressão com platô de resposta são referentes ao teor de Zinco (Zn), em ppm, na tíbia de frangos e frangas de corte como variável resposta. A análise de simulação mostrou que é adequada a utilização dos modelos com platô de resposta considerando a repetição das amostras em cada dose para estimar o nível adequado de um nutriente na ração animal. No ajuste dos modelos aos dados reais, o modelo de regressão quadrático com platô de resposta considerando a heterogeneidade de variâncias foi o que apresentou melhor ajuste, em que obteve-se uma estimativa de x̂0 = 73, 26 ppm para o nível de Zn aplicado na ração para uma deposição de Zn na tíbia dos frangos de P̂ = 290, 12 ppm. / Studies to establish adequate levels of nutrients in animal diets are quite common in the scientific world. Such studies are performed using the mean of the response variable in the different levels of the independent variable and, generally, through a frequentist approach. Thus, much information is lost or even the means influenced by extreme values in the results of the repetitions. The objective of the present work was to perform a simulation study of regression models with response plateau, where as different scenarios of different sample sizes, besides the homogeneity and heterogeneity of variance between levels of the dosage factor taking the repetitions in each dosage into account, through Bayesian approach. Fits were also made to the quadratic regression models with response plateau and nonlinear regression with response plateau using Bayesian methodology to estimate the parameters of the models. The simulated data represented the zinc content (Zn) deposited in the tibia of broilers, which received the dosages 0, 15, 30, 45, 60, 75, 90, 105 and 120 ppm of Zn in the feed. In the scenarios 1, 2 and 3 were attributed constant variance with sample sizes of n = 16, n = 30 and n = 100, respectively. In the scenarios 4, 5 and 6 the sample sizes were, respectively, n = 16, n = 30 and n = 100, but with different variances along the dose factor. The data used for the study on the regression models with response plateau refer to the Zn content, in ppm, in the tibia of male and female broilers as response variable. The simulation analysis showed that it is appropriate to use the models with response plateau considering the repetition of the samples at each dose to estimate the adequate level of a nutrient in the animal feed. In the fit of the models to the real data, the quadratic regression model with response plateau considering the heterogeneity of variances was the one that presented the best fit, which an estimate of x̂0 = 73.26 ppm for the level of Zn applied to the feed for a Zn deposition in the chicken tibia of P̂ = 290.12 ppm.
|
248 |
Amabilidade do professor como determinante da boa relação professor-aluno na primeira infância: caso de Petrolina / Teacher agreeableness as determinant of good teacher-child relationship in early childhood: a case study of Petrolina (PE, Brazil)Vitto, Leonardo de 05 April 2019 (has links)
A relação professor-aluno é fator essencial no processo de desenvolvimento físico, social e emocional dos alunos, principalmente em se tratando de alunos da primeira infância, sendo este o momento de maior aprendizado em nossas vidas. Desta forma, estruturar uma boa relação com a criança permite ao professor consolidar um ambiente propício e estimulante ao ensino, além de facilitar ajustes comportamentais. Assim, este trabalho busca captar efeitos determinantes para uma boa relação professor-aluno, mais especificamente via nível de amabilidade do professor. Esta análise foi possível utilizando dados da cidade de Petrolina, coletadas pelo Instituto Alfa e Beto, contendo informações a respeito da escala de relação professor-aluno (ERPA) e o nível de amabilidade do professor via instrumento SENNA. O município de Petrolina utilizou-se do processo de convênio para expandir o número de vagas em educação infantil através do projeto denominado \"Nova Semente\". Entretanto, constatamos características divergentes entre a rede pública e conveniada sobre a composição da equipe de docentes, de forma que estas indiquem um cenário de baixa qualidade no ensino oferecido pela rede conveniada. Por fim, encontramos vestígios de que maiores níveis de amabilidade do professor de creche compensa em partes uma baixa qualificação. / The teacher-child relationship is an essential factor in the process of physical, social and emotional achievement of the students, especially in early childhood, the moment of highest development in the life. This way, structuring a good relationship with the child, allows the teacher not only consolidating a favorable and stimulant learning environment, but also provide behavioral adjustment. Therefore, this study aims at show determinants of a good teacher-child relationship, more specifically by teacher agreeableness. The analysis became possible by the use of a database from Petrolina (PE, Brazil) collected by Alfa e Beto Institute, which contains information related to a scale of teacher-child relationship (ERPA) and the score of teacher agreeableness measured by SENNA instrument. The city of Petrolina used the agreement process to increase the number of vacancies in early childhood education day care centers through a project named \"Nova Semente\" (New Seed). Distinct characteristics were registered between the public and chartered projects regarding the composition of teaching staff, indicating a low quality income in teaching process offered by chartered sector. It is fair to infer that teacher agreeableness in day care center compensates for low training level of teaching staff.
|
249 |
Análise da cor da casca do mamão cv. Sunrise Solo por meio de modelo de regressão linear misto / Analysis of color peel of the papaya cv. Sunrise Solo through of the mixed linear regression modelNascimento, Caroline Oliveira do 30 May 2019 (has links)
O mamão (Carica papaya L.) tem importância destacada na fruticultura e se encontra entre os seis principais produtos que somam mais de 50% da produção nacional desse setor. O mamão tem uma maturação relativamente rápida. Visando aumentar o potencial de comércio e possivelmente diminuir as perdas pós-colheita, a análise de imagens digitais é um recurso tecnológico para avaliar a tonalidade e intensidade da cor da casca dos frutos no período de maturação, que serve de base para estabelecer modelos funcionais para mensurações realizadas num período de tempo. Nesse contexto tem como motivação um estudo longitudinal envolvendo a avaliação da intensidade e tonalidade da cor da casca do mamão da espécie Carica papaya L. no período de maturação. Para a análise dos dados é utilizada a metodologia dos modelos lineares de efeitos mistos e para selecionar os modelos que melhor se ajustavam aos dados, utilizou-se teste da razão de verossimilhanças e teste F, em um método de seleção top-down. Verifica-se que modelo polinomial quadrático com efeito aleatório em todos os parâmetros descreve de maneira satisfatória a variável tonalidade. Para a variável intensidade obteve-se um modelo polinomial cúbico para os efeitos aleatórios e apenas o intercepto como parâmetro de efeito fixo. As análises de diagnóstico confirmaram o ajuste satisfatório dos modelos. / The papaya (Carica papaya L.) has important importance in fruticulture and is among the six main products that add up to more than 50% of the national production of this sector. Papaya has a relatively rapid maturation. In order to increase commercial potential and possibly reduce post-harvest losses, digital image analysis is a technological tool to evaluate the color tone and intensity of fruit peel during the maturation period, which serves as the basis for establishing functional models for measurements performed over a period of time. In this context it has as motivation a longitudinal study involving the evaluation of the intensity and color tone of the shell of the papaya of the species Carica papaya L. in the maturation period. For the analysis of the data the methodology of the linear models of mixed effects is used and to select the models that best fit the data, was used a test of the likelihood ratio and test F, in a method of selection top-down. It can be verified that the quadratic polynomial model with random effect in all the parameters describes in a satisfactory way the variable tonality. For the intensity variable we obtained a cubic polynomial model for the random effects and only the intercept as a fixed effect parameter. Diagnostic analyzes confirmed the satisfactory fit of the models.
|
250 |
Modelos de regressão sobre dados composicionais / Regression model for Compositional dataCamargo, André Pierro de 09 December 2011 (has links)
Dados composicionais são constituídos por vetores cujas componentes representam as proporções de algum montante, isto é: vetores com entradas positivas cuja soma é igual a 1. Em diversas áreas do conhecimento, o problema de estimar as partes $y_1, y_2, \\dots, y_D$ correspondentes aos setores $SE_1, SE_2, \\dots, SE_D$, de uma certa quantidade $Q$, aparece com frequência. As porcentagens $y_1, y_2, \\dots, y_D$ de intenção de votos correspondentes aos candidatos $Ca_1, Ca_2, \\dots, Ca_D$ em eleições governamentais ou as parcelas de mercado correspondentes a industrias concorrentes formam exemplos típicos. Naturalmente, é de grande interesse analisar como variam tais proporções em função de certas mudanças contextuais, por exemplo, a localização geográfica ou o tempo. Em qualquer ambiente competitivo, informações sobre esse comportamento são de grande auxílio para a elaboração das estratégias dos concorrentes. Neste trabalho, apresentamos e discutimos algumas abordagens propostas na literatura para regressão sobre dados composicionais, assim como alguns métodos de seleção de modelos baseados em inferência bayesiana. \\\\ / Compositional data consist of vectors whose components are the proportions of some whole. The problem of estimating the portions $y_1, y_2, \\dots, y_D$ corresponding to the pieces $SE_1, SE_2, \\dots, SE_D$ of some whole $Q$ is often required in several domains of knowledge. The percentages $y_1, y_2, \\dots, y_D$ of votes corresponding to the competitors $Ca_1, Ca_2, \\dots, Ca_D$ in governmental elections or market share problems are typical examples. Of course, it is of great interest to study the behavior of such proportions according to some contextual transitions. In any competitive environmet, additional information of such behavior can be very helpful for the strategists to make proper decisions. In this work we present and discuss some approaches proposed by different authors for compositional data regression as well as some model selection methods based on bayesian inference.\\\\
|
Page generated in 0.0572 seconds