Spelling suggestions: "subject:"modelos lineares generalizado"" "subject:"modelos lineares generalizada""
1 |
Alguns modelos para dados de contagem resultantes de experimentos com cultura de tecidos / not availableFioravante, Ana Maria 30 January 1996 (has links)
Em experimentos com cultura de tecidos é comum a obtenção de dados de contagem. Pode-se admitir, a princípio, que contagens seguem a distribuição de Poisson. Neste trabalho, utilizando-se o enfoque de modelos lineares generalizados, são apresentados os modelos Poisson, Poisson truncado e binomial negativo para a análise de dados de contagem resultantes de experimentos com cultura de tecidos. Esses dados, via de regra, apresentam o número de observações iguais a zero maior do que seria esperado com base no número médio de eventos que ocorrem. Outro problema que esses dados podem apresentar é a ocorrência de superdispersão. Quando essas situações se verificam, o modelo Poisson não se ajusta bem aos dados e os modelos Poisson truncado e binomial negativo são apresentados como alternativas para esse problema. Como aplicação, foram utilizados três conjuntos de dados e a variável resposta estudada foi o número de calos produzidos por explante entre os modelos Poisson e Poisson truncado. Este foi o que melhor se ajustou ao conjunto A de dados, que não apresentou superdispersão. Para o conjunto B de dados, que apresentou superdispersão, o melhor modelo foi o binomial negativo, e para o conjunto C de dados, que também não apresentou superdispersão, o modelo Poisson ofereceu um bom ajuste / not available
|
2 |
Fator de correção para a distribuição da Deviance para dados de proporções / not availableGimenes, Ana Paula Gomes da Silva 27 September 2000 (has links)
A análise de dados de proporções apresenta, em geral, certas dificuldades uma vez que a distribuição subjacente a tais dados pode ser considerada binomial, que não segue as pressuposições básicas para o ajuste de um modelo matemático. Algumas transformações são sugeridas, mas nem sempre bons resultados são obtidos. No enfoque de modelos lineares generalizados, a estatística que mede a qualidade do ajuste do modelo para os dados é chamada deviance. Ocorre que a distribuição da deviance é desconhecida. No entanto, para dados com distribuição binomial, pode-se aproximar a distribuição da deviance por uma distribuição qui-quadrado, mas tal aproximação não é boa para tamanhos pequenos de amostra. Para melhorar essa aproximação, alguns fatores de correção para os dados são sugeridos, mas os resultados obtidos ainda não são bons para pequenas amostras. Assim, o objetivo deste trabalho é propor um novo fator de correção para os dados seguindo uma distribuição binomial, de modo a se obter uma melhora na distribuição da deviance para qualquer tamanho de amostra. Para isto, adiciona-se uma constante à variável resposta e, através do valor esperado da deviance, calcula-se tal constante de modo a reduzir o erro cometido na aproximação. Simulações da distribuição binomial e o cálculo da deviance são feitos e QQ-plots são utilizados para a comparação com a distribuição qui-quadrado / not available
|
3 |
Alguns modelos para dados de contagem resultantes de experimentos com cultura de tecidos / not availableAna Maria Fioravante 30 January 1996 (has links)
Em experimentos com cultura de tecidos é comum a obtenção de dados de contagem. Pode-se admitir, a princípio, que contagens seguem a distribuição de Poisson. Neste trabalho, utilizando-se o enfoque de modelos lineares generalizados, são apresentados os modelos Poisson, Poisson truncado e binomial negativo para a análise de dados de contagem resultantes de experimentos com cultura de tecidos. Esses dados, via de regra, apresentam o número de observações iguais a zero maior do que seria esperado com base no número médio de eventos que ocorrem. Outro problema que esses dados podem apresentar é a ocorrência de superdispersão. Quando essas situações se verificam, o modelo Poisson não se ajusta bem aos dados e os modelos Poisson truncado e binomial negativo são apresentados como alternativas para esse problema. Como aplicação, foram utilizados três conjuntos de dados e a variável resposta estudada foi o número de calos produzidos por explante entre os modelos Poisson e Poisson truncado. Este foi o que melhor se ajustou ao conjunto A de dados, que não apresentou superdispersão. Para o conjunto B de dados, que apresentou superdispersão, o melhor modelo foi o binomial negativo, e para o conjunto C de dados, que também não apresentou superdispersão, o modelo Poisson ofereceu um bom ajuste / not available
|
4 |
Modelos paramétricos para séries temporais de contagem / Parametric models for count time seriesMilhorança, Igor André 14 May 2014 (has links)
Diversas situações práticas exigem a análise de series temporais de contagem, que podem apresentar tendência, sazonalidade e efeitos de variáveis explicativas. A motivação do nosso trabalho é a análise de internações diárias por doenças respiratórias para pessoas com mais que 65 anos residentes no município de São Paulo. O efeito de variáveis climáticas e concentrações de poluentes foram incluídos nos modelos e foram usadas as funções seno e cosseno com periodicidade de um ano para explicar o padrão sazonal e obter os efeitos das variáveis climáticas e poluentes controlando essa sazonalidade. Outro aspecto a ser considerado é a inclusão da população nas análises de modo que a interpretação dos efeitos seja para as taxas diárias de internações. Diferentes modelos paramétricos foram propostos para as internações. O mais simples é o modelo de regressão linear para o logaritmo das taxas. Foram ajustados os modelos lineares generalizados (MLG) para as internações com função de ligação logaritmo e com a população como offset, por este modelo permitir o uso das distribuições Poisson e Binomial Negativa, usadas para dados de contagem. Devido à heteroscedasticidade extra, foram propostos modelos GAMLSS incluindo variáveis para explicar o desvio padrão. Foram ajustados modelos ARMA e GARMA, por incluírem uma estrutura de correlação serial. O objetivo desse trabalho é comparar as estimativas, os erros padrões, a cobertura dos intervalos de confiança e o erro quadrático médio para o valor predito segundo os vários modelos e a escolha do modelo mais apropriado, que depende da completa análise de resíduos, geralmente omitida na literatura. O modelo GARMA com distribuição Binomial Negativa apresentou melhor ajuste, pois os erros parecem seguir a distribuição proposta e tem baixa autocorrelação, além de ter tido uma boa cobertura pelo intervalo de confiança e um baixo erro quadrático médio. Também foi analisado o efeito da autocorrelação dos dados nas estimativas nos vários modelos baseado em dados simulados. / Many practical situations require the analysis of time series of counts, which may present trend, seasonality and effects of covariates. The motivation of this work is the analysis of daily hospital admissions for respiratory diseases in people over 65 living in the city of São Paulo. The effect of climatic variables and concentrations of pollutants were included in the models and the sine and cosine functions with annual period were included to explain the seasonal pattern and obtain the effects of pollutants and climatic variables partially controlled by this seasonality. Another aspect to be considered is the inclusion of the population in the analys es in order to interpret the effects based on daily hospitalization rates . Different parametric models have been proposed for hospitalizations. The simplest is the linear regression model for the logarithm of the hospitalization rate. The generalized linear models (GLM) were adjusted for daily admissions with logarithmic link function and the population as offset to consider the Poisson and Negative Binomial distributions for counting data. Due to the extra heteroscedasticity, GAMLSS models were proposed including variables to explain the standard error. Moreover, the ARMA and GARMA models were fitted to include the serial correlation structure. The aim of this work is to compare estimates, standard errors, coverage of confidence intervals and mean squared error of predicted value for the various models and choose the most appropriate model, which depends on a complete analysis of residuals, usually omitted in the literature. The GARMA model with Negative Binomial distribution was the best fit since the errors seem to follow the proposed distribution and they have small values of autocorrelation. Besides, this model had low mean squared error and a good coverage of confidence interval. The effect of autocorrelation of data in the estimates was also analyzed in the setting of several models based on simulated data.
|
5 |
Modelos paramétricos para séries temporais de contagem / Parametric models for count time seriesIgor André Milhorança 14 May 2014 (has links)
Diversas situações práticas exigem a análise de series temporais de contagem, que podem apresentar tendência, sazonalidade e efeitos de variáveis explicativas. A motivação do nosso trabalho é a análise de internações diárias por doenças respiratórias para pessoas com mais que 65 anos residentes no município de São Paulo. O efeito de variáveis climáticas e concentrações de poluentes foram incluídos nos modelos e foram usadas as funções seno e cosseno com periodicidade de um ano para explicar o padrão sazonal e obter os efeitos das variáveis climáticas e poluentes controlando essa sazonalidade. Outro aspecto a ser considerado é a inclusão da população nas análises de modo que a interpretação dos efeitos seja para as taxas diárias de internações. Diferentes modelos paramétricos foram propostos para as internações. O mais simples é o modelo de regressão linear para o logaritmo das taxas. Foram ajustados os modelos lineares generalizados (MLG) para as internações com função de ligação logaritmo e com a população como offset, por este modelo permitir o uso das distribuições Poisson e Binomial Negativa, usadas para dados de contagem. Devido à heteroscedasticidade extra, foram propostos modelos GAMLSS incluindo variáveis para explicar o desvio padrão. Foram ajustados modelos ARMA e GARMA, por incluírem uma estrutura de correlação serial. O objetivo desse trabalho é comparar as estimativas, os erros padrões, a cobertura dos intervalos de confiança e o erro quadrático médio para o valor predito segundo os vários modelos e a escolha do modelo mais apropriado, que depende da completa análise de resíduos, geralmente omitida na literatura. O modelo GARMA com distribuição Binomial Negativa apresentou melhor ajuste, pois os erros parecem seguir a distribuição proposta e tem baixa autocorrelação, além de ter tido uma boa cobertura pelo intervalo de confiança e um baixo erro quadrático médio. Também foi analisado o efeito da autocorrelação dos dados nas estimativas nos vários modelos baseado em dados simulados. / Many practical situations require the analysis of time series of counts, which may present trend, seasonality and effects of covariates. The motivation of this work is the analysis of daily hospital admissions for respiratory diseases in people over 65 living in the city of São Paulo. The effect of climatic variables and concentrations of pollutants were included in the models and the sine and cosine functions with annual period were included to explain the seasonal pattern and obtain the effects of pollutants and climatic variables partially controlled by this seasonality. Another aspect to be considered is the inclusion of the population in the analys es in order to interpret the effects based on daily hospitalization rates . Different parametric models have been proposed for hospitalizations. The simplest is the linear regression model for the logarithm of the hospitalization rate. The generalized linear models (GLM) were adjusted for daily admissions with logarithmic link function and the population as offset to consider the Poisson and Negative Binomial distributions for counting data. Due to the extra heteroscedasticity, GAMLSS models were proposed including variables to explain the standard error. Moreover, the ARMA and GARMA models were fitted to include the serial correlation structure. The aim of this work is to compare estimates, standard errors, coverage of confidence intervals and mean squared error of predicted value for the various models and choose the most appropriate model, which depends on a complete analysis of residuals, usually omitted in the literature. The GARMA model with Negative Binomial distribution was the best fit since the errors seem to follow the proposed distribution and they have small values of autocorrelation. Besides, this model had low mean squared error and a good coverage of confidence interval. The effect of autocorrelation of data in the estimates was also analyzed in the setting of several models based on simulated data.
|
6 |
Identificação e caracterização espectral da ferrugem (Austropuccinia psidii) do eucalipto por imagens de alta resolução obtidas de veículos aéreos não tripulados (vant) e em laboratório (espectroradiômetro) / Identification and spectral characterization of eucalyptus rust (Austropuccinia psidii) by high resolution images obtained from unmanned aerial vehicles (vant) and laboratory (spectroradiometer)Jim, André Stefanini [UNESP] 15 May 2018 (has links)
Submitted by ANDRE STEFANINI JIM (andre_sjim@yahoo.com.br) on 2018-09-18T19:48:38Z
No. of bitstreams: 1
ANDRE_JIM-ENTREGA-SET2018 Repositório.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5) / Approved for entry into archive by Maria Lucia Martins Frederico null (mlucia@fca.unesp.br) on 2018-09-19T11:38:13Z (GMT) No. of bitstreams: 1
stefanini_aj_dr_botfca.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5) / Made available in DSpace on 2018-09-19T11:38:13Z (GMT). No. of bitstreams: 1
stefanini_aj_dr_botfca.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5)
Previous issue date: 2018-05-15 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Plantios de eucalipto podem sofrer reduções na produção de até 48% devido à ferrugem das mirtáceas causada por Autropuccinia psidii. A identificação e quantificação da doença, ou fitopatometria, e o diagnóstico precoce de doenças é fator chave no manejo florestal. Em campo, o levantamento é realizado por amostragens, que alcançam apenas 5% da área total plantada e são realizadas por equipes de avaliadores por meio do uso de escalas diagramáticas. O uso do SIG na silvicultura tem sido bem-sucedido na detecção de diversos fatores considerados favoráveis às doenças. O termo Silvicultura de Precisão consiste na adoção de ferramentas de sensoriamento remoto embarcadas em distintas plataformas juntamente com sistemas computacionais para o processamento das múltiplas informações. Dentro do campo de sensores, uma plataforma alternativa para o diagnóstico é o emprego de VANTs (Veículos Aéreos Não Tripulados) com câmeras digitais de alta resolução espacial (pixels/cm²), apresentando diversas vantagens em relação aos dados advindos de satélites. Enquanto as informações espectrais coletadas por VANTs são misturas espectrais de dosséis, o espectroradiômetro pode coletar informações de objetos, ao nível de folha, sendo assim uma importante ferramenta para comparação de resultados de análises. Diante da necessidade de se criar uma metodologia para identificação e diagnóstico de doenças em florestas, o objetivo deste trabalho foi o de associar as informações espectrais aos procedimentos estatísticos multivariados, técnicas de regressão logística e bootstrap, de modo a obter modelos de classificação consistentes quanto à identificação e separação dos níveis de severidade para a ocorrência da ferrugem das mirtáceas em plantios jovens de eucalipto. Os resultados demonstraram que a regressão logística associada à função linear discriminante alcançaram as melhores taxas de acerto para dados de laboratório (espectroradiômetro), ao passo que a análise multivariada (por componentes principais) associada à função quadrática discriminante obtiveram as melhores taxas de acerto para dados de campo (VANT). O estudo permitiu concluir que as ferramentas empregadas foram adequadas para a diferenciação de plantas sadias de plantas infectadas por A. psiidi em plantios de Eucalyptus spp. Pôde-se concluir que o uso das imagens de VANT’s oferece uma análise preliminar ampla, possibilitando determinar áreas a receberem uma investigação mais detalhada, que eventualmente, pode ser via uso de espectroradiômetro. Quanto à caracterização do patógeno, observou-se que a técnica stepwise, coincidentemente, selecionou reflectâncias próximas à atividade das clorofilas a e b, excluindo a faixa espectral do verde. / Eucalyptus plantations may suffer reductions in yield of up to 48% due to myrtle rust caused by Autropuccinia psidii. The disease identification and quantification, or phytopatometry, and the early diagnosis are a key factor in forest management. In the field, the survey is carried out by samplings, which reach only 5% of the total planted area and are carried out by teams of raters through the use of diagrammatic scales. The GIS use in forestry has been used in detecting several factors considered favorable to diseases. The term Precision Forestry consists in the adoption of remote sensing tools embedded in different platforms with computational systems for the processing of the multiple information. In terms of sensors, an alternative platform for early diagnosis is the use of UAVs equipped with high spatial resolution digital cameras (pixels / cm²), presenting several advantages compared to the satellite's data. While the spectral information collected by VANTs are canopies spectral mixtures, the spectroradiometer can collect information from objects at the leaf level and thus is an important tool for comparing results analysis. The need to create a methodology for early identification and diagnosis of forest diseases, the aim of the present work was to associate spectral information with multivariate statistical procedures, logistic regression techniques, and bootstrap, in order to obtain consistent classification models, identification of severity levels of myrtle rust in young eucalyptus plantations. The results showed that the logistic regression associated with the linear discriminant function achieved the best hit rates for laboratory data (spectroradiometer), while the multivariate analysis (by main components) associated with the discriminant quadratic function obtained the best data set rates field (UAV). We could conclude that the tools used were adequate for the differentiation of healthy plants of plants infected by A. psidii in plantations of Eucalyptus spp. It was concluded that the use of VANT's images offers a preliminary extensive analysis, making it possible to determine areas to receive a more detailed investigation, which may be via the use of a spectroradiometer. As for the characterization of the pathogen, it was observed that the stepwise technique, coincidentally, selected reflectances close to the activity of chlorophyll a and b, excluding the spectral range of green.
|
7 |
Fator de correção para a distribuição da Deviance para dados de proporções / not availableAna Paula Gomes da Silva Gimenes 27 September 2000 (has links)
A análise de dados de proporções apresenta, em geral, certas dificuldades uma vez que a distribuição subjacente a tais dados pode ser considerada binomial, que não segue as pressuposições básicas para o ajuste de um modelo matemático. Algumas transformações são sugeridas, mas nem sempre bons resultados são obtidos. No enfoque de modelos lineares generalizados, a estatística que mede a qualidade do ajuste do modelo para os dados é chamada deviance. Ocorre que a distribuição da deviance é desconhecida. No entanto, para dados com distribuição binomial, pode-se aproximar a distribuição da deviance por uma distribuição qui-quadrado, mas tal aproximação não é boa para tamanhos pequenos de amostra. Para melhorar essa aproximação, alguns fatores de correção para os dados são sugeridos, mas os resultados obtidos ainda não são bons para pequenas amostras. Assim, o objetivo deste trabalho é propor um novo fator de correção para os dados seguindo uma distribuição binomial, de modo a se obter uma melhora na distribuição da deviance para qualquer tamanho de amostra. Para isto, adiciona-se uma constante à variável resposta e, através do valor esperado da deviance, calcula-se tal constante de modo a reduzir o erro cometido na aproximação. Simulações da distribuição binomial e o cálculo da deviance são feitos e QQ-plots são utilizados para a comparação com a distribuição qui-quadrado / not available
|
8 |
Modelos lineares generalizados simétricos heteroscedásticosLídia Coco Terra, Maria 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T18:02:18Z (GMT). No. of bitstreams: 2
arquivo3859_1.pdf: 757592 bytes, checksum: 0ba2d758f01c98e407e2285f4bbd4c99 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A classe de modelos lineares generalizados simétricos heteroscedásticos é caracterizada pela
resposta pertencente à classe simétrica de distribuições, um preditor linear relacionado com o
parâmetro de posição e um preditor linear relacionado com o parâmetro de escala, ambos relacionado
através de funções de ligação. Estes modelos são uma extensão natural dos modelos
lineares generalizados simétricos (MLGS) proposta por Lobos (2004), em que apenas o parâmetro
de posição é relacionado por um preditor linear através de uma função de ligação duplamente
diferenciável. Neste trabalho, inicialmente, apresentamos alguns resultados nos MLGS heteroscedásticos.
Em seguida, testes assintóticos para avaliar homoscedasticidade são propostos bem
como métodos de diagnósticos sob o enfoque de influência local. Alguns exemplos com dados
reais serão discutidos a fim de ilustrar a teoria desenvolvida
|
9 |
Estimativa do custo da colheita mecanizada de cana-de-açúcar utilizando modelos de regressão / Estimated cost of mechanized harvesting of sugarcane using regression modelsMaekawa, Eduardo Shigueiti 22 August 2016 (has links)
A colheita mecanizada é uma das mais significativas e onerosas operações do processo de produção de cana-de-açúcar, tornando-se importante o entendimento das relações que envolvem o seu custo. Atualmente, as metodologias para estimar o custo da colheita partem do conceito de custo fixo e variável. No entanto, considerando a complexidade desse processo, faz-se necessário avaliar métodos capazes de relacionar os parâmetros operacionais com o custo final. Neste contexto, a modelagem estatística por meio da regressão permite tratar tais relações e prever tendências. O objetivo deste trabalho foi desenvolver um modelo empírico para o cálculo do custo da colheita mecanizada de cana-de-açúcar. Desenvolveu-se um modelo linear generalizado (MLG) e um modelo linear generalizado misto (MLGM) ambos com distribuição gama, utilizando indicadores operacionais e dados de custo de 20 usinas do setor sucroalcooleiro. Por meio do MLGM, obteve-se uma aderência satisfatória quando comparado aos modelos MLG, nulo (média) e linear (supondo normalidade). Os indicadores que explicaram o custo foram: produtividade (t maq-1), consumo (l t-1), horímetro (h) e número de operadores por colhedora (nop). / The mechanized harvesting of sugarcane is one of the most significant and costly operations of the production process, thus it is important to understand the relationships involving its cost. Currently, methods to estimate these costs rise from the concept of fixed and variable cost. However, considering the complexity of the harvesting process, it is necessary to evaluate techniques to relate the operating parameters with the final cost. In this context, statistical modeling by regression allows to treat such relationship and predict trends. The objective of this study was to develop an empirical model to calculate the cost of mechanical harvesting of sugarcane. A generalized linear model (GLM) and a generalized linear mixed model (GLMM) both with gamma distribution was developed using operational indicators and cost data from 20 plants in the sugarcane industry. Through the GLMM, satisfactory adhesion was obtained when compared to the GLM, null model (average) and linear (assuming normality). The indicators that explained the cost were: productivity (t mach-1), consumption (l t-1), hourmeter (h) and number of operators per harvester (nop).
|
10 |
Estimativa do custo da colheita mecanizada de cana-de-açúcar utilizando modelos de regressão / Estimated cost of mechanized harvesting of sugarcane using regression modelsEduardo Shigueiti Maekawa 22 August 2016 (has links)
A colheita mecanizada é uma das mais significativas e onerosas operações do processo de produção de cana-de-açúcar, tornando-se importante o entendimento das relações que envolvem o seu custo. Atualmente, as metodologias para estimar o custo da colheita partem do conceito de custo fixo e variável. No entanto, considerando a complexidade desse processo, faz-se necessário avaliar métodos capazes de relacionar os parâmetros operacionais com o custo final. Neste contexto, a modelagem estatística por meio da regressão permite tratar tais relações e prever tendências. O objetivo deste trabalho foi desenvolver um modelo empírico para o cálculo do custo da colheita mecanizada de cana-de-açúcar. Desenvolveu-se um modelo linear generalizado (MLG) e um modelo linear generalizado misto (MLGM) ambos com distribuição gama, utilizando indicadores operacionais e dados de custo de 20 usinas do setor sucroalcooleiro. Por meio do MLGM, obteve-se uma aderência satisfatória quando comparado aos modelos MLG, nulo (média) e linear (supondo normalidade). Os indicadores que explicaram o custo foram: produtividade (t maq-1), consumo (l t-1), horímetro (h) e número de operadores por colhedora (nop). / The mechanized harvesting of sugarcane is one of the most significant and costly operations of the production process, thus it is important to understand the relationships involving its cost. Currently, methods to estimate these costs rise from the concept of fixed and variable cost. However, considering the complexity of the harvesting process, it is necessary to evaluate techniques to relate the operating parameters with the final cost. In this context, statistical modeling by regression allows to treat such relationship and predict trends. The objective of this study was to develop an empirical model to calculate the cost of mechanical harvesting of sugarcane. A generalized linear model (GLM) and a generalized linear mixed model (GLMM) both with gamma distribution was developed using operational indicators and cost data from 20 plants in the sugarcane industry. Through the GLMM, satisfactory adhesion was obtained when compared to the GLM, null model (average) and linear (assuming normality). The indicators that explained the cost were: productivity (t mach-1), consumption (l t-1), hourmeter (h) and number of operators per harvester (nop).
|
Page generated in 0.1086 seconds