41 |
Métodos de estimação em regressão logística com efeito aleatório: aplicação em germinação de sementes / Estimation methods in logistic regression with random effects: application in seed germinationAraujo, Gemma Lucia Duboc de 01 February 2012 (has links)
Made available in DSpace on 2015-03-26T13:32:15Z (GMT). No. of bitstreams: 1
texto completo.pdf: 1213757 bytes, checksum: a4899ab14bd6c737501e8ef972e42d9e (MD5)
Previous issue date: 2012-02-01 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In logistic mixed models with random effect on intercept allows capturing the effects of sources of variation from the particular characteristics of a group (heterogeneity),
deflating the pure error and causing a fluctuation in the model intercept. This inclusion brings complexity in estimation methods and also changes the interpretation of the
parameters that, originally given by the odds ratio, is then seen from the median odds ratio. The estimation parameters of a mixed model can be made by many different methods with varying performance, as the Laplace s approximation method, maximum likelihood (ML) and restricted maximum likelihood (REML). The objective of this work was to verify in logistic mixed models with random effects on intercept the
consequences in interpretation of parameters, in quality of experiment and in classification of treatment via the median odds ratio, and verify the performance of the estimation methods above cited. The analyzes were performed under simulation and after in set of real data from seeds germination experiment of physic nut (Jatropha curcas L.). Considering the logistic mixed model with random effects on intercept, it
was verified that the REML estimation method performed better and that the variance of the random effect affects the performance of any of these methods being evaluated
inversely proportional. We suggest further studies to determine more properly the influence of the inflexion points and the effective median level in performance methods. In the experiment to evaluate the seeds germination of physic nut involving roll paper, on paper, on sand and between sand substrates, the inclusion of random effects in logistic model showed considerable heterogeneity in seeds germination in different units of the same substrate. The median odds ratio showed the superiority of the substrate between sand over on paper in seeds germination of physic nut, result similar to that obtained by the Tukey s test. / Em modelos de regressão logística a inclusão do efeito aleatório no intercepto permite capturar os efeitos de fontes de variação provenientes das características particulares de
um grupo (heterogeneidade), desinflacionando o erro puro e provocando uma flutuação no intercepto do modelo. Esta inclusão traz complexidade nos métodos de estimação e
também muda a interpretação dos parâmetros que, dada originalmente pela razão de chances, passa a ser vista sob o enfoque da razão de chances mediana. A estimação dos
parâmetros de um modelo misto pode ser feita por muitos métodos diferentes com desempenho variado, como o método da aproximação de Laplace, da máxima verossimilhança (ML) e da máxima verossimilhança restrita (REML). Assim, o objetivo
deste trabalho foi verificar em modelos de regressão logística com efeito aleatório no intercepto as consequências na interpretação dos parâmetros, na qualidade de um experimento e na classificação de tratamentos via razão de chances mediana, e verificar o desempenho dos métodos de estimação acima citados. As análises foram feitas sob simulação e posteriormente num conjunto de dados reais de um experimento com germinação de sementes de pinhão-manso (Jatropha curcas L.). Considerando o modelo de regressão logística com efeito aleatório no intercepto, verificou-se que o
método de estimação REML apresentou melhor desempenho e que a variância do efeito aleatório afeta o desempenho de qualquer um dos métodos avaliados sendo estes inversamente proporcionais. Sugerem-se novos estudos para determinar com mais propriedade a influência dos pontos de estabilização e do nível mediano de efetividade na eficiência dos métodos. No experimento de avaliação de germinação de sementes de
pinhão-manso envolvendo os substratos rolo de papel, sobre papel, sobre areia e entre areia, a inclusão do efeito aleatório no modelo logístico apontou considerável heterogeneidade na germinação de sementes em unidades diferentes de um mesmo
substrato. A razão de chances mediana apontou a superioridade do substrato entre areia em relação a sobre papel na germinação de sementes de pinhão-manso, resultado
semelhante ao obtido pelo teste de Tukey.
|
42 |
Análise comparativa de algoritmos de classificação digital não-supervisionada, no mapeamento do uso e cobertura do solo / not availableMatsukuma, Ciro Koiti 24 April 2002 (has links)
O objetivo deste trabalho foi comparar as classificações obtidas por meio de algoritmos de classificação não supervisionada e supervisionada, aplicados a uma região com paisagem complexa, dentro da bacia do rio Corumbataí, SP. Foram utilizados os algoritmos de Máxima Verossimilhança, no software ENVI, e CLUSTER, o ISOCLUST e o MAXSET no software Idrisi o. A imagem multiespectral utilizada foi do satélite SPOT. A área de estudo abrangeu os municípios de Piracicaba, Rio Claro, Itirapina, Analândia, Corumbataí, Charqueada e Ipeúna. Foram observadas várias categorias e classificadas, dentre elas, as seguintes: cana-de-açúcar, pasto, vegetação nativa, solo exposto, reflorestamento e área urbana. Após o reconhecimento em campo das categorias, procedeu-se à classificação utilizando-se os algoritmos Foram observadas várias categorias e classificadas, dentre elas, as seguintes: cana-de-açúcar, pasto, vegetação nativa, solo exposto, reflorestamento e área urbana. Após o reconhecimento em campo das categorias, procedeu-se à classificação utilizando-se os algoritmos CLUSTER, ISOCLUST E MAXSET, dos quais o que apresentou melhores resultados foi o ISOCLUST, sendo, portanto, o mais recomendado para utilização por ser eficiente e demandar menor tempo para obter-se a classificação final da vegetação / not available
|
43 |
Dinâmica da diversidade de florestas manejadas através da abordagem de ajuste e seleção de modelos para distribuição de abundância entre espécies / Temporal dynamics of tree diversity in the context of forest management, using species abundance distribution modelsNaves, Rafaela Pereira 31 October 2017 (has links)
As florestas na Amazônia tem sido exploradas para a provisão de madeira. A exploração era feita sem planejamento das atividades (Exploração Convencional ou EC), resultando em grandes áreas de florestas degradadas. A partir da década de 90, foram estabelecidas técnicas para minimizar os danos da exploração à vegetação remanescente, visando ciclos sequenciais de corte, sem prejuízo à produção, através da Exploração de Impacto Reduzido (EIR). Embora muito tenha sido discutido sobre o quão mais eficiente a EIR seja em relação a EC, ainda existem lacunas, principalmente acerca da organização e manutenção da diversidade dessas áreas. A exploração é, de maneira muito resumida, o corte de algumas árvores de interesse comercial e a morte acidental de outras árvores que não as de interesse, pela queda e arraste das toras, construção das estradas e dos pátios de estocagem. As clareiras formadas, em geral, são maiores que as que ocorrem naturalmente na floresta. Essas clareiras são ocupadas por espécies de rápido crescimento, potencialmente mudando a organização da comunidade. Assim, são necessárias abordagens para detectar e então caracterizar quais os impactos que a exploração tem na diversidade de comunidades arbóreas. É importante ressaltar que muitas decisões sobre a sustentabilidade do manejo são tomadas considerando como essas comunidades respondem a distúrbios. Diante do apresentado, esta tese teve como objetivo analisar a dinâmica da diversidade de florestas submetidas à exploração florestal. A distribuição de abundância entre espécies (DAE) é uma abordagem paramétrica para caracterização de comunidades, baseada em um dos poucos padrões que se mantem em todas as comunidades: muitas espécies raras e poucas espécies abundantes, sendo também o reflexo de como as espécies partilham recursos. Distúrbios mudam a identidade das espécies dominantes, podendo ser refletido em alterações nos parâmetros e/ou curvas da DAE. Nós analisamos a DAE de áreas submetidas ao manejo florestal (EIR e EC) e uma área Controle, antes do manejo e ao longo de 16 anos em Paragominas, Pará, Brasil. Antes da exploração, em 1993, foram estabelecidas três parcelas permanentes, onde os indivíduos arbóreos com DAP ≥ 25 cm foram cadastrados. Indivíduos menores (DAP ≥ 10 cm) foram mensurados em sub-parcelas. Após essa primeira medição, foi conduzida exploração em duas parcelas (EIR e EC) e a terceira parcela foi mantida como Controle. As parcelas foram medidas novamente em 1994, 1998, 2000, 2006 e 2009. Para testar se a DAE muda devido ao manejo, usamos a distribuição Poisson Lognormal (PLN) para descrever cada ano e cada tratamento. Para detectar mudanças na similaridade, em termos de composição de espécies e abundância relativa de cada espécie, nós usamos o parâmetro de correlação da PLN bivariada para comparar a comunidade antes da exploração com os outros anos. Ao contrário do esperado, não foram encontradas mudanças estatisticamente relevantes nos parâmetros da DAE ao longo do tempo em nenhum dos três tratamentos. Entretanto o parâmetro de correlação diminui para a comunidade com o menor critério de inclusão de DAP, nas últimas medições das áreas exploradas. Nós também analisamos a DAE dessas mesmas áreas considerando como medida de abundância a área basal de cada espécie. Não foram encontradas mudanças relvantes na DAE, apenas diminuição do parâmetro de correlação. Embora o manejo tenha resultado na diminuição de até 22% dos indivíduos e 27% da área basal, ele não é imediatamente detectado na DAE pois as mortes acidentais são a maioria no manejo. Para cada árvore explorada, em média 19 árvores com DAP ≥ 10 cm são mortas acidentalmente. Essa morte acidental é de certa forma independente da espécie, assim todas as espécies tem suas abundâncias diminuídas. A distribuição PLN considera os efeitos da amostragem através do processo Poisson, então mesmo que a porcentagem de indivíduos mortos fosse maior, dificilmente seria detectável na DAE. No entanto, a diminuição do parâmetro de correlação ao longo do tempo nas áreas exploradas é devido ao aumento da abundância e da área basal de espécies de rápido crescimento como as do gênero Cecropia. A DAE da Ilha de Barro Colorado (BCI), Panamá, também foi analisada (28 anos de medições, DAP ≥ 1 cm). Nós dividimos o conjunto de dados em quatro critérios de inclusão de DAP (1, 10, 25 e 45 cm). Visto que a área não é submetida a grandes distúrbios e, como era esperado, não foram encontradas mudanças relevantes nem na DAE nem na identidade das espécies dominantes. Muitos indivíduos morreram durante esse período, devido a elevada mortalidade, comum para árvores pequenas (DAP < 10 cm), e outra grande parcela da comunidade não atingiu os critérios de DAP que geralmente são amostrados (10, 25 e 45 cm). Mesmo os indivíduos considerados ingressantes, de acordo com esses critérios, já estavam presentes na parcela na primeira medição, apenas eram menores que esses critérios. Diante do apresentado, um distúrbio pode demorar décadas para aparecer nas classes de DAP que geralmente são amostradas, por exemplo DAP ≥ 10 cm. Assim, reiteramos que efeito ou falta de efeito de distúrbios na diversidade de comunidades arbóreas deve ser interpretado com muita cautela. / Amazon tropical forests in Brazil have been exploited for the provisioning of timber, mainly using conventional logging (CL) practices. Little operational planning has been considered and, as a result, large forest areas in the Amazon have become highly degraded over time. Since the 1990\'s, reduced impact logging (RIL) has been adopted as a means of reducing the damage caused by timber exploitation and of establishing more sustainable practices, trying to make sequential logging cycles possible. Much has been discussed about the higher efficiency of RIL or CL, but there are still important knowledge gaps, mainly regarding tree diversity and forest functioning in logged areas. The logging of commercial species and the accidental death of non-targeted trees may alter environmental conditions, leading to higher abundance of some species and to the reduction of others, thus modifying forest structure and diversity. These changes promoted by exploitation have a signature in the structure of the remaining community and tracking them at the community level is still a great challenge, but important decisions are mainly taken considering tree diversity. The development of tools is crucial to quantify the effects of disturbance and to predict its consequence over communities. The main goal of this thesis was to analyze the temporal dynamics of tree diversity in the context of forest management. Species abundance distribution models (SAD) are a parametric approach, based on the most strong pattern in community ecology: few species have high abundance and rarity is the rule. It is also independent of sampling size and related to how species share resources. Species dominance change as a result of disturbances, and these changes may be detectable by changes on the parameters and/or curves of the SAD. We used inventory data from three permanent plots established in 1993 in Paragominas, Pará, Brazil. All the trees with Diameter at Breast Height (DBH) ≥ 25 cm were determined and measured and smaller individuals were measured within subplots (DBH ≥ 10 cm). After this first survey, we harvested two plots using different techniques (RIL and CL) and a third plot was kept as Control. The plots were surveyed again in 1994, 1998, 2000, 2006 and 2009. To test if it is possible to detect changes in the SAD due to logging we used the Poisson Lognormal distribution (PLN) to describe the data from each year. To detect changes in species similarity, we compared species composition and abundance over time, using the correlation parameter of the bivariate PLN. We compared the same plots in 1993 (before exploitation) and in the years that followed. We observed no relevant changes in SAD, but only small changes in the correlation parameter in the last surveys. We also analyzed species\' basal area distribution, and found no statistically relevant changes apart from small changes in the correlation parameter in harvested areas. After exploitation, we observed a reduction of as much as 22 % of the number of trees and 27% of the basal area, and mortality was mainly attributed to the accidental death of non-targeted trees. For each tree harvested, an average 19 trees died accidentally. Because of the dominant role of these random accidental deaths, the signature of management operations could not be detected immediately after logging, using SAD or the correlation parameter. Since SAD models consider sampling effects (Poisson process), any disturbance which causes the random death of trees may not be detected in the short run. However, the start of small changes could be noticed within a couple of decades. The relative abundance of some species has been altered in exploited forests, which was detected by changes in the correlation parameter. Pioneer species of the genus Cecropia have become the most abundant trees in the last survey, considering DBH ≥ 10 cm. We also evaluated species abundance distribution in the Barro Colorado Island, Panama (28 years, DBH ≥ 1 cm). We established four different inclusion criteria (DBH 1, 10, 25 and 45). The area was not subject to major disturbances and, as expected, we observed no relevant changes in the SAD during this period. A large number of individuals died during this period, due to the high mortality common to small trees (DBH ≥ 10 cm), and many others have not reached the used inclusion criteria (10, 25 and 45 cm). Using these inclusion criteria, we showed that the community recruited during this period was already present in the forest in the first survey, but those trees just did not reach the size to be measured. Therefore, a recent disturbance may take decades to be detected within the DBH classes usually sampled. We highlight the role of time scale in the interpretation of tree diversity dynamics.
|
44 |
Distribuições em série de potências modificadas inflacionadas e distribuição Weibull binominal negativa / Inflated modified power serie distribution and Weibull negative binomialRodrigues, Cristiane 03 June 2011 (has links)
Neste trabalho, alguns resultados, tais como, função geradora de momentos, relações de recorrência para os momentos e alguns teoremas da classe de distribuições em séries de potencias modificadas (MPSD) proposta por Gupta (1974) e da classe de distribuições em séries de potências modificadas inflacionadas (IMPSD) tanto em um ponto diferente de zero como no ponto zero são apresentados. Uma aplicação do Modelo Poisson padrão, do modelo binomial negativo padrão e dos modelos inflacionados de zeros para dados de contagem, ZIP e ZINB, utilizando-se as técnicas dos MLGs, foi realizada para dois conjuntos de dados reais juntamente com o gráfico normal de probabilidade com envelopes simulados. Também foi proposta a distribuição Weibull binomial negativa (WNB) que é bastante flexível em análise de dados positivos e foram estudadas algumas de suas propriedades matemáticas. Esta é uma importante alternativa para os modelos Weibull e Weibull geométrica, sub-modelos da WNB. A demostração de que a densidade da distribuição Weibull binomial negativa pode ser expressa como uma mistura de densidades Weibull é apresentada. Fornecem-se, também, seus momentos, função geradora de momentos, gráficos da assimetria e curtose, expressoes expl´citas para os desvios médios, curvas de Bonferroni e Lorenz, função quantílica, confiabilidade e entropia, a densidade da estat´stica de ordem e expressões explícita para os momentos da estatística de ordem. O método de máxima verossimilhança é usado para estimar os parametros do modelo. A matriz de informação esperada ´e derivada. A utilidade da distribuição WNB está ilustrada na an´alise de dois conjuntos de dados reais. / In this paper, some result such as moments generating function, recurrence relations for moments and some theorems of the class of modified power series distributions (MPSD) proposed by Gupta (1974) and of the class of inflated modified power series distributions (IMPSD) both at a different point of zero as the zero point are presented. The standard Poisson model, the standard negative binomial model and zero inflated models for count data, ZIP and ZINB, using the techniques of the GLMs, were used to analyse two real data sets together with the normal plot with simulated envelopes. The new distribution Weibull negative binomial (WNB) was proposed. Some mathematical properties of the WNB distribution which is quite flexible in analyzing positive data were studied. It is an important alternative model to the Weibull, and Weibull geometric distributions as they are sub-models of WNB. We demonstrate that the WNB density can be expressed as a mixture of Weibull densities. We provide their moments, moment generating function, plots of the skewness and kurtosis, explicit expressions for the mean deviations, Bonferroni and Lorenz curves, quantile function, reliability and entropy, the density of order statistics and explicit expressions for the moments of order statistics. The method of maximum likelihood is used for estimating the model parameters. The expected information matrix is derived. The usefulness of the new distribution is illustrated in two analysis of real data sets.
|
45 |
Seleção de covariáveis para modelos de sobrevivência via verossimilhança penalizada / Variable selection for survival models based on penalized likelihoodPinto Junior, Jony Arrais 18 February 2009 (has links)
A seleção de variáveis é uma importante fase para a construção de um modelo parcimonioso. Entretanto, as técnicas mais populares de seleção de variáveis, como, por exemplo, a seleção do melhor subconjunto de variáveis e o método stepwise, ignoram erros estocásticos inerentes à fase de seleção das variáveis. Neste trabalho, foram estudados procedimentos alternativos aos métodos mais populares para o modelo de riscos proporcionais de Cox e o modelo de Cox com fragilidade gama. Os métodos alternativos são baseados em verossimilhançaa penalizada e diferem dos métodos usuais de seleção de variáveis, pois têm como objetivo excluir do modelo variáveis não significantes estimando seus coeficientes como zero. O estimador resultante possui propriedades desejáveis com escolhas apropriadas de funções de penalidade e do parâmetro de suavização. A avaliação desses métodos foi realizada por meio de simulação e uma aplicação a um conjunto de dados reais foi considerada. / Variable selection is an important step when setting a parsimonious model. However, the most popular variable selection techniques, such as the best subset variable selection and the stepwise method, do not take into account inherent stochastic errors in the variable selection step. This work presents a study of alternative procedures to more popular methods for the Cox proportional hazards model and the frailty model. The alternative methods are based on penalized likelihood and differ from the usual variable selection methods, since their objective is to exclude from the model non significant variables, estimating their coefficient as zero. The resulting estimator has nice properties with appropriate choices of penalty functions and the tuning parameter. The assessment of these methods was studied through simulations, and an application to a real data set was considered.
|
46 |
Análise de variância multivariada nas estimativas dos parâmetros do modelo log-logístico para susceptibilidade do capim-pé-de-galinha ao glyphosate / Multivariate analysis of variance in the estimates of the log-losgstic model parameters for susceptibility of grass chicken feet to glyphosateJotta, César Augusto Degiato 25 October 2016 (has links)
O cenário agrícola nacional tem se tornado cada vez mais competitivo ao longo dos anos, manter o crescimento da produtividade a um baixo custo operacional e com baixo impacto ambiental tem sido os três ingredientes de maior relevância na área. A produtividade por sua vez, é função de várias variáveis, sendo o controle de plantas daninhas uma dessas variáveis a ser considerada. Nesse trabalho é analisado um conjunto de dados de um experimento realizado no departamento de Produção Vegetal da ESALQ-USP, Piracicaba - SP. Foram avaliadas 4 biótipos de capim-pé-de-galinha provenientes de três estados brasileiros e em três estágios morfológicos com 4 repetições para cada biótipo, a variável resposta utilizada foi massa seca (g) e como variável regressora foi utilizada a dose de glyphosate nas concentrações variando de 1/16 D a 16 D mais a testemunha, sem aplicação de herbicida, em que D varia de 480 gramas de equivalente ácido de glyphosate por hectare (g .e a. ha-1) para o estágio de 2 a 3 perfilhos, 720 (g .e a. ha-1) para o estágio de 6 a 8 perfilhos e de 960 para o estágio de 10-12 perfilhos. O trabalho teve como objetivo primário avaliar se, ao longo dos anos, as populações de capim-pé-de-galinha tem se tornado resistentes ao herbicida glyphosate, visando detecção de biótipos resistentes. O experimento foi instalado segundo o delineamento inteiramente aleatorizado, sendo feito em três estágios diferentes. Para a análise dos dados foi utilizado o modelo não-linear log-logístico proposto em Knezevic, S. e Ritz (2007) como método univariado, foi utilizado ainda o método da máxima verossimilhança para verificar a igualdade do parâmetro e. O modelo utilizado convergiu para quase todas as repetições, mas não houve um comportamento sistemático observado que explicasse a não convergência de uma repetição em particular. Num segundo momento, as estimativas dos três parâmetros do modelo foram tomadas como variáveis dependentes em uma análise de variância multivariada. Observando que as três, conjuntamente, foram significativas pelos testes de Pillai, Wilks, Roy e Hotelling-Lawley, foi realizado o teste de Tukey para o mesmo parâmetro e comparado com o primeiro método utilizado. Esse procedimento apresentou, com o mesmo coeficiente de significância, menor capacidade de identificar diferença entre as médias dos parâmetros das variedades de capim do que o método proposto por Regazzi (2015). / The national agricultural scenery has become increasingly competitive over the years, maintaining productivity growth at a low operating cost and low environmental impact has been the three most important ingredients in the area. Productivity in turn is a function of several variables, and the weed control is one of these variables to be considered. In this work it is analyzed a dataset of an experiment conducted in the Plant Production Department of ESALQ-USP, Piracicaba - SP. Were evaluated 4 grass chicken\'s feet biotypes from three Brazilian states in three morphological stages with 4 repetitions for each biotype, the response variable used was dry mass (g) and as regressor variable were used the dose of glyphosate in concentrations ranging from 1/16 D to 16 D plus the control without herbicide, wherein D ranges from 480 grams of glyphosate acid equivalent per hectare (g .e a. ha-1) for 2 to 3 stage tillers, 720 grams of glyphosate acid equivalent per hectare (g .e a. ha-1) for 6 to 8 tillers and 960 for stage 10-12 tillers. The work had as main objective to evaluate , if over the years, populations of grass chicken\'s feet has become resistant to glyphosate, aiming detection of resistant biotypes. The experiment was conducted under completely randomized design being done in three stages. For data analysis was used the non-linear log-logistic proposed in Knezevic, S. e Ritz (2007) as univariate method, it was still used the maximum likelihood method to verify the equality of the parameter e. The model converged to almost all repetitions, but there was an observed systematic behavior to explain the non-convergence of a particular repetition. Secondly, estimates of the three model parameters were taken as dependent variables in a multivariate analysis of variance. Noting that all three together, were significant by Pillai, Wilks, Roy and Hotelling-Lawley tests, was performed Tukey test for the same parameter e and compared with the first method. This procedure presented, with the same coefficient of significance, less able to identify differences between the means of the parameters of grass varieties than the method proposed by Regazzi (2015).
|
47 |
Modelo autologístico no estudo de padrões espaciais em doenças de citros / Autologistic model in the study of spatial patterns in citrus diseasesFranciscon, Luziane 03 September 2008 (has links)
A citricultura é uma das principais atividades agrícolas do Brasil e o estado de São Paulo concentra a maior área produtora de laranjas do mundo. O conhecimento de padrões da incidência de doenças cítricas no tempo e no espaço é relevante para o setor e permite a descrição da dinâmica dessas doenças, podendo indicar estratégias para controle de epidemias. Neste trabalho são consideradas duas doenças que afetam a cultura de citros, a leprose e a morte súbita dos citros utilizando dados provenientes do monitoramento de talhões. Um aspecto relevante para estudos de doenças como a leprose dos citros, considerada uma grave virose na citricultura brasileira, é a investigação do padrão espacial e dos efeitos temporais da sua incidência dentro do talhão. Métodos exploratórios para determinar se o padrão espacial é ou não agregado são frequentemente utilizados. Entretanto é possível explorar e descrever os dados adotando um modelo explícito, permitindo discriminar e quantificar os efeitos através de parâmetros para co-variáveis que representam os aspectos de interesse. Uma das alternativas é a adoção de modelos autologísticos, que estendem o modelo de regressão logística para acomodar efeitos espaciais. Para implementar esse modelo é necessário que se reuse os dados para extrair co-variáveis espaciais, o que requer extensões na metodologia e algoritmos para avaliar adequadamente a variância das estimativas. Neste trabalho utiliza-se o modelo autologístico na análise de dados de incidência de doenças em plantas cítricas coletados em pontos referenciados no espaço e no tempo em um talhão. é mostrado como o modelo autologístico é apropriado para investigar doenças desse tipo, bem como é feita uma descrição do modelo e dos aspectos computacionais necessários para a estimação do modelo. São abordados métodos de seleção e avaliação de modelos autologísticos que relacionam fatores que afetam a disseminação da doença com padrões espaciais e efeitos temporais. Desta forma é possível realizar avaliações objetivas dos efeitos dos fatores considerados sobre a incidência da doença através dos parâmetros estimados do modelo proposto e quantificar o efeito da presença da doença em diferentes estruturas de vizinhança. A modelagem dos dados identificou dependência espacial entre as plantas e o modelo adotado permitiu quantificar as variações na probabilidade de doença em função do status das plantas na vizinhança. A metodologia apresentada aqui não se restringe a cultura de citros pode ser usada na avaliação de padrões espaço-temporais e efeitos de fatores que afetem doenças de plantas em condições semelhantes. / The citrus industry is a major agricultural activity in Brazil and the state of Sao Paulo concentrates the largest production area of oranges in the world. The knowledge of incidence patterns of citrus diseases in time and space is relevant to the industry and allows the description of the dynamics of these diseases and may indicate strategies for epidemics control. In this work are considered two diseases that affect the cultivation of citrus, leprosis and citrus sudden death using data from the tracking of stands. An important point when studying diseases such as the citrus leprosis, considered a serious viral disease in the Brazilian citrus industry, is the investigation of the spatial pattern and temporal effects of the disease incidence within a stand. Exploratory methods to determine if the spatial pattern is or not added are frequently used. However it is possible to explore and describe the data adopting an explicit model, allowing to discriminate and quantify the effects through parameters for covariates that represent aspects of interest. To implement this model is necessary to reuse the data in order to extract spatial covariates, which requires extensions in the methodology and algorithms to assess properly the variance of estimates. In this work, the autologistic model is used in the analysis of diseases incidence data in citrus plants collected in points referenced in space and time in a stand. It is shown how the autologistic model is appropriate to investigate such diseases, and there is a description of the model and computational aspects needed to estimate the model. Thus it is possible to achieve objective assessments of the effects of the factors considered on the incidence of the disease through the estimated parameters of the proposed model and quantify the disease presence effects in different neighborhood structures. The modeling of the data has identified a spatial dependence between the plants and the adopted model allowed to quantify the changes in the probability of disease according to the status of the plants in the neighbourhood. The methodology presented here is not restricted to the cultivation of citrus. It can be used in the assessment of spatial-temporal patterns and effects of factors that affect the diseases in plants under similar conditions.
|
48 |
Exploração de espaços de parâmetros de modelos biológicos sob diferentes paradigmas estatísticos / Parameter space exploration of biological models under different statistical paradigmsOliveira, Andre Chalom Machado de 02 September 2015 (has links)
A formulação e o uso de modelos matemáticos complexos têm recebido grande atenção no estudo da ecologia nos últimos anos. Questões relacionadas à exploração de espaços de parâmetros destes modelos - executada de forma eficiente, sistemática e à prova de erros - são de grande importância para melhor compreender, avaliar a confiabilidade e interpretar o resultado destes modelos. Neste trabalho, apresentamos uma investigação de métodos existentes para responder as questões relevantes da área, com ênfase na técnica conhecida como Hipercubo Latino e com foco na análise quantitativa dos resultados, e realizamos a comparação entre resultados analíticos de incerteza e sensibilidade e resultados obtidos do Hipercubo. Ainda, examinamos a proposta de uma metodologia paralela baseada no paradigma estatístico da verossimilhança. O capítulo 1 introduz uma investigação a respeito dos conceitos históricos sobre a natureza da probabilidade, situando o conceito da verossimilhança como componente central da inferência estatística. O capítulo 2 (em inglês) traz uma revisão bibliográfica sobre o estado da arte em análises de incerteza e sensibilidade, apresentando dois exemplos de aplicação das técnicas descritas a problemas de crescimento populacional estruturado. O capítulo 3 examina a proposta de uma metodologia baseada na verossimilhança dos dados como uma abordagem integrativa entre a estimação de parâmetros e a análise de incerteza, apresentando resultados preliminares. Durante o progresso do presente trabalho, um pacote de funções na linguagem R foi desenvolvido para facilitar o emprego na prática das ferramentas teóricas expostas acima. Os apêndices deste texto trazem um tutorial e exemplos de uso deste pacote, pensado para ser ao mesmo tempo conveniente e de fácil extensão, e disponível livremente na internet, no endereço http://cran.r-project.org/web/packages/pse. / There is a growing trend in the use of mathematical modeling tools in the study of many areas of the biological sciences. The use of computer models in science is increasing, specially in fields where laboratory experiments are too complex or too costly, like ecology. Questions of efficient, systematic and error-proof exploration of parameter spaces are are of great importance to better understand, estimate confidences and make use of the output from these models. We present a survey of the proposed methods to answer these questions, with emphasis on the Latin Hypercube Sampling and focusing on quantitative analysis of the results. We also compare analytical results for sensitivity and uncertainty, where relevant, to LHS results. Finally, we examine the proposal of a methodology based on the likelihood statistical paradigm. Chapter 1 introduces a brief investigation about the historical views about the nature of probability, in order to situate the concept of likelihood as a central component in statistical inference. Chapter 2 (in English) shows a revision about the state-of-art uncertainty and sensitivity analyses, with a practical example of applying the described techniques to two models of structured population growth. Chapter 3 examines the proposal of a likelihood based approach as an integrative procedure between parameter value estimation and uncertainty analyses, with preliminary results. During the progress of this work, a package of R functions was developed to facilitate the real world use of the above theoretical tools. The appendices of this text bring a tutorial and examples of using this package, freely available on the Internet at http://cran.r-project.org/web/packages/pse.
|
49 |
Modelos de regressão log-gama generalizado com fração de cura / The generalized log-gama mixture model with covariatesRizzato, Fernanda Bührer 08 February 2007 (has links)
Neste trabalho considera-se uma reparametrização no modelo log-gama generalizado para a inclusão de dados com sobreviventes de longa duração. Os modelos tentam estimar separadamente os efeitos das covariáveis na aceleração ou desaceleração no tempo e na fração de sobreviventes que é a proporção da população para o qual o evento não ocorre. A função logística é usada para o modelo de regressão com fração de cura. Os parâmetros do modelo, serão estimados através do método de máxima verossimilhança. Alguns métodos de influência, como a influência local e a influência local total de um indivíduo, serão introduzidos, calculados, analisados e discutidos. Finalmente, um conjunto de dados médicos será analisado sob o modelo log-gama generalizado com fração de cura. Uma análise de resíduos será executada para verificar a qualidade de ajuste do modelo. / In this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.
|
50 |
Um estudo sobre estimação e predição em modelos geoestatísticos bivariados / A study on estimation and prediction in bivariate geostatistical modelsFonseca, Bruno Henrique Fernandes 05 March 2009 (has links)
Os modelos geoestatísticos bivariados denem funções aleatórias para dois processos estocásticos com localizações espaciais conhecidas. Pode-se adotar a suposição da existência de um campo aleatório gaussiano latente para cada variável aleatória. A suposição de gaussianidade do processo latente é conveniente para inferências sobre parâmetros do modelo e para obtenção de predições espaciais, uma vez que a distribuição de probabilidade conjunta para um conjunto de pontos do processo latente é também gaussiana. A matriz de covariância dessa distribuição deve ser positiva denida e possuir a estrutura de variabilidade espacial entre e dentre os atributos. Gelfand et al. (2004) e Diggle e Ribeiro Jr. (2007) propuseram estratégias para estruturar essa matriz, porém não existem muitos relatos sobre o uso e avaliações comparativas entre essas abordagens. Neste trabalho foi conduzido um estudo de simulação de modelos geoestatísticos bivariados em conjunto com estimação por máxima verossimilhança e krigagem ordinária, sob diferentes congurações amostrais de localizações espaciais. Também foram utilizados dados provenientes da análise de solo de uma propriedade agrícola com 51,8ha de área, onde foram amostradas 67 localizações georeferenciadas. Foram utilizados os valores mensurados de pH e da saturação por bases do solo, que foram submetidas à análise descritiva espacial, modelagens geoestatísticas univariadas, bivariadas e predições espaciais. Para vericar vantagens quanto à adoção de modelos univariados ou bivariados, a amostra da saturação por bases, que possui coleta mais dispendiosa, foi dividida em uma subamostra de modelagem e uma subamostra de controle. A primeira foi utilizada para fazer a modelagem geoestatística e a segunda foi utilizada para comparar as precisões das predições espaciais nas localizações omitidas no processo de modelagem. / Bivariate geostatistical models dene random functions for two stochastic processes with known spatial locations. Existence of a Gaussian random elds can be assumed for each latent random variable. This Gaussianity assumption for the latent process is a convenient one for the inferences on the model parameters and for spatial predictions once the joint distribution for a set of points is multivariate normal. The covariance matrix of this distribution should be positivede nite and to have the spatial variability structure between and among the attributes. Gelfand et al. (2004) and Diggle e Ribeiro Jr. (2007) suggested strategies for structuring this matrix, however there are few reports on comparing approaches. This work reports on a simulation study of bivariate models together with maximum likelihood estimators and spatial prediction under dierent sets of sampling locations space. Soil sample data from a eld with 51.8 hectares is also analyzed with the two soil attributes observed at 67 spatial locations. Data on pH and base saturation were submitted to spatial descriptive analysis, univariate and bivariate modeling and spatial prediction. To check for advantages of the adoption of univariate or bivariate models, the sample of the more expensive variable was divided into a modeling and testing subsamples. The rst was used to t geostatistical models, and the second was used to compare the spatial prediction precisions in the locations not used in the modeling process.
|
Page generated in 0.0671 seconds