Global ETD Search

11	Complexidade descritiva de classes de complexidade probabilísticas de tempo polinomial e das classes ⊕P e NP∩coNP através de lógicas com quantificadores de segunda ordem / Descriptive complexity of polynomial time probabilistic complexity classes and classes ⊕P and NP∩coNP through second order generalized quantifiers Rocha, Thiago Alves January 2014 (has links) ROCHA, T. A. Complexidade descritiva de classes de complexidade probabilísticas de tempo polinomial e das classes ⊕P e NP∩coNP através de lógicas com quantificadores de segunda ordem. 2014. 81 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2014. / Submitted by Daniel Eduardo Alencar da Silva (dealencar.silva@gmail.com) on 2015-01-23T20:35:59Z No. of bitstreams: 1 2014_dis_tarocha.pdf: 600184 bytes, checksum: 8e317715dd15118a1061361a5251f08e (MD5) / Approved for entry into archive by Rocilda Sales(rocilda@ufc.br) on 2015-02-09T15:45:32Z (GMT) No. of bitstreams: 1 2014_dis_tarocha.pdf: 600184 bytes, checksum: 8e317715dd15118a1061361a5251f08e (MD5) / Made available in DSpace on 2015-02-09T15:45:32Z (GMT). No. of bitstreams: 1 2014_dis_tarocha.pdf: 600184 bytes, checksum: 8e317715dd15118a1061361a5251f08e (MD5) Previous issue date: 2014 / Many computable problems can be solved more efficiently or in a more natural way through probabilistic algorithms, which shows that the use of such algorithms is quite relevant in Computer Science. However, probabilistic algorithms may return a wrong answer with a certain probability. Also, the use of probabilistic algorithms does not solve problems that are not computable. In Computational Complexity, the complexity of a problem is characterized based on the amount of computational resources, such as space and time, needed to solve it. Problems that have the same complexity compose the same class. The computational complexity classes are related by a hierarchy. In Descriptive Complexity, a logic is used to express problems and capture computational complexity classes in order to express all and only the problems of this class. Thus, the complexity of a problem does not depend on physical factors, such as time and space, but only on the expressiveness of the logic that defines it. Important results of the area states that several classes of computational complexity can be characterized by a logic. For example, the class NP has been shown equivalent to the class of problems expressed by the existential fragment of Second-Order Logic. This close relationship between these areas allows some results about Logics to be transferred to Computational Complexity and vice versa. Despite of the importance of probabilistic algorithms and of Descriptive Complexity, there are few results on the characterization, by a logic, of probabilistic computational complexity classes. In this work, we show characterizations for each of the polinomial time probabilistic complexity classes. In our results, we use second-order generalized quantifiers to simulate the acceptance of the nondeterministic machines of these classes. We found Logical characterizations in the literature only for classes PP and BPP. In the first case, the logic employed was the first-order added by a quantifier most of second-order. With the approach established in this work, we obtain an alternative proof for the characterization of PP. With the same methodology, we also characterize the class ⊕P through a logic with a second-order parity quantifier. In the case of BPP , there was a result that used a logic with probabilistic semantics. Using our approach of generalized quantifiers, we obtain an alternative characterization for this class. With the same method, we were able to characterize the probabilistic semantic classes RP, coRP, ZPP and the semantic class NP ∩ coNP. Finally, we show an application of Descriptive Complexity results in the creation of algorithms from a logic specification. / Vários problemas computáveis podem ser resolvidos de maneira mais eficiente ou mais natural através de algoritmos probabilísticos, o que mostra que o uso de tais algoritmos é bastante relevante em computação. Entretanto, os algoritmos probabilísticos podem retornar uma resposta errada com uma certa probabilidade. Observe, ainda que o uso de algoritmos probabilísticos não resolve problemas não computáveis. A Complexidade Computacional caracteriza a complexidade de um problema a partir da quantidade de recursos computacionais, como espaço e tempo, para resolvê-lo. Problemas que tem a mesma complexidade compõem uma classe. As classes de complexidade computacional são relacionadas através de uma hierarquia. A Complexidade Descritiva usa lógicas para expressar os problemas e capturar classes de complexidade computacional no sentido de expressar todos, e apenas, os problemas desta classe. Dessa forma, a complexidade de um problema não depende de fatores físicos, como tempo e espaço, mas apenas da expressividade da lógica que o define. Resultados importantes da área mostraram que várias classes de complexidade computacional podem ser caracterizadas por lógicas. Por exemplo, a classe NP foi mostrada equivalente à classe dos problemas expressos pelo fragmento existencial da Lógica de Segunda Ordem. Este estreito relacionamento entre tais áreas permite que alguns resultados da área de Lógica sejam transferidos para a de Complexidade Computacional e vice-versa. Apesar da importância de algoritmos probabilísticos e da Complexidade Descritiva, existem poucos resultados de caracterização, por lógicas, das classes de complexidade computacional probabilísticas. Neste trabalho, buscamos mostrar caracterizações para cada uma das classes de complexidade probabilísticas de tempo polinomial. Nos nossos resultados, utilizamos quantificadores generalizados de segunda ordem para simular a aceitação das máquinas não-determinísticas dessas classes. Achamos caracterizações lógicas na literatura apenas para as classes PP e BPP. No primeiro caso, a lógica utilizada era a de primeira ordem adicionada de um quantificador maioria de segunda ordem. Com a abordagem criada neste trabalho, conseguimos obter uma prova alternativa para a caracterização de PP. Com essa mesma metodologia, também conseguimos caracterizar a classe ⊕P através de uma lógica com um quantificador de paridade. No caso de BPP, existia um resultado que utilizava uma lógica com semântica probabilística. Usando nossa abordagem de quantificadores generalizados, conseguimos obter uma caracterização alternativa para essa classe. Com o mesmo método, conseguimos caracterizar as classes probabilísticas semânticas RP, coRP, ZPP e a classe semântica NP∩coNP. Por fim, mostramos uma aplicação dos resultados de Complexidade Descritiva na criação de algoritmos através de uma especificação lógica. Complexidade descritiva Quantificadores generalizados
12	Identificação e caracterização espectral da ferrugem (Austropuccinia psidii) do eucalipto por imagens de alta resolução obtidas de veículos aéreos não tripulados (vant) e em laboratório (espectroradiômetro) / Identification and spectral characterization of eucalyptus rust (Austropuccinia psidii) by high resolution images obtained from unmanned aerial vehicles (vant) and laboratory (spectroradiometer) Jim, André Stefanini [UNESP] 15 May 2018 (has links) Submitted by ANDRE STEFANINI JIM (andre_sjim@yahoo.com.br) on 2018-09-18T19:48:38Z No. of bitstreams: 1 ANDRE_JIM-ENTREGA-SET2018 Repositório.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5) / Approved for entry into archive by Maria Lucia Martins Frederico null (mlucia@fca.unesp.br) on 2018-09-19T11:38:13Z (GMT) No. of bitstreams: 1 stefanini_aj_dr_botfca.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5) / Made available in DSpace on 2018-09-19T11:38:13Z (GMT). No. of bitstreams: 1 stefanini_aj_dr_botfca.pdf: 4995566 bytes, checksum: 08bf174134902bafb3299a10d9fc8194 (MD5) Previous issue date: 2018-05-15 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Plantios de eucalipto podem sofrer reduções na produção de até 48% devido à ferrugem das mirtáceas causada por Autropuccinia psidii. A identificação e quantificação da doença, ou fitopatometria, e o diagnóstico precoce de doenças é fator chave no manejo florestal. Em campo, o levantamento é realizado por amostragens, que alcançam apenas 5% da área total plantada e são realizadas por equipes de avaliadores por meio do uso de escalas diagramáticas. O uso do SIG na silvicultura tem sido bem-sucedido na detecção de diversos fatores considerados favoráveis às doenças. O termo Silvicultura de Precisão consiste na adoção de ferramentas de sensoriamento remoto embarcadas em distintas plataformas juntamente com sistemas computacionais para o processamento das múltiplas informações. Dentro do campo de sensores, uma plataforma alternativa para o diagnóstico é o emprego de VANTs (Veículos Aéreos Não Tripulados) com câmeras digitais de alta resolução espacial (pixels/cm²), apresentando diversas vantagens em relação aos dados advindos de satélites. Enquanto as informações espectrais coletadas por VANTs são misturas espectrais de dosséis, o espectroradiômetro pode coletar informações de objetos, ao nível de folha, sendo assim uma importante ferramenta para comparação de resultados de análises. Diante da necessidade de se criar uma metodologia para identificação e diagnóstico de doenças em florestas, o objetivo deste trabalho foi o de associar as informações espectrais aos procedimentos estatísticos multivariados, técnicas de regressão logística e bootstrap, de modo a obter modelos de classificação consistentes quanto à identificação e separação dos níveis de severidade para a ocorrência da ferrugem das mirtáceas em plantios jovens de eucalipto. Os resultados demonstraram que a regressão logística associada à função linear discriminante alcançaram as melhores taxas de acerto para dados de laboratório (espectroradiômetro), ao passo que a análise multivariada (por componentes principais) associada à função quadrática discriminante obtiveram as melhores taxas de acerto para dados de campo (VANT). O estudo permitiu concluir que as ferramentas empregadas foram adequadas para a diferenciação de plantas sadias de plantas infectadas por A. psiidi em plantios de Eucalyptus spp. Pôde-se concluir que o uso das imagens de VANT’s oferece uma análise preliminar ampla, possibilitando determinar áreas a receberem uma investigação mais detalhada, que eventualmente, pode ser via uso de espectroradiômetro. Quanto à caracterização do patógeno, observou-se que a técnica stepwise, coincidentemente, selecionou reflectâncias próximas à atividade das clorofilas a e b, excluindo a faixa espectral do verde. / Eucalyptus plantations may suffer reductions in yield of up to 48% due to myrtle rust caused by Autropuccinia psidii. The disease identification and quantification, or phytopatometry, and the early diagnosis are a key factor in forest management. In the field, the survey is carried out by samplings, which reach only 5% of the total planted area and are carried out by teams of raters through the use of diagrammatic scales. The GIS use in forestry has been used in detecting several factors considered favorable to diseases. The term Precision Forestry consists in the adoption of remote sensing tools embedded in different platforms with computational systems for the processing of the multiple information. In terms of sensors, an alternative platform for early diagnosis is the use of UAVs equipped with high spatial resolution digital cameras (pixels / cm²), presenting several advantages compared to the satellite's data. While the spectral information collected by VANTs are canopies spectral mixtures, the spectroradiometer can collect information from objects at the leaf level and thus is an important tool for comparing results analysis. The need to create a methodology for early identification and diagnosis of forest diseases, the aim of the present work was to associate spectral information with multivariate statistical procedures, logistic regression techniques, and bootstrap, in order to obtain consistent classification models, identification of severity levels of myrtle rust in young eucalyptus plantations. The results showed that the logistic regression associated with the linear discriminant function achieved the best hit rates for laboratory data (spectroradiometer), while the multivariate analysis (by main components) associated with the discriminant quadratic function obtained the best data set rates field (UAV). We could conclude that the tools used were adequate for the differentiation of healthy plants of plants infected by A. psidii in plantations of Eucalyptus spp. It was concluded that the use of VANT's images offers a preliminary extensive analysis, making it possible to determine areas to receive a more detailed investigation, which may be via the use of a spectroradiometer. As for the characterization of the pathogen, it was observed that the stepwise technique, coincidentally, selected reflectances close to the activity of chlorophyll a and b, excluding the spectral range of green. Assinatura espectral Silvicultura de Precisão Análise Multivariada Modelos lineares generalizados Bootstrap
13	Fator de correção para a distribuição da Deviance para dados de proporções / not available Ana Paula Gomes da Silva Gimenes 27 September 2000 (has links) A análise de dados de proporções apresenta, em geral, certas dificuldades uma vez que a distribuição subjacente a tais dados pode ser considerada binomial, que não segue as pressuposições básicas para o ajuste de um modelo matemático. Algumas transformações são sugeridas, mas nem sempre bons resultados são obtidos. No enfoque de modelos lineares generalizados, a estatística que mede a qualidade do ajuste do modelo para os dados é chamada deviance. Ocorre que a distribuição da deviance é desconhecida. No entanto, para dados com distribuição binomial, pode-se aproximar a distribuição da deviance por uma distribuição qui-quadrado, mas tal aproximação não é boa para tamanhos pequenos de amostra. Para melhorar essa aproximação, alguns fatores de correção para os dados são sugeridos, mas os resultados obtidos ainda não são bons para pequenas amostras. Assim, o objetivo deste trabalho é propor um novo fator de correção para os dados seguindo uma distribuição binomial, de modo a se obter uma melhora na distribuição da deviance para qualquer tamanho de amostra. Para isto, adiciona-se uma constante à variável resposta e, através do valor esperado da deviance, calcula-se tal constante de modo a reduzir o erro cometido na aproximação. Simulações da distribuição binomial e o cálculo da deviance são feitos e QQ-plots são utilizados para a comparação com a distribuição qui-quadrado / not available ANÁLISE DE DADOS DISTRIBUIÇÃO BINOMIAL DISTRIBUIÇÃO DA DEVIANCE MODELOS LINEARES GENERALIZADOS
14	Modelos lineares generalizados simétricos heteroscedásticos Lídia Coco Terra, Maria 31 January 2009 (has links) Made available in DSpace on 2014-06-12T18:02:18Z (GMT). No. of bitstreams: 2 arquivo3859_1.pdf: 757592 bytes, checksum: 0ba2d758f01c98e407e2285f4bbd4c99 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A classe de modelos lineares generalizados simétricos heteroscedásticos é caracterizada pela resposta pertencente à classe simétrica de distribuições, um preditor linear relacionado com o parâmetro de posição e um preditor linear relacionado com o parâmetro de escala, ambos relacionado através de funções de ligação. Estes modelos são uma extensão natural dos modelos lineares generalizados simétricos (MLGS) proposta por Lobos (2004), em que apenas o parâmetro de posição é relacionado por um preditor linear através de uma função de ligação duplamente diferenciável. Neste trabalho, inicialmente, apresentamos alguns resultados nos MLGS heteroscedásticos. Em seguida, testes assintóticos para avaliar homoscedasticidade são propostos bem como métodos de diagnósticos sob o enfoque de influência local. Alguns exemplos com dados reais serão discutidos a fim de ilustrar a teoria desenvolvida Influência local Parâmetro de escala
15	Modelos lineares parciais aditivos generalizados com suavização por meio de P-splines / Generalized additive partial linear models with P-splines smoothing Holanda, Amanda Amorim 03 May 2018 (has links) Neste trabalho apresentamos os modelos lineares parciais generalizados com uma variável explicativa contínua tratada de forma não paramétrica e os modelos lineares parciais aditivos generalizados com no mínimo duas variáveis explicativas contínuas tratadas de tal forma. São utilizados os P-splines para descrever a relação da variável resposta com as variáveis explicativas contínuas. Sendo assim, as funções de verossimilhança penalizadas, as funções escore penalizadas e as matrizes de informação de Fisher penalizadas são desenvolvidas para a obtenção das estimativas de máxima verossimilhança penalizadas por meio da combinação do algoritmo backfitting (Gauss-Seidel) e do processo iterativo escore de Fisher para os dois tipos de modelo. Em seguida, são apresentados procedimentos para a estimação do parâmetro de suavização, bem como dos graus de liberdade efetivos. Por fim, com o objetivo de ilustração, os modelos propostos são ajustados à conjuntos de dados reais. / In this work we present the generalized partial linear models with one continuous explanatory variable treated nonparametrically and the generalized additive partial linear models with at least two continuous explanatory variables treated in such a way. The P-splines are used to describe the relationship among the response and the continuous explanatory variables. Then, the penalized likelihood functions, penalized score functions and penalized Fisher information matrices are derived to obtain the penalized maximum likelihood estimators by the combination of the backfitting (Gauss-Seidel) algorithm and the Fisher escoring iterative method for the two types of model. In addition, we present ways to estimate the smoothing parameter as well as the effective degrees of freedom. Finally, for the purpose of illustration, the proposed models are fitted to real data sets. Generalized additive models Generalized linear models Generalized partial linear models Método de suavização Modelos aditivos generalizados Modelos lineares generalizados Modelos lineares parciais generalizados Modelos parcialmente lineares Modelos semiparamétricos P-splines P-splines Partial linear models Semiparametric models Smoothing method Splines Splines
16	Modelos lineares parciais aditivos generalizados com suavização por meio de P-splines / Generalized additive partial linear models with P-splines smoothing Amanda Amorim Holanda 03 May 2018 (has links) Neste trabalho apresentamos os modelos lineares parciais generalizados com uma variável explicativa contínua tratada de forma não paramétrica e os modelos lineares parciais aditivos generalizados com no mínimo duas variáveis explicativas contínuas tratadas de tal forma. São utilizados os P-splines para descrever a relação da variável resposta com as variáveis explicativas contínuas. Sendo assim, as funções de verossimilhança penalizadas, as funções escore penalizadas e as matrizes de informação de Fisher penalizadas são desenvolvidas para a obtenção das estimativas de máxima verossimilhança penalizadas por meio da combinação do algoritmo backfitting (Gauss-Seidel) e do processo iterativo escore de Fisher para os dois tipos de modelo. Em seguida, são apresentados procedimentos para a estimação do parâmetro de suavização, bem como dos graus de liberdade efetivos. Por fim, com o objetivo de ilustração, os modelos propostos são ajustados à conjuntos de dados reais. / In this work we present the generalized partial linear models with one continuous explanatory variable treated nonparametrically and the generalized additive partial linear models with at least two continuous explanatory variables treated in such a way. The P-splines are used to describe the relationship among the response and the continuous explanatory variables. Then, the penalized likelihood functions, penalized score functions and penalized Fisher information matrices are derived to obtain the penalized maximum likelihood estimators by the combination of the backfitting (Gauss-Seidel) algorithm and the Fisher escoring iterative method for the two types of model. In addition, we present ways to estimate the smoothing parameter as well as the effective degrees of freedom. Finally, for the purpose of illustration, the proposed models are fitted to real data sets. Método de suavização Modelos aditivos generalizados Modelos lineares generalizados Modelos lineares parciais generalizados Modelos parcialmente lineares Modelos semiparamétricos P-splines Splines Generalized additive models Generalized linear models Generalized partial linear models P-splines Partial linear models Semiparametric models Smoothing method Splines
17	Estimativa do custo da colheita mecanizada de cana-de-açúcar utilizando modelos de regressão / Estimated cost of mechanized harvesting of sugarcane using regression models Maekawa, Eduardo Shigueiti 22 August 2016 (has links) A colheita mecanizada é uma das mais significativas e onerosas operações do processo de produção de cana-de-açúcar, tornando-se importante o entendimento das relações que envolvem o seu custo. Atualmente, as metodologias para estimar o custo da colheita partem do conceito de custo fixo e variável. No entanto, considerando a complexidade desse processo, faz-se necessário avaliar métodos capazes de relacionar os parâmetros operacionais com o custo final. Neste contexto, a modelagem estatística por meio da regressão permite tratar tais relações e prever tendências. O objetivo deste trabalho foi desenvolver um modelo empírico para o cálculo do custo da colheita mecanizada de cana-de-açúcar. Desenvolveu-se um modelo linear generalizado (MLG) e um modelo linear generalizado misto (MLGM) ambos com distribuição gama, utilizando indicadores operacionais e dados de custo de 20 usinas do setor sucroalcooleiro. Por meio do MLGM, obteve-se uma aderência satisfatória quando comparado aos modelos MLG, nulo (média) e linear (supondo normalidade). Os indicadores que explicaram o custo foram: produtividade (t maq-1), consumo (l t-1), horímetro (h) e número de operadores por colhedora (nop). / The mechanized harvesting of sugarcane is one of the most significant and costly operations of the production process, thus it is important to understand the relationships involving its cost. Currently, methods to estimate these costs rise from the concept of fixed and variable cost. However, considering the complexity of the harvesting process, it is necessary to evaluate techniques to relate the operating parameters with the final cost. In this context, statistical modeling by regression allows to treat such relationship and predict trends. The objective of this study was to develop an empirical model to calculate the cost of mechanical harvesting of sugarcane. A generalized linear model (GLM) and a generalized linear mixed model (GLMM) both with gamma distribution was developed using operational indicators and cost data from 20 plants in the sugarcane industry. Through the GLMM, satisfactory adhesion was obtained when compared to the GLM, null model (average) and linear (assuming normality). The indicators that explained the cost were: productivity (t mach-1), consumption (l t-1), hourmeter (h) and number of operators per harvester (nop). Colhedora de cana Custo operacional Generalized linear mixed models Generalized linear models Modelos lineares generalizados Modelos lineares generalizados mistos Operational cost Sugarcane harvester
18	Métodos estatísticos aplicados ao teste de Salmonella/microssoma: modelos, seleção e suas implicações / Statistical methods applied for Salmonella/microsome test data: models, selection and their entailments Butturi-Gomes, Davi 03 December 2015 (has links) O teste de Salmonella/microssoma é um ensaio biológico amplamente utilizado para avaliar o potencial mutagênico de substâncias que podem colocar em risco a saúde humana e a qualidade ambiental. A variável resposta é constituída pela contagem do número de colônias revertentes em cada placa, entretanto geralmente há dois efeitos confundidos, o de toxicidade e o de mutagenicidade. Alguns modelos foram propostos para a análise dos dados desses experimentos, que nem sempre apresentam bons ajustes e não consideram explicitamente interações. Há, ainda, poucas plataformas computacionais disponíveis que integram todas essas propostas e forneçam critérios para a seleção adequada de um modelo. Além disso, geralmente é difícil comparar os efeitos de diferentes substâncias sobre as várias linhagens da bactéria, então medidas com interpretação biológica direta são necessárias. Neste trabalho, foram investigadas as propriedades dos preditores dos modelos tradicionais, bem como o comportamento das distribuições amostrais dos estimadores dos parâmetros desses modelos, na presença de diversos níveis de superdispersão. Também, foram realizados experimentos com as linhagens TA98 e TA100 da bactéria, expostas aos inseticidas, metabolizados e não-metabolizados, Fipronil e Tiametoxam, dois agroquímicos bastante utilizados no Brasil. Aos dados desses experimentos foram ajustados diversos modelos, tanto aqueles tradicionalmente utilizados, quanto novos modelos, alguns baseados na regressão de Skellam e outros com interações explícitas. Para tal, foi obtida uma nova classe de modelos chamada de modelos não-lineares vetoriais generalizados e foi desenvolvido um pacote computacional em linguagem R, intitulado \"ames\", para o ajuste, diagnóstico e seleção de modelos. Por fim, foram propostas medidas de interesse biológico, baseadas nos modelos selecionados, para avaliação de risco e do comprometimento do material genético e intervalos de confiança bootstrap paramétrico foram obtidos. Dentre os modelos tradicionais, aqueles cujas distribuições amostrais dos estimadores possuem melhor aproximação normal foram os de Bernstein, Breslow e Myers. Estes resultados forneceram um critério prático para a seleção de modelos, particularmente nas situações em que as medidas de AIC e de bondade de ajuste, os testes de razão de verossimilhanças e a análise de resíduos ou são pouco informativos ou simplesmente não podem ser aplicados. A partir dos modelos selecionados, pode-se concluir que a interação do fator de metabolização é significativa para a linhagem TA98 exposta ao Fipronil, tanto com relação aos efeitos tóxicos quanto aos efeitos mutagênicos; que o mecanismo de ação do Tiametoxam sobre a linhagem TA98 é completamente diferente quando o produto está metabolizado; e que, para a linhagem TA100, não houve efeito de metabolização considerando ambos os agroquímicos. Baseando-se nas medidas propostas, pode-se concluir que o Tiametoxam oferece os maiores riscos de contaminação residual, ainda que o Fipronil apresente os maiores índices de mutagenicidade. / The Salmonella/microsome test is a widely accepted biological assay used to evaluate the mutagenic potential of substances, which can compromise human health and environment quality. The response variable in such experiments is typically the total number of reverts per plate, which, in turn, is the result of the confounded effects of mutagenicity and toxicity. Despite of some statistical models have already been established in the literature, they do not always fit well and neither explicitly consider interaction terms. Besides, there is just a number of available software able to handle these different approaches, usually lacking of global performance and model selection criteria. Also, it is often a hard task to compare the effects of different chemicals over the several available strains to perform the assay, and, thus, direct measures of biological implications are required. In this work, the properties of the predictors in each traditional model were investigated, as well as the behavior of the sampling distributions of the parameter estimators of these models, in different levels of overdispersion. Also, experiments using TA98 and TA100 strains were perfomed, by exposition to two insecticides, namely Fipronil and Thiamethoxam, currently used in Brazil, each of them prior and after to a metabolization processes. Then, the traditional models, empirical regression models based on the Skellam distribution and also compound mechanistic-empirical models with explicit interaction terms were fitted to the data. In order to use a single fitting framework, a new class of models was presented, namely the vector generalized nonlinear models, and a R language package, entitled \"ames\", was developed for fitting, diagnosing and selection of models. Finally, some measures of biological interest were approached based on the selected models for the data, in the contexts of risk evaluation and of DNA damage cautioning. Confidence intervals for such measures were provided using bootstrap percentiles. Among the traditional models, the ones from Bernstein, Breslow and Myers were those whose sampling distributions presented the best normal approximations. These results provided a practical criterion for model selection, particularly in situations where measures as AIC and goodness of fit, likelihood ratio tests, and residual analysis are non informative or simply cannot be applied. From the final selected models, it was inferred that the interactions between the metabolization factor is significative for TA98 strain exposed to Fipronil, regarding both, mutagenic and toxic effects; that the dynamics between mutagenicity and toxicity are different when Thiamethoxam is metabolized compared to when it is not; and that there was no evidence to consider metabolization factor interactions for the TA100 strain data exposed to neither of the insecticides. By appling the referred measures of biological interest, it was concluded that the use of Thiamethoxam provides greater residual contamination risks and that Fipronil causes higher mutagenicity indices. Ames test Distribuição de Skellam Funções em R Generalized nonlinear models Modelos lineares generalizados vetoriais Modelos não-lineares generalizados R functions Skellam distribution Teste de Ames Vector generalized linear models
19	Métodos estatísticos aplicados ao teste de Salmonella/microssoma: modelos, seleção e suas implicações / Statistical methods applied for Salmonella/microsome test data: models, selection and their entailments Davi Butturi-Gomes 03 December 2015 (has links) O teste de Salmonella/microssoma é um ensaio biológico amplamente utilizado para avaliar o potencial mutagênico de substâncias que podem colocar em risco a saúde humana e a qualidade ambiental. A variável resposta é constituída pela contagem do número de colônias revertentes em cada placa, entretanto geralmente há dois efeitos confundidos, o de toxicidade e o de mutagenicidade. Alguns modelos foram propostos para a análise dos dados desses experimentos, que nem sempre apresentam bons ajustes e não consideram explicitamente interações. Há, ainda, poucas plataformas computacionais disponíveis que integram todas essas propostas e forneçam critérios para a seleção adequada de um modelo. Além disso, geralmente é difícil comparar os efeitos de diferentes substâncias sobre as várias linhagens da bactéria, então medidas com interpretação biológica direta são necessárias. Neste trabalho, foram investigadas as propriedades dos preditores dos modelos tradicionais, bem como o comportamento das distribuições amostrais dos estimadores dos parâmetros desses modelos, na presença de diversos níveis de superdispersão. Também, foram realizados experimentos com as linhagens TA98 e TA100 da bactéria, expostas aos inseticidas, metabolizados e não-metabolizados, Fipronil e Tiametoxam, dois agroquímicos bastante utilizados no Brasil. Aos dados desses experimentos foram ajustados diversos modelos, tanto aqueles tradicionalmente utilizados, quanto novos modelos, alguns baseados na regressão de Skellam e outros com interações explícitas. Para tal, foi obtida uma nova classe de modelos chamada de modelos não-lineares vetoriais generalizados e foi desenvolvido um pacote computacional em linguagem R, intitulado \"ames\", para o ajuste, diagnóstico e seleção de modelos. Por fim, foram propostas medidas de interesse biológico, baseadas nos modelos selecionados, para avaliação de risco e do comprometimento do material genético e intervalos de confiança bootstrap paramétrico foram obtidos. Dentre os modelos tradicionais, aqueles cujas distribuições amostrais dos estimadores possuem melhor aproximação normal foram os de Bernstein, Breslow e Myers. Estes resultados forneceram um critério prático para a seleção de modelos, particularmente nas situações em que as medidas de AIC e de bondade de ajuste, os testes de razão de verossimilhanças e a análise de resíduos ou são pouco informativos ou simplesmente não podem ser aplicados. A partir dos modelos selecionados, pode-se concluir que a interação do fator de metabolização é significativa para a linhagem TA98 exposta ao Fipronil, tanto com relação aos efeitos tóxicos quanto aos efeitos mutagênicos; que o mecanismo de ação do Tiametoxam sobre a linhagem TA98 é completamente diferente quando o produto está metabolizado; e que, para a linhagem TA100, não houve efeito de metabolização considerando ambos os agroquímicos. Baseando-se nas medidas propostas, pode-se concluir que o Tiametoxam oferece os maiores riscos de contaminação residual, ainda que o Fipronil apresente os maiores índices de mutagenicidade. / The Salmonella/microsome test is a widely accepted biological assay used to evaluate the mutagenic potential of substances, which can compromise human health and environment quality. The response variable in such experiments is typically the total number of reverts per plate, which, in turn, is the result of the confounded effects of mutagenicity and toxicity. Despite of some statistical models have already been established in the literature, they do not always fit well and neither explicitly consider interaction terms. Besides, there is just a number of available software able to handle these different approaches, usually lacking of global performance and model selection criteria. Also, it is often a hard task to compare the effects of different chemicals over the several available strains to perform the assay, and, thus, direct measures of biological implications are required. In this work, the properties of the predictors in each traditional model were investigated, as well as the behavior of the sampling distributions of the parameter estimators of these models, in different levels of overdispersion. Also, experiments using TA98 and TA100 strains were perfomed, by exposition to two insecticides, namely Fipronil and Thiamethoxam, currently used in Brazil, each of them prior and after to a metabolization processes. Then, the traditional models, empirical regression models based on the Skellam distribution and also compound mechanistic-empirical models with explicit interaction terms were fitted to the data. In order to use a single fitting framework, a new class of models was presented, namely the vector generalized nonlinear models, and a R language package, entitled \"ames\", was developed for fitting, diagnosing and selection of models. Finally, some measures of biological interest were approached based on the selected models for the data, in the contexts of risk evaluation and of DNA damage cautioning. Confidence intervals for such measures were provided using bootstrap percentiles. Among the traditional models, the ones from Bernstein, Breslow and Myers were those whose sampling distributions presented the best normal approximations. These results provided a practical criterion for model selection, particularly in situations where measures as AIC and goodness of fit, likelihood ratio tests, and residual analysis are non informative or simply cannot be applied. From the final selected models, it was inferred that the interactions between the metabolization factor is significative for TA98 strain exposed to Fipronil, regarding both, mutagenic and toxic effects; that the dynamics between mutagenicity and toxicity are different when Thiamethoxam is metabolized compared to when it is not; and that there was no evidence to consider metabolization factor interactions for the TA100 strain data exposed to neither of the insecticides. By appling the referred measures of biological interest, it was concluded that the use of Thiamethoxam provides greater residual contamination risks and that Fipronil causes higher mutagenicity indices. Distribuição de Skellam Funções em R Modelos lineares generalizados vetoriais Modelos não-lineares generalizados Teste de Ames Ames test Generalized nonlinear models R functions Skellam distribution Vector generalized linear models
20	Estimativa do custo da colheita mecanizada de cana-de-açúcar utilizando modelos de regressão / Estimated cost of mechanized harvesting of sugarcane using regression models Eduardo Shigueiti Maekawa 22 August 2016 (has links) A colheita mecanizada é uma das mais significativas e onerosas operações do processo de produção de cana-de-açúcar, tornando-se importante o entendimento das relações que envolvem o seu custo. Atualmente, as metodologias para estimar o custo da colheita partem do conceito de custo fixo e variável. No entanto, considerando a complexidade desse processo, faz-se necessário avaliar métodos capazes de relacionar os parâmetros operacionais com o custo final. Neste contexto, a modelagem estatística por meio da regressão permite tratar tais relações e prever tendências. O objetivo deste trabalho foi desenvolver um modelo empírico para o cálculo do custo da colheita mecanizada de cana-de-açúcar. Desenvolveu-se um modelo linear generalizado (MLG) e um modelo linear generalizado misto (MLGM) ambos com distribuição gama, utilizando indicadores operacionais e dados de custo de 20 usinas do setor sucroalcooleiro. Por meio do MLGM, obteve-se uma aderência satisfatória quando comparado aos modelos MLG, nulo (média) e linear (supondo normalidade). Os indicadores que explicaram o custo foram: produtividade (t maq-1), consumo (l t-1), horímetro (h) e número de operadores por colhedora (nop). / The mechanized harvesting of sugarcane is one of the most significant and costly operations of the production process, thus it is important to understand the relationships involving its cost. Currently, methods to estimate these costs rise from the concept of fixed and variable cost. However, considering the complexity of the harvesting process, it is necessary to evaluate techniques to relate the operating parameters with the final cost. In this context, statistical modeling by regression allows to treat such relationship and predict trends. The objective of this study was to develop an empirical model to calculate the cost of mechanical harvesting of sugarcane. A generalized linear model (GLM) and a generalized linear mixed model (GLMM) both with gamma distribution was developed using operational indicators and cost data from 20 plants in the sugarcane industry. Through the GLMM, satisfactory adhesion was obtained when compared to the GLM, null model (average) and linear (assuming normality). The indicators that explained the cost were: productivity (t mach-1), consumption (l t-1), hourmeter (h) and number of operators per harvester (nop). Colhedora de cana Custo operacional Modelos lineares generalizados Modelos lineares generalizados mistos Generalized linear mixed models Generalized linear models Operational cost Sugarcane harvester

Search results