Spelling suggestions: "subject:"[een] MARKOV CHAIN"" "subject:"[enn] MARKOV CHAIN""
391 |
Improved training of generative modelsGoyal, Anirudh 11 1900 (has links)
No description available.
|
392 |
Inferência em modelos de mistura via algoritmo EM estocástico modificado / Inference on Mixture Models via Modified Stochastic EMAssis, Raul Caram de 02 June 2017 (has links)
Apresentamos o tópico e a teoria de Modelos de Mistura de Distribuições, revendo aspectos teóricos e interpretações de tais misturas. Desenvolvemos a teoria dos modelos nos contextos de máxima verossimilhança e de inferência bayesiana. Abordamos métodos de agrupamento já existentes em ambos os contextos, com ênfase em dois métodos, o algoritmo EM estocástico no contexto de máxima verossimilhança e o Modelo de Mistura com Processos de Dirichlet no contexto bayesiano. Propomos um novo método, uma modificação do algoritmo EM Estocástico, que pode ser utilizado para estimar os parâmetros de uma mistura de componentes enquanto permite soluções com número distinto de grupos. / We present the topics and theory of Mixture Models in a context of maximum likelihood and Bayesian inferece. We approach clustering methods in both contexts, with emphasis on the stochastic EM algorithm and the Dirichlet Process Mixture Model. We propose a new method, a modified stochastic EM algorithm, which can be used to estimate the parameters of a mixture model and the number of components.
|
393 |
Eficiência produtiva da indústria de transformação nas regiões brasileiras: uma análise de fronteiras estocásticas e cadeias espaciais de Markov / Productive efficiency of the manufacturing industry in the Brazilian regions: a stochastic frontier and spatial Markov chain analysisSchettini, Daniela Carla Decaro 09 April 2010 (has links)
Este trabalho investiga a eficiência produtiva dos setores industriais nas regiões brasileiras. Para isso, utiliza um painel de dados da Pesquisa Industrial Anual do IBGE para o período de 2000 a 2006, desagregado por mesorregiões, setores da indústria de transformação e por setores de intensidade tecnológica. São estimados modelos de fronteira de produção estocástica para obtenção das estimativas das eficiências produtivas regionais e setoriais. Esses indicadores de eficiência são então analisados com base na literatura de economia espacial e das Cadeias Espaciais de Markov, que visam investigar o efeito da boa e da má vizinhança. Os resultados indicam que as mesorregiões mais eficientes tendem a localizar-se na faixa litorânea do Brasil, mas, na medida em que tratamos de setores mais básicos da economia, há maior dispersão da alta eficiência pelo espaço brasileiro. Além disso, percebe-se um deslocamento, ao longo do tempo, de altos índices de eficiência para as mesorregiões do Centro-Oeste. Em relação à eficiência setorial, observou-se que, em geral, os setores menos intensivos em tecnologia são menos eficientes: constatou-se que o setor de Alta Intensidade Tecnológica é 11% mais eficiente do que o setor de Baixa Intensidade. Os resultados das análises da influência das economias espaciais sobre a eficiência produtiva indicam que a vizinhança afeta o desempenho competitivo da região, constatando-se que o efeito da boa vizinhança em estimular o aumento da eficiência é maior do que o efeito da má vizinhança em retraí-la. Além disso, concluiu-se que as economias espaciais influenciam a eficiência produtiva regional. Em geral, as economias de aglomeração têm influência positiva sobre a eficiência, enquanto que, em relação às economias de urbanização, encontramos a predominância dos efeitos de congestionamento. As economias de localização apresentaram um efeito forte e positivo sobre a eficiência das atividades industriais das mesorregiões, indicando que regiões mais especializadas mostraram-se mais eficientes. / This thesis investigates the productive efficiency of the industrial sectors in Brazilian regions. It uses a panel data set from Pesquisa Industrial Anual of IBGE during 2000 to 2006, disaggregated by mesoregions, industrial manufacturing sectors and by technological intensity sectors. It estimates stochastic frontiers of production to obtain regional and sectorial productive efficiency indicators. These efficiency indicators are analyzed based on the spatial economy literature and on Spatial Markov Chains, which investigate the effect of good and bad neighborhoods. The results indicate that the most efficient mesoregions tend to be located on the coast of Brazil, but, as we deal with more basic sectors of the economy, there is a larger dispersion of high efficiency on Brazilian space. Furthermore, we realize, as the time passes, an increasing motion of high efficiency levels to mesoregions of the Center-West. Considering the sectorial efficiency, we observed that, in general, the less technological intensive sectors are less efficient: we verify that the High Technological Intensity sector is 11% more efficient than the Low Intensity sector. The results from analyzing the influence of the spatial economies on the productive efficiency indicate that the neighborhood affects the competitive performance of the region; verifying that the effect of a good neighborhood in stimulating the enhance of the efficiency is higher than the effect of the bad neighborhood on contracting it. We also concluded that the spatial economies influence the regional productive efficiency. In general, the agglomeration economies have positive influence on efficiency, but considering the urbanization economies, the congestion effect predominates. The localization economies present a strong and positive effect on the efficiency of industrial activities of the mesoregions, indicating that more specialized regions are seen as more efficient.
|
394 |
Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes / Inference of gene regulatory networks using the seed growing paradigmHiga, Carlos Henrique Aguena 17 February 2012 (has links)
Um problema importante na área de Biologia Sistêmica é o de inferência de redes de regulação gênica. Os avanços científicos e tecnológicos nos permitem analisar a expressão gênica de milhares de genes simultaneamente. Por \"expressão gênica\'\', estamos nos referindo ao nível de mRNA dentro de uma célula. Devido a esta grande quantidade de dados, métodos matemáticos, estatísticos e computacionais têm sido desenvolvidos com o objetivo de elucidar os mecanismos de regulação gênica presentes nos organismos vivos. Para isso, modelos matemáticos de redes de regulação gênica têm sido propostos, assim como algoritmos para inferir estas redes. Neste trabalho, focamos nestes dois aspectos: modelagem e inferência. Com relação à modelagem, estudamos modelos existentes para o ciclo celular da levedura (Saccharomyces cerevisiae). Após este estudo, propomos um modelo baseado em redes Booleanas probabilísticas sensíveis ao contexto, e em seguida, um aprimoramento deste modelo, utilizando cadeias de Markov não homogêneas. Mostramos os resultados, comparando os nossos modelos com os modelos estudados. Com relação à inferência, propomos um novo algoritmo utilizando o paradigma de crescimento de semente de genes. Neste contexto, uma semente é um pequeno subconjunto de genes de interesse. Nosso algoritmo é baseado em dois passos: passo de crescimento de semente e passo de amostragem. No primeiro passo, o algoritmo adiciona outros genes à esta semente, seguindo algum critério. No segundo, o algoritmo realiza uma amostragem de redes, definindo como saída um conjunto de redes potencialmente interessantes. Aplicamos o algoritmo em dados artificiais e dados biológicos de células HeLa, mostrando resultados satisfatórios. / A key problem in Systems Biology is the inference of gene regulatory networks. The scientific and technological advancement allow us to analyze the gene expression of thousands of genes, simultaneously. By \"gene expression\'\' we refer to the mRNA concentration level inside a cell. Due to this large amount of data, mathematical, statistical and computational methods have been developed in order to elucidate the gene regulatory mechanisms that take part of every living organism. To this end, mathematical models of gene regulatory networks have been proposed, along with algorithms to infer these networks. In this work, we focus in two aspects: modeling and inference. Regarding the modeling, we studied existing models for the yeast (Saccharomyces cerevisiae) cell cycle. After that, we proposed a model based on context sensitive probabilistic Boolean networks, and then, an improvement of this model, using nonhomogeneous Markov chain. We show the results, comparing our models against the studied models. Regarding the inference, we proposed a new algorithm using the seed growing paradigm. In this context, a seed is a small subset of genes. Our algorithm is based in two main steps: seed growing step and sampling step. In the first step, the algorithm adds genes into the seed, according to some criterion. In the second step, the algorithm performs a sampling process on the space of networks, defining as its output a set of potentially interesting networks. We applied the algorithm on artificial and biological HeLa cells data, showing satisfactory results.
|
395 |
Imputação múltipla: comparação e eficiência em experimentos multiambientais / Multiple Imputations: comparison and efficiency of multi-environmental trialsSilva, Maria Joseane Cruz da 19 July 2012 (has links)
Em experimentos de genótipos ambiente são comuns à presença de valores ausentes, devido à quantidade insuficiente de genótipos para aplicação dificultando, por exemplo, o processo de recomendação de genótipos mais produtivos, pois para a aplicação da maioria das técnicas estatísticas multivariadas exigem uma matriz de dados completa. Desta forma, aplicam-se métodos que estimam os valores ausentes a partir dos dados disponíveis conhecidos como imputação de dados (simples e múltiplas), levando em consideração o padrão e o mecanismo de dados ausentes. O objetivo deste trabalho é avaliar a eficiência da imputação múltipla livre da distribuição (IMLD) (BERGAMO et al., 2008; BERGAMO, 2007) comparando-a com o método de imputação múltipla com Monte Carlo via cadeia de Markov (IMMCMC), na imputação de unidades ausentes presentes em experimentos de interação genótipo (25) ambiente (7). Estes dados são provenientes de um experimento aleatorizado em blocos com a cultura de Eucaluptus grandis (LAVORANTI, 2003), os quais foram feitas retiradas de porcentagens aleatoriamente (10%, 20%, 30%) e posteriormente imputadas pelos métodos considerados. Os resultados obtidos por cada método mostraram que, a eficiência relativa em ambas as porcentagens manteve-se acima de 90%, sendo menor para o ambiente (4) quando imputado com a IMLD. Para a medida geral de exatidão, a medida que ocorreu acréscimo de dados em falta, foi maior ao imputar os valores ausentes com a IMMCMC, já para o método IMLD estes valores variaram sendo menor a 20% de retirada aleatória. Dentre os resultados encontrados, é de suma importância considerar o fato de que o método IMMCMC considera a suposição de normalidade, já o método IMLD leva vantagem sobre este ponto, pois não considera restrição alguma sobre a distribuição dos dados nem sobre os mecanismos e padrões de ausência. / In trials of genotypes by environment, the presence of absent values is common, due to the quantity of insufficiency of genotype application, making difficult for example, the process of recommendation of more productive genotypes, because for the application of the majority of the multivariate statistical techniques, a complete data matrix is required. Thus, methods that estimate the absent values from available data, known as imputation of data (simple and multiple) are applied, taking into consideration standards and mechanisms of absent data. The goal of this study is to evaluate the efficiency of multiple imputations free of distributions (IMLD) (BERGAMO et al., 2008; BERGAMO, 2007), compared with the Monte Carlo via Markov chain method of multiple imputation (IMMCMC), in the absent units present in trials of genotype interaction (25)environment (7). This data is provisional of random tests in blocks with Eucaluptus grandis cultures (LAVORANTI, 2003), of which random percentages of withdrawals (10%, 20%, 30%) were performed, with posterior imputation of the considered methods. The results obtained for each method show that, the relative efficiency in both percentages were maintained above 90%, being less for environmental (4) when imputed with an IMLD. The general measure of exactness, the measures where higher absent data occurred, was larger when absent values with an IMMCMC was imputed, as for the IMLD method, the varied absent values were lower at 20% for random withdrawals. Among results found, it is of sum importance to take into consideration the fact that the IMMCMC method considers it to be an assumption of normality, as for the IMLD method, it does not consider any restriction on the distribution of data, not on mechanisms and absent standards, which is an advantage on imputations.
|
396 |
Modelos matemáticos e computacionais para o comportamento do rato no labirinto em cruz elevado / Mathematical and computational models of the rat behavior into the Elevated Plus MazeHerrera, Hector Julian Tejada 28 May 2010 (has links)
O Labirinto em Cruz Elevado (LCE) é um modelo animal para o estudo da ansiedade, suas bases biológicas e os efeitos de diferentes tipos de fármacos sobre o comportamento. Diferentes métodos têm sido usados para estudá-lo, dentro dos quais encontra-se a modelagem computacional. O presente trabalho junta-se a esses estudos utilizando as ferramentas da modelagem computacional para desenvolver dois modelos computacionais e índices que permitiram avaliá-lo. O primeiro deles estuda a maneira como os animais exploram o labirinto usando cadeias de Markov. Esta abordagem rendeu um método de caracterização capaz de identificar os efeitos de certos tipos de fármacos sobre a maneira como o animal explora o LCE, ao mesmo tempo que levanta alguns indícios sobre a quantidade de informação que o rato usa para tomar uma decisão. O segundo foi construído baseado na ideia do conflito como o determinante do comportamento do rato no LCE, adaptando um modelo de rede neural usado para avaliar informação conflitante: o modelo de dipolo chaveado de Grossberg. O objetivo desse segundo modelo foi avaliar a viabilidade de um modelo de competição de três forças: uma que insta explorar locais considerados amedrontadores, uma outra que insta procurar proteção e a última que representa o vigor do animal. Cada uma das forças que compõem o modelo recebe sinais vindos do ambiente e a maneira como processam esses sinais pode ser afetada pelos efeitos de um determinado fármaco. O modelo reproduz os efeitos esperados dos três tipos de fármacos fazendo mudanças em no máximo dois de seus parâmetros. Da mesma maneira, o modelo reproduz parte do comportamento esperado na Arena, precisando apenas de um pequeno ajuste para reproduzir as trajetórias que o animal costuma fazer em torno das paredes desse labirinto. Pode-se concluir que o modelo computacional descreve uma possível maneira de como as variáveis que controlam o comportamento do rato no LCE interagem e de como os fármacos interagem com essas variáveis, permitindo a reprodução do comportamento do rato no LCE e em outros labirintos como a Arena. O modelo foi construído para reproduzir os efeitos de três tipos de fármacos, porém, a maneira como esses tipos de fármacos interagem com o modelo não foi condicionada a um local ou maneira específico. Esta abordagem permite procurar outras interações que não somente reproduzam os efeitos de fármacos conhecidos, mas também possam predizer os efeitos de fármacos ainda não estudados. / The Elevated Plus Maze (EPM) is an animal model for the study of anxiety, its biological foundations, and the effects of different kinds of drugs on behavior. A group of different modeling methods have been used to study the rat behavior in the EPM. One of them characterizes rat behavior the EPM using directed graphs and proposes an index which can be used to classify the drug type and dosis. The other two methods were used to construct computational models for the rat behavior. The first of these models used Markov chains to reproduce the rat behavior. This approach offers a method to characterize the rat behavior, which is able to identify the effects of certain kinds of drugs on the way the rat explores the maze and, at the same time, raises some clues on how much information is used by the animal to take a decision. The second one was built based on the idea that conflict determines the rat behavior in the EPM. Conflict was introduced in the model via an adapted version of Grossberg\'s gated dipole artificial neural network model. The goal was to evaluate the viability of a competition-based model with three kind of drives: a drive to explore threatening places, a drive to seek protection, and a drive to move, related to the energy of the animal. The model receives and processes signals from the environment according to the states of these three drives, and the way in which the signals are processed can be influenced by effects of specific drugs. This model reproduces the expected effects of three types of drugs with modifications of up to two parameters. The model also reproduces part of the expected behavior of the animal in the Arena, a different maze, by requiring only small adjustments to reproduce the trajectory of the rat around the walls. It is possible to conclude that this computational model captures elements of the interaction of variables which control the rat behavior in the EPM and how drugs interact with these variables. These elements may also be present in the rat behavior in the Arena. The tools and models presented here offer new paradigms to study rat behavior in the EPM. They can offer new benchmarks to characterize rat behavior and can be used to study the effects of different drugs and their interactions.
|
397 |
Controle e filtragem para sistemas lineares discretos incertos sujeitos a saltos Markovianos / Control and filtering for uncertain discrete-time Markovian jump linear systemsJoão Paulo Cerri 21 June 2013 (has links)
Esta tese de doutorado aborda os projetos robustos de controle e estimativa de estados para Sistemas Lineares sujeitos a Saltos Markovianos (SLSM) de tempo discreto sob a influência de incertezas paramétricas. Esses projetos são desenvolvidos por meio de extensões dos critérios quadráticos clássicos para SLSM nominais. Os critérios de custo quadrático para os SLSM incertos são formulados na forma de problemas de otimização min-max que permitem encontrar a melhor solução para o pior caso de incerteza (máxima influência de incerteza). Os projetos robustos correspondem às soluções ótimas obtidas por meio da combinação dos métodos de funções penalidade e mínimos quadrados regularizados robustos. Duas situações são investigadas: regular e estimar os estados quando os modos de operações são observados; e estimar os estados sob a hipótese de desconhecimento da cadeia de Markov. Estruturalmente, o regulador e as estimativas de estados assemelham-se às respectivas versões nominais. A recursividade é estabelecida em termos de equações de Riccati sem a necessidade de ajuste de parâmetros auxiliares e dependente apenas das matrizes de parâmetros e ponderações conhecidas. / This thesis deals with recursive robust designs of control and state estimates for discretetime Markovian Jump Linear Systems (MJLS) subject to parametric uncertainties. The designs are developed considering extensions of the standard quadratic cost criteria for MJLS without uncertainties. The quadratic cost criteria for uncertain MJLS are formulated in the form of min-max optimization problems to get the best solution for the worst uncertainty case. The optimal robust schemes correspond to the optimal solution obtained by the combination of penalty function and robust regularized least-squares methods. Two cases are investigated: to control and estimate the states when the operation modes are observed; and, to estimate the states when the Markov chain is unobserved. The optimal robust LQR and Kalman-type state estimates resemble the respective nominal versions. The recursiveness is established by Riccati equations in terms of parameter and weighting matrices previously known and without extra offline computations.
|
398 |
Abordagem bayesiana para polinômios fracionáriosCarvalho, Dennison Célio de Oliveira January 2019 (has links)
Orientador: Miriam Harumi Tsunemi / Resumo: Em inúmeras situações práticas a relação entre uma variável resposta e uma ou mais covariáveis é curvada. Dentre as diversas formas de representar esta curvatura, Royston e Altman (1994) propuseram uma extensa famı́lia de funções denominada de Polinômios Fracionários (Fractional Polynomials - FP ). Bové e Held (2011) im- plementaram o paradigma bayesiano para FP sob a suposição de normalidade dos erros. Sua metodologia é fundamentada em uma distribuição a priori hiper − g (Liang et al., 2008), que, além de muitas propriedades assintóticas interessantes, garante uma predição bayesiana de modelos consistente. Nesta tese, compara-se as abordagens clássica e Bayesiana para PF a partir de dados reais disponı́veis na litera- tura, bem como por simulações. Além disso, propõem-se uma abordagem Bayesiana para modelos FPs em que a potência, diferentemente dos métodos usuais, pode as- sumir qualquer valor num determinado intervalo real e é estimada via métodos de simulação HMC (Monte Carlo Hamiltoniano) e MCMC (Métodos de Monte Carlo via Cadeias de Markov). Neste modelo, para o caso de um FP de segunda ordem, ao contrário dos modelos atualmente disponı́veis, apenas uma potência é estimada. Avalia-se este modelo a partir de dados simulados e em dados reais, sendo um deles com transformação de Box-Cox. / Abstract: In many practical situations the relationship between the response variable and one or more covariates is curved. Among the various ways of representing this curvature, Royston and Altman (1994) proposed an extended family of functions called Fractional Polynomials (FP). Bov´e and Held (2011) implemented the Bayesian paradigm for FP on the assumption of error normality. Their methodology is based on a hyperg prior distribution, which, in addition to many interesting asymptotic properties, guarantees a consistent Bayesian model average (BMA). In addition, a Bayesian approach is proposed for FPs models in which power, unlike the usual methods, can obtain any numerical real interval value and is estimated via HMC (Monte Carlo Hamiltonian) and MCMC (Markov chain Monte Carlo). In this model, in the case of a second-order FP, unlike the currently available models, only one power is estimated. This model is evaluated from simulated data and real data, one of them with Box-Cox transformation. / Doutor
|
399 |
[en] QUI-SQUARE CONTROL CHART WITH VARIABLE SAMPLE SIZE TO MONITOR LINEAR PROFILES / [pt] GRÁFICO DE CONTROLE QUI-QUADRADO COM TAMANHO DE AMOSTRA VARIÁVEL PARA MONITORAMENTO DE PERFIS LINEARESRODRIGO OTAVIO SANTOS VON DOELLINGER 03 April 2019 (has links)
[pt] O monitoramento de perfis é utilizado para verificar a estabilidade de uma relação funcional envolvendo uma variável resposta e uma ou mais variáveis explicativas ao longo do tempo. Kang e Albin (2000) fizeram uso do gráfico de controle qui-quadrado com parâmetros de projeto fixos para monitorar perfis lineares representados por um modelo de regressão linear simples. Nessa dissertação, com base nos estudos de Kang e Albin (2000), desenvolvemos o gráfico de controle qui-quadrado com tamanho de amostra variável para o monitoramento de um perfil linear. O gráfico proposto monitora o intercepto e o coeficiente de inclinação de um modelo de regressão linear simples, com o uso de amostras com dois tamanhos. O desempenho do gráfico proposto é comparado com o desenvolvido por Kang e Albin (2000). A medida de desempenho utilizada na comparação é o número médio de amostras até um sinal, obtida através de uma análise baseada em cadeias de Markov. Concluímos que é vantajoso utilizar o gráfico de controle qui-quadrado com tamanho de amostra variável. / [en] The monitoring of profiles is used to verify the stability of a functional relationship involving a response variable and one or more explanatory variables over time. Kang and Albin (2000) employed the chi-square control chart with fixed design parameters for monitoring linear profiles represented by a simple linear regression model. Based on the studies of Kang and Albin (2000), we developed the chi-square control chart with variable sample size for monitoring a linear profile. The proposed chart monitors the intercept and slope coefficient of a simple linear regression model, using two different sample sizes. The performance of the graph developed by Kang and Albin (2000) and the one presented here is compared. The average run length, obtained through a Markov chain, was used as performance measure to compare the two charts. We
conclude that it is advantageous to use the chi-square control chart with variable sample size.
|
400 |
Assessment of carbon sequestration and timber production of Scots pine across Scotland using the process-based model 3-PGNXenakis, Georgios January 2007 (has links)
Forests are a valuable resource for humans providing a range of products and services such as construction timber, paper and fuel wood, recreation, as well as living quarters for indigenous populations and habitats for many animal and bird species. Most recent international political agreements such as the Kyoto Protocol emphasise the role of forests as a major sink for atmospheric carbon dioxide mitigation. However, forest areas are rapidly decreasing world wide. Thus, it is vital that efficient strategies and tools are developed to encourage sustainable ecosystem management. These tools must be based on known ecological principles (such as tree physiological and soil nutrient cycle processes), capable of supplying fast and accurate temporal and spatial predictions of the effects of management on both timber production and carbon sequestration. This thesis had two main objectives. The first was to investigate the environmental factors affecting growth and carbon sequestration of Scots pine (Pinus sylvestris L.) across Scotland, by developing a knowledge base through a statistical analysis of old and novel field datasets. Furthermore, the process-based ecosystem model 3-PGN was developed, by coupling the existing models 3-PG and ICBM. 3-PGN calibrated using a Bayesian approach based on Monte Carlo Markov Chain simulations and it was validated for plantation stands. Sensitivity and uncertainty analyses provided an understanding of the internal feedbacks of the model. Further simulations gave a detailed eco-physiological interpretation of the environmental factors affecting Scots pine growth and it provided an assessment of carbon sequestration under the scenario of sustainable, normal production and its effects from the environment. Finally, the study investigated the spatial and temporal patterns of timber production and carbon sequestration by using the spatial version of the model and applying advanced spatial analyses techniques. The second objective was to help close the gap between environmental research and forest management, by setting a strategic framework for a process-based tool for sustainable ecosystem management. The thesis demonstrated the procedures for a site classification scheme based on modelling results and a yield table validation procedure, which can provide a way forward in supporting policies for forest management and ensuring their continued existence in the face of the present and future challenges.
|
Page generated in 0.0323 seconds