Spelling suggestions: "subject:"probabilística""
41 |
Desenvolvimento e implantação de sistema para a gestão da informação e vigilância de anomalias congênitas no Brasil / Development and implementation of a system for information management and surveillance of congenital anomalies in BrazilVieira, Ananda Amorim 13 February 2017 (has links)
Anomalia congênita (AC) é causada por alterações morfológicas e/ou funcionais ocasionada no desenvolvimento embrionário ou fetal devido a fatores genéticos, ambientais, multifatoriais ou desconhecidos. A detecção pode ser no período pré-natal, no recém-nascido ou posteriormente. Estudos recentes indicam que de 2% a 3% de todos os nascidos vivos no mundo apresentam AC. Alguns autores afirmam que no Brasil elas constituem a segunda causa de mortalidade infantil, com 11,2%. Particularmente, o país conta com sistemas de bancos de dados em saúde com informações sobre anomalias congênitas. Dentre estes sistemas, temos três que se destacam: o Sistema de Informações Hospitalares do SUS (SIH), o Sistema de Informações sobre Nascidos Vivos (SINASC) e o Sistema de Informações sobre Mortalidade (SIM). Todos são obtidos através do site do Departamento de Informática do Sistema Único de Saúde (DATASUS). Todavia, esses sistemas, de maneira isolada, não fornecem uma visão clara tanto da epidemiologia das anomalias congênitas, quanto dos indivíduos com esse agravo, se ao terem nascidos foram tratados ou em decorrência dela faleceram. Diante deste cenário, neste projeto tem-se por objetivo principal apresentar o sistema de vigilância de AC utilizando estas bases públicas com intuito de monitorar as anomalias no Brasil, mapeando os nascimentos, internações e óbitos. Este sistema tornou-se o Portal de Monitoramento de AC (PMAC), com dados que abrangem o período de janeiro 2001 a dezembro 2011. Ele conta com ferramentas que correspondem aos módulos de auditoria automática, que verifica subnotificações e inconsistência, módulos de análises epidemiológicas contendo incidência, fluxo de migração e coeficientes de mortalidade (infantil, perinatal, neonatal e segundo causas por AC). Este estudo também traz a realização da técnica do relacionamento probabilístico com a integração dos sistemas SINASC, SIH e SIM, que formaram um banco contribuindo com informações de rastreabilidade dos registros com anomalias, além de apresentar os resultados satisfatórios dos testes caixa-preta junto com a aplicação da técnica de avaliação heurística, realizados por usuários para avaliar a usabilidade do portal. Por fim, ressalta-se que o portal é dinâmico, e a manipulação dos dados por meio do acesso dos usuários a análises de cunho epidemiológico, em diversas agregações, permite auxiliar a gestão das informações, promover reflexões em torno desta temática, incentivar mais estudos e pesquisas, bem como prover recursos e apoiar medidas sociais e políticas para assistir os indivíduos acometidos por AC, suas famílias e a comunidade / Congenital anomaly (AC) is caused by morphological and / or functional alterations originated during embryonic or fetal development due to genetic, environmental, multifactorial or unknown factors. Detection may happen in the prenatal period, in the newborn or later. Recent studies indicate that AC is present in about 2% to 3% of all live births worldwide. Some authors affirm that in Brazil they are the second cause of infant mortality, with around 11.2%. In particular, Brazil has health databases systems with information about congenital anomalies. Among these systems we have three that stand out: the Hospital Information System of SUS (SIH), the Live Birth Information System (SINASC) and Mortality Information System (SIM). All of which can be obtained through the Informatics of public Health System Department\'s website (DATASUS). However, these systems in isolation do not provide a clear view both of the epidemiology of congenital anomalies as well as the individuals with this birth defect be treated or it result of their death. In this scenario, the main objective of this project is to present an AC surveillance system that uses these public databases to monitor the anomalies in Brazil by mapping births, hospitalizations and deaths. This system became the Portal of Monitoring of AC (PMAC), with data that cover the period from January 2001 to December 2011, with tools that correspond to the modules of automatic audit that verifies under notifications and inconsistency, modules of epidemiological analyzes containing incidence, migration flow and mortality coefficients (infant, perinatal, neonatal and second AC causes). This study also used the probabilistic linkage technique with an integration of the SINASC, SIH and SIM systems to build a database contributing with traceable information for the records with anomalies. In addition is presented satisfactory results for black box tests along with the portal usability evaluation performed with users through heuristic evaluation technique. Finally, it should be noted that the portal is dynamic offering options like user access to data manipulation through epidemiological analyzes in diverse aggregations. It helps to manage information, promote reflections around this theme, encourage further studies and research, as well as provide resources and support social and political measures to assist individuals affected by AC, their families and the community
|
42 |
Letramento probabilístico no Ensino Médio: um estudo de invariantes operatórios mobilizados por alunosCaberlim, Cristiane Candido Luz 18 March 2015 (has links)
Made available in DSpace on 2016-04-27T16:57:36Z (GMT). No. of bitstreams: 1
Cristiane Candido Luz Caberlim.pdf: 1224596 bytes, checksum: 30f0bfb460f189e74563254c547baede (MD5)
Previous issue date: 2015-03-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The Subject in which this research was developed is the development of the learning
process of the probability. For this, we search the subjects of official documents and
researches that addressed the teaching or the learning of probability, and we realize
its growing withing mathematics education s field, confirming our hypotheses about
the relevance of develop a research in this subject. In this context, we formulate our
goal that s diagnose invariant operative mobilized by students. In situation of
troubleshooting, and to seek elements that allowing a proposal for a concept of
building model (learning evolution model). The work developed trying to relate the
identified operative invariant with the elements of probabilistic literacy when learning
of probability mobilizes elements of geometric probability, articulating the classical
approach and the frequentist approach to probability. To achieve the goal, we
formulated the following research question: Which literacy probabilistic elements
identified in mobilizing operative invariants by third grade of high school
students to solve problems that articulate the classical approach and the
frequentist concepto f probability? Claving to answer this question, We Will use
the theory of conceptual fields linking it with the principles of probabilistic literacy. As
a research methodology chose the case study. Our sequence comprises three
adapted teaching situations developed earlier research, in our research group, called
A Bernoulli urn , B Pixels urn and C Franc-Carreau game and these
situations were applied to a group of student volunteers attending the third high
school of a private school in São Paulo. The analysis of the protocols built allowed us
to identify students mobilized operative invariants allowing estimate the probability,
articulating the classical approach and frequentist, confirming development of
probabilistic assumptions literacy. Reported proportions via an own speech,
transiting the concrete domains and pseudo-concrete. No student has achieved the
full probabilistic literacy, that supposed to problem solving in the abstract domain,
under the proposed scheme for a process of abstraction to be followed during
learning / O tema no qual esta pesquisa se desenvolveu é o desenvolvimento do processo de
aprendizagem da probabilidade. Para tal, buscamos primeiramente os conteúdos de
documentos oficiais e pesquisas que abordaram o ensino ou a aprendizagem da
probabilidade, e percebemos o seu crescimento dentro do campo da Educação
Matemática, confirmando nossas hipóteses sobre a relevância de se desenvolver
uma pesquisa nesse tema. Neste contexto, formulamos nosso objetivo que é
diagnosticar invariantes operatórios mobilizados pelos alunos em situação de
resolução de problemas, para que busquemos elementos que permitam uma
proposta de modelo de construção de conceito (modelo de evolução de
aprendizagem). O trabalho se desenvolveu buscando relacionar os invariantes
operatórios identificados com os elementos do letramento probabilístico quando a
aprendizagem da probabilidade mobiliza elementos da probabilidade geométrica,
articulando o enfoque clássico e o enfoque frequentista da probabilidade. Para
alcançarmos tal objetivo, formulamos a seguinte questão de pesquisa: Que
elementos do letramento probabilístico identificamos na mobilização de
invariantes operatórios por alunos do 3º ano do Ensino Médio ao resolver
problemas que articulam o enfoque clássico e frequentista do conceito de
probabilidade? Almejando responder a essa questão, utilizaremos a Teoria dos
Campos Conceituais articulando-a com os princípios do letramento probabilístico.
Como metodologia de pesquisa escolhemos o estudo de caso. Nossa sequência é
composta por três situações didáticas adaptadas de pesquisa anterior desenvolvida
em nosso grupo de pesquisa, denominadas A-Urna de Bernoulli , B-Urna de
Pixels e C-O jogo Franc-Carreau e estas situações foram aplicadas a um grupo de
alunos voluntários, cursando o terceiro ano do Ensino Médio de uma escola da rede
privada da cidade de São Paulo. A análise dos protocolos construídos nos permitiu
identificar que os alunos mobilizaram invariantes operatórios que permitiam estimar
a probabilidade, articulando o enfoque clássico e frequentista, confirmando hipótese
de desenvolvimento do letramento probabilístico. Descreveram proporções e por
meio de um discurso próprio, transitando pelos domínios concreto e pseudoconcreto.
Nenhum aluno atingiu o letramento probabilístico pleno, que supunha a
resolução de problemas no domínio abstrato, segundo o esquema proposto para um
processo de abstração a ser percorrido durante a aprendizagem
|
43 |
Planejamento probabilístico como busca num espaço de transição de estados / Probabilistic planning as search within transition state-space.Casani Delgado, Daniel Javier 04 February 2013 (has links)
Um dos modelos mais usados para descrever problemas de planejamento probabilístico, i.e., planejamento de ações com efeitos probabilísticos, é o processo de decisão markoviano (Markov Decision Process - MDP). Soluções tradicionais são baseadas em programação dinâmica, sendo as mais ecientes aquelas baseadas em programação dinâmica em tempo real (Real-Time Dynamic Programming - RTDP), por explorarem somente os estados alcançáveis a partir de um dado estado inicial. Por outro lado, existem soluções ecientes baseadas em métodos de busca heurística em um grafo AND/OR, sendo que os nós AND representam os efeitos probabilísticos das ações e os nós OR representam as escolhas de ações alternativas. Tais soluções também exploram somente estados alcançáveis a partir de um estado inicial porém, guardam um subgrafo solução parcial e usam programação dinâmica para a atualização do custo dos nós desse subgrafo. No entanto, problemas com grandes espaços de estados limitam o uso prático desses métodos. MDPs fatorados permitem explorar a estrutura do problema, representando MDPs muito grandes de maneira compacta e assim, favorecer a escalabilidade das soluções. Neste trabalho, apresentamos uma análise comparativa das diferentes soluções para MDPs, com ênfase naquelas que fazem busca heurística e as comparamos com soluções baseadas em programação dinâmica assíncrona, consideradas o estado da arte das soluções de MPDs. Além disso, propomos um novo algoritmo de busca heurística para MDPs fatorados baseado no algoritmo ILAO* e o testamos nos problemas da competição de planejamento probabilístico IPPC-2011. / One of the most widely used models to describe probabilistic planning problems, i.e., planning of actions with probabilistic eects, is the Markov Decision Process - MDP. The traditional solutions are based on dynamic programming, whereas the most ecient solutions are based on Real-Time Dynamic Programming - RTDP, which explore only the reachable states from a given initial state. Moreover, there are ecient solutions based on search methods in a AND/OR graph, where AND nodes represent the probabilistic eects of an action and OR nodes represent the choices of alternative actions. These solutions also explore only reachable states but maintain the parcial subgraph solution, using dynamic programming for updating the cost of nodes of these subgraph. However, problems with large state spaces limit the practical use of these methods. Factored representation of MDPs allow to explore the structure of the problem, and can represent very large MDPs compactly and thus improve the scalability of the solutions. In this dissertation, we present a comparative analysis of dierent solutions for MDPs, with emphasis on heuristic search methods. We compare the solutions which are based on asynchronous dynamic programming which are also considered the state of the art. We also propose a new factored algorithm based on the search algorithm ILAO*. It is also tested by using the problems of the International Probabilistic Planning Competition IPPC-2011.
|
44 |
Navegação robótica relacional baseada em web considerando incerteza na percepção. / Web-based relational robot navigation under uncertain perception.Walter Mauricio Mayor Toro 04 November 2014 (has links)
Quando um robô autônomo tenta resolver as tarefas de navegação dentro de um ambiente real interno usando relações qualitativas, vários problemas aparecem tais como observação parcial do ambiente e percepção incerta. Isso ocorre porque os sensores do robô não proporcionam informação suficiente para perceber completamente as situações do ambiente, além de incorporarem ruído no processo. A web semântica dota o robô autônomo com a habilidade de obter conhecimento de senso comum extraído da web, conhecimento este que os sensores do robô não podem proporcionar. Porém, nem sempre é fácil levar efetivamente estes recursos semânticos da web ao uso prático. Neste trabalho, foi examinado o uso de recursos semânticos da web na navegação robótica; mais especificamente, em uma navegação qualitativa onde o raciocínio incerto desempenha um papel significativo. Nós avaliamos o uso de uma representação relacional; particularmente, na combinação da informação semântica web e dos dados de baixo nível proporcionados pelos sensores, permitindo uma descrição de objetos e das relações entre os mesmos. Esta representação também permite o uso de abstração e generalização das situações do ambiente. Este trabalho propõe a arquitetura Web-based Relational Robotic Architecture (WRRA )para navegação robótica que combina os dados de baixo nível dos sensores do robô e os recursos web semânticos existentes baseados em lógica descritiva probabilística, como aprendizagem e planejamento relacional probabilístico. Neste trabalho, mostramos os benefícios desta arquitetura em um robô simulado, apresentando um estudo de caso sobre como os recursos semânticos podem ser usados para lidar com a incerteza da localização e o mapeamento em um problema prático. / When an autonomous robot attempts to solve navigation tasks in a qualitative relational way within a real indoor environments, several problems appear such as partial observation of the environment, and uncertain perception, since the robots sensors do not provide enough information to perceive completely the environment situations, besides the sensors incorporate noise in the process. The semantic web information endows the autonomous robot with the ability to obtain common sense knowledge from the web that the robot\'s sensors cannot provide. However, it is not always easy to effectively bring these semantic web resources into practical use. In this work, we examine the use of semantic web resources in robot navigation; more specifically, in qualitative navigation where uncertain reasoning plays a significant role. We evaluate the use of a relational representation; particularly, in the combination of the semantic web and the low-level data sensor information, which allows a description of relationships among objects. This representation also allows the use of abstraction and generalization of the environment situations. This work proposes the framework Web-based Relational Robotic Architecture WRRA for robot navigation that connects the low-level data from robot\'s sensors and existing semantic web resources based on probabilistic description logics, with probabilistic relational learning and planning. We show the benefits of this framework in a simulated robot, presenting a case study on how semantic web resources can be used to face location and mapping uncertain in a practical problem.
|
45 |
Curto-circuito probabilístico através da simulação de Monte Carlo para sistemas de transmissão em corrente contínua / Probabilistic short-circuit using Monte Carlo simulations in direct current transmission systemsGuacira Costa de Oliveira 08 September 2015 (has links)
A transmissão de energia em corrente contínua, a partir de conversores fonte de tensão, é oportuna ao progresso do sistema elétrico de potência e tem permitido vantajosas aplicações. Muito se dá, devido ao emprego na conexão de sistemas com frequências distintas, além da redução de perdas na transmissão, provida pelas características operacionais destes. VSCs também promovem o controle do fluxo de potência, possibilitando uma efetiva contextualização no âmbito das redes inteligentes. Diante deste cenário, este estudo pretende construir um perfil de corrente através do Cálculo de Curto-Circuito Probabilístico, que emprega a Simulação de Monte Carlo, para prover as informações ao desenvolvimento de projetos de equipamentos, ajustes da proteção e controle de sistemas de transmissão em corrente contínua. A Simulação de Monte Carlo requer muitas iterações, tendo um custo computacional elevado. Se forem executadas em programas comerciais, exige um tempo elevado para leitura dos sinais em arquivos. Devido a isso, um programa de código livre usando linguagem C++, foi desenvolvido para possibilitar acesso aos sinais de interesse ainda em memória, reduzindo desta forma o tempo computacional. Além disso, para melhorar a performance, foram usadas técnicas de processamento paralelo e de computação em nuvem. Desta forma, este estudo contribui com informações indispensáveis ao projeto de equipamentos de proteção dos sistemas de transmissão em corrente contínua de forma a cooperar com o desenvolvimento consistente desta tecnologia. / Transmitting electrical power in direct current using a VSC is suitable for the progress of these systems and has remarkable and advantageous applications. This happens in order to connect two systems with distinct frequencies. This type of line is also used in the reduction of losses in transmission over long distances, provided by their operating characteristics. These converters also promote the control of power flow between distinct generation units, making them effective in the context of Smart Grids. Based on this, the purpose of this research is to construct a profile of a current using a Probabilistic Short-Circuit Analysis by Monte Carlo Simulation to provide basic data to the optimum development of design equipment in protection and control. The Monte Carlo Simulation requires many iterations to find an optimal result. An open source program using C++ language was developed to describe all the system models variables in order to decrease the computation time, as it is time consuming to read signals stored on a disk using commercial software. Moreover, in order to lower computation costs, parallel process techniques and cloud computing were used. Therefore, this study contributes to the literature by providing essential information for designing equipment for Direct Current transmission protection systems.
|
46 |
Desenvolvimento e implantação de sistema para a gestão da informação e vigilância de anomalias congênitas no Brasil / Development and implementation of a system for information management and surveillance of congenital anomalies in BrazilAnanda Amorim Vieira 13 February 2017 (has links)
Anomalia congênita (AC) é causada por alterações morfológicas e/ou funcionais ocasionada no desenvolvimento embrionário ou fetal devido a fatores genéticos, ambientais, multifatoriais ou desconhecidos. A detecção pode ser no período pré-natal, no recém-nascido ou posteriormente. Estudos recentes indicam que de 2% a 3% de todos os nascidos vivos no mundo apresentam AC. Alguns autores afirmam que no Brasil elas constituem a segunda causa de mortalidade infantil, com 11,2%. Particularmente, o país conta com sistemas de bancos de dados em saúde com informações sobre anomalias congênitas. Dentre estes sistemas, temos três que se destacam: o Sistema de Informações Hospitalares do SUS (SIH), o Sistema de Informações sobre Nascidos Vivos (SINASC) e o Sistema de Informações sobre Mortalidade (SIM). Todos são obtidos através do site do Departamento de Informática do Sistema Único de Saúde (DATASUS). Todavia, esses sistemas, de maneira isolada, não fornecem uma visão clara tanto da epidemiologia das anomalias congênitas, quanto dos indivíduos com esse agravo, se ao terem nascidos foram tratados ou em decorrência dela faleceram. Diante deste cenário, neste projeto tem-se por objetivo principal apresentar o sistema de vigilância de AC utilizando estas bases públicas com intuito de monitorar as anomalias no Brasil, mapeando os nascimentos, internações e óbitos. Este sistema tornou-se o Portal de Monitoramento de AC (PMAC), com dados que abrangem o período de janeiro 2001 a dezembro 2011. Ele conta com ferramentas que correspondem aos módulos de auditoria automática, que verifica subnotificações e inconsistência, módulos de análises epidemiológicas contendo incidência, fluxo de migração e coeficientes de mortalidade (infantil, perinatal, neonatal e segundo causas por AC). Este estudo também traz a realização da técnica do relacionamento probabilístico com a integração dos sistemas SINASC, SIH e SIM, que formaram um banco contribuindo com informações de rastreabilidade dos registros com anomalias, além de apresentar os resultados satisfatórios dos testes caixa-preta junto com a aplicação da técnica de avaliação heurística, realizados por usuários para avaliar a usabilidade do portal. Por fim, ressalta-se que o portal é dinâmico, e a manipulação dos dados por meio do acesso dos usuários a análises de cunho epidemiológico, em diversas agregações, permite auxiliar a gestão das informações, promover reflexões em torno desta temática, incentivar mais estudos e pesquisas, bem como prover recursos e apoiar medidas sociais e políticas para assistir os indivíduos acometidos por AC, suas famílias e a comunidade / Congenital anomaly (AC) is caused by morphological and / or functional alterations originated during embryonic or fetal development due to genetic, environmental, multifactorial or unknown factors. Detection may happen in the prenatal period, in the newborn or later. Recent studies indicate that AC is present in about 2% to 3% of all live births worldwide. Some authors affirm that in Brazil they are the second cause of infant mortality, with around 11.2%. In particular, Brazil has health databases systems with information about congenital anomalies. Among these systems we have three that stand out: the Hospital Information System of SUS (SIH), the Live Birth Information System (SINASC) and Mortality Information System (SIM). All of which can be obtained through the Informatics of public Health System Department\'s website (DATASUS). However, these systems in isolation do not provide a clear view both of the epidemiology of congenital anomalies as well as the individuals with this birth defect be treated or it result of their death. In this scenario, the main objective of this project is to present an AC surveillance system that uses these public databases to monitor the anomalies in Brazil by mapping births, hospitalizations and deaths. This system became the Portal of Monitoring of AC (PMAC), with data that cover the period from January 2001 to December 2011, with tools that correspond to the modules of automatic audit that verifies under notifications and inconsistency, modules of epidemiological analyzes containing incidence, migration flow and mortality coefficients (infant, perinatal, neonatal and second AC causes). This study also used the probabilistic linkage technique with an integration of the SINASC, SIH and SIM systems to build a database contributing with traceable information for the records with anomalies. In addition is presented satisfactory results for black box tests along with the portal usability evaluation performed with users through heuristic evaluation technique. Finally, it should be noted that the portal is dynamic offering options like user access to data manipulation through epidemiological analyzes in diverse aggregations. It helps to manage information, promote reflections around this theme, encourage further studies and research, as well as provide resources and support social and political measures to assist individuals affected by AC, their families and the community
|
47 |
Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial / Probabilistic risk-sensitive planning with ILAO* and exponential utility functionFreitas, Elthon Manhas de 18 October 2018 (has links)
Os processos de decisão de Markov (Markov Decision Process - MDP) têm sido usados para resolução de problemas de tomada de decisão sequencial. Existem problemas em que lidar com os riscos do ambiente para obter um resultado confiável é mais importante do que maximizar o retorno médio esperado. MDPs que lidam com esse tipo de problemas são chamados de processos de decisão de Markov sensíveis a risco (Risk-Sensitive Markov Decision Process - RSMDP). Dentre as diversas variações de RSMDP, estão os trabalhos baseados em utilidade exponencial que utilizam um fator de risco, o qual modela a atitude a risco do agente e que pode ser propensa ou aversa. Os algoritmos existentes na literatura para resolver esse tipo de RSMDPs são ineficientes se comparados a outros algoritmos de MDP. Neste projeto, é apresentada uma solução que pode ser usada em problemas maiores, tanto por executar cálculos apenas em estados relevantes para atingir um conjunto de estados meta partindo de um estado inicial, quanto por permitir processamento de números com expoentes muito elevados para os ambientes computacionais atuais. Os experimentos realizados evidenciam que (i) o algoritmo proposto é mais eficiente, se comparado aos algoritmos estado-da-arte para RSMDPs; e (ii) o uso da técnica LogSumExp permite resolver o problema de trabalhar com expoentes muito elevados em RSMDPs. / Markov Decision Process (MDP) has been used very efficiently to solve sequential decision-making problems. There are problems where dealing with environmental risks to get a reliable result is more important than maximizing the expected average return. MDPs that deal with this type of problem are called risk-sensitive Markov decision processes (RSMDP). Among the several variations of RSMDP are the works based on exponential utility that use a risk factor, which models the agent\'s risk attitude that can be prone or averse. The algorithms in the literature to solve this type of RSMDPs are inefficient when compared to other MDP algorithms. In this project, a solution is presented that can be used in larger problems, either by performing calculations only in relevant states to reach a set of meta states starting from an initial state, or by allowing the processing of numbers with very high exponents for the current computational environments. The experiments show that (i) the proposed algorithm is more efficient when compared to state-of-the-art algorithms for RSMDPs; and (ii) the LogSumExp technique solves the problem of working with very large exponents in RSMDPs
|
48 |
Planejamento probabilístico usando programação dinâmica assíncrona e fatorada / Probabilistic planning using asynchronous and factored dynamic programming.Holguin, Mijail Gamarra 03 April 2013 (has links)
Processos de Decisão Markovianos (Markov Decision Process - MDP) modelam problemas de tomada de decisão sequencial em que as possíveis ações de um agente possuem efeitos probabilísticos sobre os estados sucessores (que podem ser definidas por matrizes de transição de estados). Programação dinâmica em tempo real (Real-time dynamic programming - RTDP), é uma técnica usada para resolver MDPs quando existe informação sobre o estado inicial. Abordagens tradicionais apresentam melhor desempenho em problemas com matrizes esparsas de transição de estados porque podem alcançar eficientemente a convergência para a política ótima, sem ter que visitar todos os estados. Porém essa vantagem pode ser perdida em problemas com matrizes densas de transição, nos quais muitos estados podem ser alcançados em um passo (por exemplo, problemas de controle com eventos exógenos). Uma abordagem para superar essa limitação é explorar regularidades existentes na dinâmica do domínio através de uma representação fatorada, isto é, uma representação baseada em variáveis de estado. Nesse trabalho de mestrado, propomos um novo algoritmo chamado de FactRTDP (RTDP Fatorado), e sua versão aproximada aFactRTDP (RTDP Fatorado e Aproximado), que é a primeira versão eficiente fatorada do algoritmo clássico RTDP. Também propomos outras 2 extensões desses algoritmos, o FactLRTDP e aFactLRTDP, que rotulam estados cuja função valor convergiu para o ótimo. Os resultados experimentais mostram que estes novos algoritmos convergem mais rapidamente quando executados em domínios com matrizes de transição densa e tem bom comportamento online em domínios com matrizes de transição densa com pouca dependência entre as variáveis de estado. / Markov Decision Process (MDP) model problems of sequential decision making, where the possible actions have probabilistic effects on the successor states (defined by state transition matrices). Real-time dynamic programming (RTDP), is a technique for solving MDPs when there exists information about the initial state. Traditional approaches show better performance in problems with sparse state transition matrices, because they can achieve the convergence to optimal policy efficiently, without visiting all states. But, this advantage can be lose in problems with dense state transition matrices, in which several states can be achieved in a step (for example, control problems with exogenous events). An approach to overcome this limitation is to explore regularities existing in the domain dynamics through a factored representation, i.e., a representation based on state variables. In this master thesis, we propose a new algorithm called FactRTDP (Factored RTDP), and its approximate version aFactRTDP (Approximate and Factored RTDP), that are the first factored efficient versions of the classical RTDP algorithm. We also propose two other extensions, FactLRTDP and aFactLRTDP, that label states for which the value function has converged to the optimal. The experimental results show that when these new algorithms are executed in domains with dense transition matrices, they converge faster. And they have a good online performance in domains with dense transition matrices and few dependencies among state variables.
|
49 |
The statistical paradigm: probabilistic and multivariate analysis applied through computational simulation in the interaction between genotype x environment / O paradigma estatístico: análise probabilística e multivariada aplicadas via simulação computacional no contexto da interação genótipo ambienteSarti, Danilo Augusto 05 August 2019 (has links)
Statistical analysis is based on an elementary paradigm and the relationship between probabilistic inductive inference, generation and validation of models, and the use of such information in decisions within a specific domain of knowledge. Additionally, techniques can be used to design specific experiments, such as the multi-environmental trials MET, to study the interaction between genotypes and environments. The fitting of probability distributions to data from phenomena allows the knowledge of the behavior of random variables and the later usage of such models in computational simulation. This procedure was carried out in the adjustment of models for maize grains weight, obtained via multi environmental trials. Several methods of adjustment of distribution and mixtures of normal distributions by the EM algorithm were used. The data were obtained through the use of scrapping with software R. Adjusted models were used to simulate, through computational methods implemented in language R, data with behavior known in parametric terms, generating a table that simulates the interaction between genotype and environment factors. Such simulated data were used to verify and compare models based on multivariate analysis, namely AMMI, weighted AMMI and GGE for the study of genotype environment interaction GxE. The results demonstrated the great effectiveness of the models in capturing the properties of the simulated data, contextualizing them as informational tools in the development of new products. / A estatística fundamenta-se em um paradigma elementar, baseado na relação entre a inferência indutiva probabilística, geração e validação de modelos e o uso de tais informações como subsídio em decisões em um domínio específico de conhecimento. Aliado a isso, técnicas podem ser utilizadas para delinear tipos específicos de experimentos, como os ensaios multi ambientais MET para estudos de interação entre genótipos e ambientes. O ajuste de distribuição de probabilidades a dados provenientes de fenômenos permite o conhecimento do comportamento de variáveis aleatórias e posterior uso de tais modelos em simulação computacional. Tal procedimento foi realizado no ajuste de modelos para peso de grãos de genótipos de milho em ensaios multi ambientais, através de diversos métodos de ajuste de distribuição e mixturas de distribuições normais pelo algoritmo EM. Os dados foram obtidos através do uso de scrapping via software R. Por sua vez, os modelos ajustados foram utilizados para simular, através de métodos computacionais implementados em linguagem R, dados com comportamento conhecido em termos paramétricos, através de uma tabela que simula a interação entre os fatores genótipo e ambiente. Tais dados simulados foram utilizados para verificar, e comparar os modelos baseados em análise multivariada de dados, a saber AMMI, AMMI ponderado e GGE, para o estudo da interação genótipo ambiente (GxE). Os resultados demonstraram a grande efetividade dos modelos em captar as propriedades dos dados simulados, contextualizando-os como ferramentas informacionais no desenvolvimento de novos produtos.
|
50 |
Algoritmos assíncronos de iteração de política para Processos de Decisão Markovianos com Probabilidades Intervalares / Asynchronous policy iteration algorithms for Bounded-parameter Markov Decision ProcessesReis, Willy Arthur Silva 02 August 2019 (has links)
Um Processo de Decisão Markoviano (MDP) pode ser usado para modelar problemas de decisão sequencial. No entanto, podem existir limitações na obtenção de probabilidades para modelagem da transição de estados ou falta de confiabilidade nas informações existentes sobre estas probabilidades. Um modelo menos restritivo e que pode resolver este problema é o Processo de Decisão Markoviano com Probabilidades Intervalares (BMDP), que permite a representação imprecisa das probabilidades de transição de estados e raciocínio sobre uma solução robusta. Para resolver BMDPs de horizonte infinito, existem os algoritmos síncronos de Iteração de Valor Intervalar e Iteração de Política Robusto, que são ineficientes quando o tamanho do espaço de estados é grande. Neste trabalho são propostos algoritmos assíncronos de Iteração de Política baseados no particionamento do espaço de estados em subconjuntos aleatórios (Robust Asynchronous Policy Iteration - RAPI) ou em componentes fortemente conexos (Robust Topological Policy Iteration - RTPI). Também são propostas formas de inicializar a função valor e a política dos algoritmos, de forma a melhorar a convergência destes. O desempenho dos algoritmos propostos é avaliado em comparação com o algoritmo de Iteração de Política Robusto para BMDPs para domínios de planejamento existentes e um novo domínio proposto. Os resultados dos experimentos realizados mostram que (i) quanto mais estruturado é o domínio, melhor é o desempenho do algoritmo RTPI; (ii) o uso de computação paralela no algoritmo RAPI possui um pequeno ganho computacional em relação à sua versão sequencial; e (iii) uma boa inicialização da função valor e política pode impactar positivamente o tempo de convergência dos algoritmos. / A Markov Decision Process (MDP) can be used to model sequential decision problems. However, there may be limitations in obtaining probabilities for state transition modeling or lack of reliability in existing information on these probabilities. A less restrictive model that can solve this problem is the Bounded-parameter Markov Decision Process (BMDP), which allows the imprecise representation of the transition probabilities and reasoning about a robust solution. To solve infinite horizon BMDPs, there are synchronous algorithms such as Interval Value Iteration and Robust Policy Iteration, which are inefficient for large state spaces. In this work, we propose new asynchronous Policy Iteration algorithms based on state space partitioning in random subsets (Robust Asynchronous Policy Iteration - RAPI) or in strongly connected components (Robust Topological Policy Iteration - RTPI). We also propose ways to initialize the value function and policy of the algorithms, in order to improve their convergence. The performance of the proposed algorithms is evaluated in comparison with the Robust Policy Iteration algorithm for BMDPs for existing planning domains and a proposed new domain. The results of the experiments show that (i) the more structured the domain, the better is the performance of the RTPI algorithm; (ii) the use of parallel computing in the RAPI algorithm has a small computational gain compared to its sequential version; and (iii) a good initialization of the value function and policy can positively impact the convergence time of the algorithms.
|
Page generated in 0.0951 seconds