Spelling suggestions: "subject:"redes bayesiana"" "subject:"redes bayesian""
41 |
Arquitetura para avaliação de ameaças em cenários com alvos manobráveis baseada em fusão de dadosJosé Fernando Basso Brancalion 07 August 2015 (has links)
O presente trabalho propõe uma arquitetura para um sistema de fusão de dados de alto nível, aplicado em atividades de monitoração e defesa do espaço aéreo. Com base nesta arquitetura são integradas ferramentas computacionais que processam a informação disponibilizada por diversas fontes de informação, fornecendo a consciência situacional do cenário para os operadores do sistema de monitoração e vigilância. Os agentes presentes no cenário são identificados e classificados de acordo com o seu grau de ameaça a um determinado recurso que se deseja proteger. Em ambientes onde há a presença de muitos agentes, carregados de informação afetada por incertezas, o ser humano pode não ser capaz de agir no tempo adequado e com a melhor consciência situacional, sendo induzido a tomar decisões equivocadas. A presença de um sistema que auxilie o decisor pode aumentar a sua capacidade de cognição e ajudá-lo no processo decisório. O processo de análise de ameaças e intenções dos agentes presentes no cenário é indispensável para a construção de tais sistemas. O modelo proposto neste trabalho possui um mecanismo de análise de ameaças, que realiza dinamicamente e em tempo real, a classificação dos agentes, determina o grau de ameaça representado por cada um e infere o tipo de missão desempenhada por eles, através da utilização de Redes Bayesianas. O modelo também incorpora uma ferramenta de planejamento, que auxilia o operador do sistema de monitoração no processo de tomada de decisão, através da proposição de ações que devem ser seguidas para combater os agentes classificados como ameaças pelo mecanismo de análise descrito anteriormente. Esta pesquisa explora os níveis 1, 2 e 3 do modelo de Fusão de Dados proposto pelo Joint Directors of Laboratories (JDL) Working Group e fornece ferramentas para a execução do ciclo Observar, Orientar, Decidir, Agir (OODA). A validação da arquitetura proposta e das técnicas desenvolvidas foi realizada com dados simulados fornecidos por uma ferramenta de geração de cenários, desenvolvida neste trabalho.
|
42 |
A data-driven solution for root cause analysis in cloud computing environments. / Uma solução guiada por dados de análise de causa raiz em ambiente de computação em nuvem.Pereira, Rosangela de Fátima 05 December 2016 (has links)
The failure analysis and resolution in cloud-computing environments are a a highly important issue, being their primary motivation the mitigation of the impact of such failures on applications hosted in these environments. Although there are advances in the case of immediate detection of failures, there is a lack of research in root cause analysis of failures in cloud computing. In this process, failures are tracked to analyze their causal factor. This practice allows cloud operators to act on a more effective process in preventing failures, resulting in the number of recurring failures reduction. Although this practice is commonly performed through human intervention, based on the expertise of professionals, the complexity of cloud-computing environments, coupled with the large volume of data generated from log records generated in these environments and the wide interdependence between system components, has turned manual analysis impractical. Therefore, scalable solutions are needed to automate the root cause analysis process in cloud computing environments, allowing the analysis of large data sets with satisfactory performance. Based on these requirements, this thesis presents a data-driven solution for root cause analysis in cloud-computing environments. The proposed solution includes the required functionalities for the collection, processing and analysis of data, as well as a method based on Bayesian Networks for the automatic identification of root causes. The validation of the proposal is accomplished through a proof of concept using OpenStack, a framework for cloud-computing infrastructure, and Hadoop, a framework for distributed processing of large data volumes. The tests presented satisfactory performance, and the developed model correctly classified the root causes with low rate of false positives. / A análise e reparação de falhas em ambientes de computação em nuvem é uma questão amplamente pesquisada, tendo como principal motivação minimizar o impacto que tais falhas podem causar nas aplicações hospedadas nesses ambientes. Embora exista um avanço na área de detecção imediata de falhas, ainda há percalços para realizar a análise de sua causa raiz. Nesse processo, as falhas são rastreadas a fim de analisar o seu fator causal ou seus fatores causais. Essa prática permite que operadores da nuvem possam atuar de modo mais efetivo na prevenção de falhas, reduzindo-se o número de falhas recorrentes. Embora essa prática seja comumente realizada por meio de intervenção humana, com base no expertise dos profissionais, a complexidade dos ambientes de computação em nuvem, somada ao grande volume de dados oriundos de registros de log gerados nesses ambientes e à ampla inter-dependência entre os componentes do sistema tem tornado a análise manual inviável. Por esse motivo, torna-se necessário soluções que permitam automatizar o processo de análise de causa raiz de uma falha ou conjunto de falhas em ambientes de computação em nuvem, e que sejam escaláveis, viabilizando a análise de grande volume de dados com desempenho satisfatório. Com base em tais necessidades, essa dissertação apresenta uma solução guiada por dados para análise de causa raiz em ambientes de computação em nuvem. A solução proposta contempla as funcionalidades necessárias para a aquisição, processamento e análise de dados no diagnóstico de falhas, bem como um método baseado em Redes Bayesianas para a identificação automática de causas raiz de falhas. A validação da proposta é realizada por meio de uma prova de conceito utilizando o OpenStack, um arcabouço para infraestrutura de computação em nuvem, e o Hadoop, um arcabouço para processamento distribuído de grande volume de dados. Os testes apresentaram desempenhos satisfatórios da arquitetura proposta, e o modelo desenvolvido classificou corretamente com baixo número de falsos positivos.
|
43 |
Avaliação de redes Bayesianas para imputação em variáveis qualitativas e quantitativas. / Evaluating Bayesian networks for imputation with qualitative and quantitative variables.Magalhães, Ismenia Blavatsky de 29 March 2007 (has links)
Redes Bayesianas são estruturas que combinam distribuições de probabilidade e grafos. Apesar das redes Bayesianas terem surgido na década de 80 e as primeiras tentativas em solucionar os problemas gerados a partir da não resposta datarem das décadas de 30 e 40, a utilização de estruturas deste tipo especificamente para imputação é bem recente: em 2002 em institutos oficiais de estatística e em 2003 no contexto de mineração de dados. O intuito deste trabalho é o de fornecer alguns resultados da aplicação de redes Bayesianas discretas e mistas para imputação. Para isso é proposto um algoritmo que combina o conhecimento de especialistas e dados experimentais observados de pesquisas anteriores ou parte dos dados coletados. Ao empregar as redes Bayesianas neste contexto, parte-se da hipótese de que uma vez preservadas as variáveis em sua relação original, o método de imputação será eficiente em manter propriedades desejáveis. Neste sentido, foram avaliados três tipos de consistências já existentes na literatura: a consistência da base de dados, a consistência lógica e a consistência estatística, e propôs-se a consistência estrutural, que se define como sendo a capacidade de a rede manter sua estrutura na classe de equivalência da rede original quando construída a partir dos dados após a imputação. É utilizada pela primeira vez uma rede Bayesiana mista para o tratamento da não resposta em variáveis quantitativas. Calcula-se uma medida de consistência estatística para redes mistas usando como recurso a imputação múltipla para a avaliação de parâmetros da rede e de modelos de regressão. Como aplicação foram conduzidos experimentos com base nos dados de domicílios e pessoas do Censo Demográfico 2000 do município de Natal e nos dados de um estudo sobre homicídios em Campinas. Dos resultados afirma-se que as redes Bayesianas para imputação em atributos discretos são promissoras, principalmente se o interesse estiver em manter a consistência estatística e o número de classes da variável for pequeno. Já para outras características, como o coeficiente de contingência entre as variáveis, são afetadas pelo método à medida que se aumenta o percentual de não resposta. Nos atributos contínuos, a mediana apresenta-se mais sensível ao método. / Bayesian networks are structures that combine probability distributions with graphs. Although Bayesian networks initially appeared in the 1980s and the first attempts to solve the problems generated from the non-response date back to the 1930s and 1940s, the use of structures of this kind specifically for imputation is rather recent: in 2002 by official statistical institutes, and in 2003 in the context of data mining. The purpose of this work is to present some results on the application of discrete and mixed Bayesian networks for imputation. For that purpose, we present an algorithm combining knowledge obtained from experts with experimental data derived from previous research or part of the collected data. To apply Bayesian networks in this context, it is assumed that once the variables are preserved in their original relation, the imputation method will be effective in maintaining desirable properties. Pursuant to this, three types of consistence which already exist in literature are evaluated: the database consistence, the logical consistence and the statistical consistence. In addition, the structural consistence is proposed, which can be defined as the ability of a network to maintain its structure in the equivalence class of the original network when built from the data after imputation. For the first time a mixed Bayesian network is used for the treatment of the non-response in quantitative variables. The statistical consistence for mixed networks is being developed by using, as a resource, the multiple imputation for evaluating network parameters and regression models. For the purpose of application, some experiences were conducted using simple networks based on data for dwellings and people from the 2000 Demographic Census in the City of Natal and on data from a study on homicides in the City of Campinas. It can be stated from the results that the Bayesian networks for imputation in discrete attributes seem to be promising, particularly if the interest is to maintain the statistical consistence and if the number of classes of the variable is small. Features such as the contingency tables coefficient among variables, on the other hand, are affected by this method as the percentage of non-response increases. The median is more sensitive to this method in continuous attributes.
|
44 |
Processos semi markovianos e redes bayesianas para avaliação de indicadores de desempenho de confiabilidade de sistemas complexos tolerantes à falhaMOURA, Márcio José das Chagas January 2006 (has links)
Made available in DSpace on 2014-06-12T17:41:39Z (GMT). No. of bitstreams: 2
arquivo7326_1.pdf: 1202400 bytes, checksum: a85b1fc731f434bf7654d913dbfa3b5a (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2006 / Petróleo Brasileiro S/A / Neste trabalho, é proposta uma metodologia de modelagem de indicadores de desempenho
de Confiabilidade ((In)Disponibilidade, Confiabilidade, Manutenibilidade) de sistemas
complexos baseada na integração entre processos semi Markovianos (PSMs) e Redes
Bayesianas (RBs). Basicamente, um PSM pode ser entendido como um processo estocástico
no qual as probabilidades de transição dependem do intervalo de tempo decorrido desde o
qual um sistema possui determinadas características.
Já as Redes Bayesianas são estruturas probabilísticas que representam qualitativa e
quantitativamente relações de causa e efeito entre determinadas variáveis aleatórias de
interesse. A integração entre os PSMs e as RBs origina um modelo estocástico híbrido o qual é
capaz de representar a dinamicidade de um sistema ao mesmo tempo em que trata como as
relações de causa e efeito entre fatores não necessariamente temporais influenciam tal
evolução.
Para desenvolver tal modelo híbrido, faz-se necessário propor e formular o método
numérico computacional de resolução das equações de probabilidades de transição dos PSMs
definidos através de taxas de transição as quais são equações integrais do tipo convolução. Tal
método é baseado na aplicação de transformadas de Laplace as quais serão invertidas
utilizando o método de Quadratura Gaussiana conhecido como Gauss Legendre.
Aplicações do modelo híbrido proposto são realizadas em sistemas tolerantes à falha com
o objetivo de avaliar a evolução temporal dos indicadores de desempenho de Confiabilidade
|
45 |
Avaliação de redes Bayesianas para imputação em variáveis qualitativas e quantitativas. / Evaluating Bayesian networks for imputation with qualitative and quantitative variables.Ismenia Blavatsky de Magalhães 29 March 2007 (has links)
Redes Bayesianas são estruturas que combinam distribuições de probabilidade e grafos. Apesar das redes Bayesianas terem surgido na década de 80 e as primeiras tentativas em solucionar os problemas gerados a partir da não resposta datarem das décadas de 30 e 40, a utilização de estruturas deste tipo especificamente para imputação é bem recente: em 2002 em institutos oficiais de estatística e em 2003 no contexto de mineração de dados. O intuito deste trabalho é o de fornecer alguns resultados da aplicação de redes Bayesianas discretas e mistas para imputação. Para isso é proposto um algoritmo que combina o conhecimento de especialistas e dados experimentais observados de pesquisas anteriores ou parte dos dados coletados. Ao empregar as redes Bayesianas neste contexto, parte-se da hipótese de que uma vez preservadas as variáveis em sua relação original, o método de imputação será eficiente em manter propriedades desejáveis. Neste sentido, foram avaliados três tipos de consistências já existentes na literatura: a consistência da base de dados, a consistência lógica e a consistência estatística, e propôs-se a consistência estrutural, que se define como sendo a capacidade de a rede manter sua estrutura na classe de equivalência da rede original quando construída a partir dos dados após a imputação. É utilizada pela primeira vez uma rede Bayesiana mista para o tratamento da não resposta em variáveis quantitativas. Calcula-se uma medida de consistência estatística para redes mistas usando como recurso a imputação múltipla para a avaliação de parâmetros da rede e de modelos de regressão. Como aplicação foram conduzidos experimentos com base nos dados de domicílios e pessoas do Censo Demográfico 2000 do município de Natal e nos dados de um estudo sobre homicídios em Campinas. Dos resultados afirma-se que as redes Bayesianas para imputação em atributos discretos são promissoras, principalmente se o interesse estiver em manter a consistência estatística e o número de classes da variável for pequeno. Já para outras características, como o coeficiente de contingência entre as variáveis, são afetadas pelo método à medida que se aumenta o percentual de não resposta. Nos atributos contínuos, a mediana apresenta-se mais sensível ao método. / Bayesian networks are structures that combine probability distributions with graphs. Although Bayesian networks initially appeared in the 1980s and the first attempts to solve the problems generated from the non-response date back to the 1930s and 1940s, the use of structures of this kind specifically for imputation is rather recent: in 2002 by official statistical institutes, and in 2003 in the context of data mining. The purpose of this work is to present some results on the application of discrete and mixed Bayesian networks for imputation. For that purpose, we present an algorithm combining knowledge obtained from experts with experimental data derived from previous research or part of the collected data. To apply Bayesian networks in this context, it is assumed that once the variables are preserved in their original relation, the imputation method will be effective in maintaining desirable properties. Pursuant to this, three types of consistence which already exist in literature are evaluated: the database consistence, the logical consistence and the statistical consistence. In addition, the structural consistence is proposed, which can be defined as the ability of a network to maintain its structure in the equivalence class of the original network when built from the data after imputation. For the first time a mixed Bayesian network is used for the treatment of the non-response in quantitative variables. The statistical consistence for mixed networks is being developed by using, as a resource, the multiple imputation for evaluating network parameters and regression models. For the purpose of application, some experiences were conducted using simple networks based on data for dwellings and people from the 2000 Demographic Census in the City of Natal and on data from a study on homicides in the City of Campinas. It can be stated from the results that the Bayesian networks for imputation in discrete attributes seem to be promising, particularly if the interest is to maintain the statistical consistence and if the number of classes of the variable is small. Features such as the contingency tables coefficient among variables, on the other hand, are affected by this method as the percentage of non-response increases. The median is more sensitive to this method in continuous attributes.
|
46 |
Sistema evolutivo eficiente para aprendizagem estrutural de redes Bayesianas / Efficient evolutionary system for learning BN structuresEdwin Rafael Villanueva Talavera 21 September 2012 (has links)
Redes Bayesianas (RB) são ferramentas probabilísticas amplamente aceitas para modelar e fazer inferências em domínios sob incertezas. Uma das maiores dificuldades na construção de uma RB é determinar a sua estrutura de modelo, a qual representa a estrutura de interdependências entre as variáveis modeladas. A estimativa exata da estrutura de modelo a partir de dados observados é, de forma geral, impraticável já que o número de estruturas possíveis cresce de forma super-exponencial com o número de variáveis. Métodos eficientes de aprendizagem aproximada tornam-se, portanto, essenciais para a construção de RBs verossímeis. O presente trabalho apresenta o Sistema Evolutivo Eficiente para Aprendizagem Estrutural de RBs, ou abreviadamente, EES-BN. Duas etapas de aprendizagem compõem EES-BN. A primeira etapa é encarregada de reduzir o espaço de busca mediante a aprendizagem de uma superestrutura. Para tal fim foram desenvolvidos dois métodos efetivos: Opt01SS e OptHPC, ambos baseados em testes de independência. A segunda etapa de EES-BN é um esquema de busca evolutiva que aproxima a estrutura do modelo respeitando as restrições estruturais aprendidas na superestrutura. Três blocos principais integram esta etapa: recombinação, mutação e injeção de diversidade. Para recombinação foi desenvolvido um novo operador (MergePop) visando ganhar eficiência de busca, o qual melhora o operador Merge de Wong e Leung (2004). Os operadores nos blocos de mutação e injeção de diversidade foram também escolhidos procurando um adequado equilíbrio entre exploração e utilização de soluções. Todos os blocos de EES-BN foram estruturados para operar colaborativamente e de forma auto-ajustável. Em uma serie de avaliações experimentais em RBs conhecidas de variado tamanho foi encontrado que EES-BN consegue aprender estruturas de RBs significativamente mais próximas às estruturas verdadeiras do que vários outros métodos representativos estudados (dois evolutivos: CCGA e GAK2, e dois não evolutivos: GS e MMHC). EES-BN tem mostrado também tempos computacionais competitivos, melhorando marcadamente os tempos dos outros métodos evolutivos e superando também ao GS nas redes de grande porte. A efetividade de EES-BN foi também comprovada em dois problemas relevantes em Bioinformática: i) reconstrução da rede deinterações intergênicas a partir de dados de expressão gênica, e ii) modelagem do chamado desequilíbrio de ligação a partir de dados genotipados de marcadores genéticos de populações humanas. Em ambas as aplicações, EES-BN mostrou-se capaz de capturar relações interessantes de significância biológica estabelecida. / Bayesian networks (BN) are probabilistic tools widely accepted for modeling and reasoning in domains under uncertainty. One of the most difficult tasks in the construction of a BN is the determination of its model structure, which is the inter-dependence structure of the problem variables. The exact estimation of the model structure from observed data is generally infeasible, since the number of possible structures grows super-exponentially with the number of variables. Efficient approximate methods are therefore essential for the construction of credible BN. In this work we present the Efficient Evolutionary System for learning BN structures (EES-BN). This system is composed by two learning phases. The first phase is responsible for the reduction of the search space by estimating a superstructure. For this task were developed two methods (Opt01SS and OptHPC), both based in independence tests. The second phase of EES-BN is an evolutionary design for finding the optimal model structure using the superstructure as the search space. Three main blocks compose this phase: recombination, mutation and diversity injection. With the aim to gain search efficiency was developed a new recombination operator (MergePop), which improves the Merge operator of Wong e Leung (2004). The operators for mutation and recombination blocks were also selected aiming to have an appropriate balance between exploitation and exploration of the solutions. All blocks in EES-BN were structured to operate in a collaborative and self-regulated fashion. Through a series of experiments and comparisons on benchmark BNs of varied dimensionality was found that EES-BN is able to learn BN structures markedly closer to the gold standard networks than various other representative methods (two evolutionary: CCGA and GAK2, and two non-evolutionary methods: GS and MMHC). The computational times of EES-BN were also found competitive, improving notably the times of the evolutionary methods and also the GS in the larger networks. The effectiveness of EES-BN was also verified in two real problems in bioinformatics: i) the reconstruction of a gene regulatory network from gene-expression data, and ii) the modeling of the linkage disequilibrium structures from genetic marker genotyped data of human populations. In both applications EES-BN proved to be able to recover interesting relationships with proven biological meaning.
|
47 |
Estratégia do planejamento e otimização de sistemas sem fio, considerando redes interferentes: abordagem baseada em cross-layerARAÚJO, Jasmine Priscyla Leite de 30 June 2011 (has links)
Submitted by Cleide Dantas (cleidedantas@ufpa.br) on 2014-09-30T18:46:25Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiaPlanejamentoOtimizacao.pdf: 2841544 bytes, checksum: d7959e9b3361d3a8e3c69ecb17996f96 (MD5) / Approved for entry into archive by Ana Rosa Silva (arosa@ufpa.br) on 2014-10-06T13:13:58Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiaPlanejamentoOtimizacao.pdf: 2841544 bytes, checksum: d7959e9b3361d3a8e3c69ecb17996f96 (MD5) / Made available in DSpace on 2014-10-06T13:13:58Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiaPlanejamentoOtimizacao.pdf: 2841544 bytes, checksum: d7959e9b3361d3a8e3c69ecb17996f96 (MD5)
Previous issue date: 2011 / Apesar do aumento significativo do uso de redes locais sem fio (WLAN) nos últimos
anos, aspectos de projeto e planejamento de capacidade da rede são ainda sistematicamente
negligenciados durante a implementação da rede. Tipicamente um projeto de rede local sem
fio é feito e instalado por profissionais de rede. Esses profissionais são extremamente
experientes com redes cabeadas, mas são ainda geralmente pouco experientes com redes sem
fio. Deste modo, as instalações de redes locais sem fio são desvantajosas pela falta de um
modelo de avaliação de desempenho e para determinar a localização do ponto de acesso (PA),
além disso, fatores importantes do ambiente não são considerados no projeto. Esses fatores se
tornam mais importante quando muitos pontos de acesso (PAs) são instalados para cobrir um
único edifício, algumas vezes sem planejamento de freqüência. Falhas como essa podem
causar interferência entre células geradas pelo mesmo PA. Por essa razão, a rede não obterá os
padrões de qualidade de serviço (QoS) exigidos por cada serviço. O presente trabalho
apresenta uma proposta para planejamento de redes sem fio levando em consideração a
influência da interferência com o auxílio de inteligência computacional tais como a utilização
de redes Bayesianas. Uma extensiva campanha de medição foi feita para avaliar o desempenho
de dois pontos de acesso (PAs) sobre um cenário multiusuário, com e sem interferência. Os
dados dessa campanha de medição foram usados como entrada das redes Bayesianas e
confirmaram a influência da interferência nos parâmetros de QoS. Uma implementação de
algoritmo genético foi utilizado permitindo uma abordagem híbrida para planejamento de
redes sem fio. Como efeito de comparação para otimizar os parâmetros de QoS, de modo a encontrar a melhor distância do PA ao receptor garantindo as recomendações do International Telecomunication Union (ITU-T), a técnica de otimização por enxame de partículas foi aplicada. / In spite of the significant increase of the use of Wireless Local Area Network (WLAN)
experienced in the last years, design aspects and capacity planning are still systematically
neglected during the network implementation. Typically, a wireless local area network is
designed and installed by networking professionals. These individuals are familiar with wired
networks, but are often unfamiliar with wireless networks. Thus, wireless local area networks
installations are prejudiced by the lack of an accurate performance evaluation model and to
determine the location of the access point (AP), besides important factors of the environment
are not considered in the project. These factors become more important when several APs are
installed, sometimes without a frequency planning, to cover a unique building. Faults such as
these can cause interference among cells generated by each PA. Therefore, the network will
not obtain the QoS patterns required for each service. The present work provides a planning
proposal to wireless networks regarding the influence of interference using computational
intelligence just as Bayesian Networks. An extensive measurement campaign was done to
evaluate the performance of two access points (PAs) under a multi user and interference
scenarios. The data collected in the measurement campaign was used as input of the Bayesian
networks and confirmed the influence of the interference in the QoS parameters. A genetic
algorithm technique was used as a hybrid approach to wireless planning. Another technique,
called particle swarm optimization (PSO) was used to compare the optimizations results from
the QoS parameters to find the best distance from the AP to the receiver to guarantee the QoS
ITU-T recommendations.
|
48 |
Novel Bayesian networks for genomic prediction of developmental traits in biomass sorghum / Novas redes Bayesianas para predição genômica de caracteres de desenvolvimento em sorgo biomassaSantos, Jhonathan Pedroso Rigal dos 02 August 2019 (has links)
Sorghum (Sorghum bicolor L. Moench spp.) is a bioenergy crop with several appealing biological features to be explored in plant breeding for increasing efficiency in bioenergy production. The possibility to connect the influence of quantitative trait loci over time and between traits highlight the Bayesian networks as a powerful probabilistic framework to design novel genomic prediction models. In this study, we phenotyped a diverse panel of 869 sorghum lines in four different environments (2 locations in 2 years) with biweekly measurements from 30 days after planting (DAP) to 120 DAP for plant height and dry biomass at the end of the season. Genotyping-by-sequencing was performed, resulting in the scoring of 100,435 biallelic SNP markers. We developed and evaluated several genomic pre- diction models: Bayesian Network (BN), Pleiotropic Bayesian Network (PBN), and Dynamic Bayesian Network (DBN). Assumptions for BN, PBN, and DBN were independence, dependence between traits, and dependence between time points, respectively. For benchmarking, we used multivariate GBLUP models that considered only time points for plant height (MTi- GBLUP), and both time points for plant height and dry biomass (MTr-GBLUP) modeling unstructured variance-covariance matrix for genetic effects and residuals. Coincidence indices (CI) were computed for understanding the success in selecting for dry biomass using plant height measurements, as well as a coincidence index based on lines (CIL) using the posterior draws from the Bayesian networks to understand genetic plasticity over time. In the 5-fold cross-validation scheme, prediction accuracies ranged from 0.48 (PBN) to 0.51 (MTr- GBLUP) for dry biomass and from 0.47 (DBN-DAP120) to 0.74 (MTi-GBLUP-DAP60) for plant height. The forward-chaining cross-validation showed a substantial increment in prediction accuracies when using the DBN model, with r = 0.6 (train on slice 30:45 to predict 120 DAP) to 0.94 (train on slice 30:90 to predict 105 DAP) compared to the BN and PBN, and similar to multivariate GBLUP models. Both the CI and CIL indices showed that the ranking of promising inbred lines changed minimally after 45 DAP for plant height. These results suggest that 45 DAP is an optimal developmental stage for imposing the two-level indirect selection framework, where indirect selection for plant height at the end of the season (first-level target trait) can be done based on its ranking with 45 DAP (secondary trait) as well as for dry biomass (second-level target trait). With the advance of robotic technologies for field-based phenotyping, the development of novel approaches such as the two-level indirect selection framework will be imperative to boost genetic gain per unit of time. / O sorgo (Sorghum bicolor L. Moench spp.) é uma cultura bioenergética com várias características atrativas para serem exploradas no melhoramento de plantas para aumentar a eficiência de produção de bioenergia. A possibilidade de conectar informações genômicas em caracteres quantitativos ao longo do tempo, e entre caracteres, destacam as Redes Bayesianas como uma ferramenta probabilística poderosa para delinear novos modelos de predição genômica. Neste estudo, um painel diverso de 869 linhagens de sorgo foi fenotipado em quatro ambientes diferentes (2 locais em 2 anos) com medidas a cada duas semanas de 30 a 120 dias após o plantio (DAP), para altura de plantas e biomassa seca no fim da safra. Um procedimento de Genotipagem por sequenciamento foi executado, resultando na chamada de 100.435 marcadores baseados em Polimorfismos de Nucleotídeos Únicos (SNPs) bialélicos. Neste estudo foram desenvolvidos e avaliados os modelos de predição genômica: Rede Bayesiana (BN), Rede Bayesiana Pleiotrópica (PBN), e Rede Bayesiana Dinâmica (DBN). Os pressupostos para BN, PBN, e DBN foram independência, dependência entre caracteres, e dependência entre pontos no tempo, respectivamente. Para fins comparativos, formulações de modelos multivariados GBLUP foram utilizados considerando dependência entre pontos de tempo para altura de plantas (MTi-GBLUP), e ambos os pontos de tempo para a altura de plantas e biomassa seca (MTr-GBLUP), modelando matriz de variância-covariância não estruturada para efeitos genéticos e residuais. Índices de coincidência (IC) foram calculados para entender o sucesso na seleção indireta de biomassa seca usando medidas de altura de plantas, bem como um índice de coincidência baseado em linhagens (CIL), usando as amostras das posteriores das redes Bayesianas para entender a plasticidade genética ao longo do tempo. No esquema de validação cruzada 5-fold, as acurácias das predições variaram de 0,48 (PBN) a 0,51 (MTr-GBLUP) para biomassa seca e de 0,47 (DBN-DAP120) a 0,74 (MTi-GBLUP-DAP60) para altura de plantas. A validação cruzada forward-chaining mostrou um incremento substancial nas acurácias das predições ao usar o modelo DBN, com r = 0,6 (treinando no intervalo 30:45 para prever 120 DAP) até 0,94 (treinando no intervalo 30:90 para prever 105 DAP) em comparação com o BN e PBN, e semelhante aos modelos multivariados GBLUP. Os índices CI e CIL mostraram que o ranking de linhagens promissoras mudou minimamente após 45 DAP para altura de plantas. Estes resultados sugerem que 45 DAP é um estágio de desenvolvimento ideal para impor a estrutura de seleção indireta em dois níveis, onde a seleção indireta para a altura da planta no final da estação (caractere alvo de primeiro nível) pode ser feita com base na sua classificação com 45 DAP (caractere secundário), bem como para a biomassa seca (caractere alvo de segundo nível). Com o avanço das tecnologias robóticas para a fenotipagem baseada em campo, o desenvolvimento de novas abordagens, como a estrutura de seleção indireta em dois níveis, serão imperativas para aumentar o ganho genético por unidade de tempo.
|
49 |
Definição das probabilidades condicionais de redes bayesianas baseadas em nós ranqueados.SILVA, Raissa Matias da. 13 March 2018 (has links)
Submitted by Dilene Paulo (dilene.fatima@ufcg.edu.br) on 2018-03-13T11:25:01Z
No. of bitstreams: 1
RAISSA MATIAS DA SILVA – DISSERTAÇÃO PPGCC 2016.pdf: 12305585 bytes, checksum: 2914208d83a82b120e393d5f5fe4c30f (MD5) / Made available in DSpace on 2018-03-13T11:25:01Z (GMT). No. of bitstreams: 1
RAISSA MATIAS DA SILVA – DISSERTAÇÃO PPGCC 2016.pdf: 12305585 bytes, checksum: 2914208d83a82b120e393d5f5fe4c30f (MD5)
Previous issue date: 2016 / Um dos principais desafios na construção de uma Rede Bayesiana (RB) é definir as
tabelas de probabilidade condicional dos nós (TPC). Para RB de larga escala, aprender
TPC por meio da elicitação de domínio do conhecimento de um especialista é inviável.
Trabalhos anteriores propuseram soluções para este problema usando o conceito de nós
ranqueados, no entanto, eles têm capacidade limitada de modelagem ou precisam contar
com especialistas em RB parar aplicá-los, reduzindo a sua aplicabilidade. Neste trabalho,
são propostos e avaliados três métodos para resolução deste problema. O primeiro utiliza
um sistema especialista baseado em regras de produção. O segundo método utiliza força
bruta, buscando um conjunto de todas as combinações possíveis. O terceiro método utiliza um algoritmo genético para definição de TPC por especialistas sem conhecimento específico de nós ranqueados. Para avaliar as abordagens, foi executado um experimento que permitiuidentificar as vantagens e as desvantagens de cada método, dependendo do tempo deprocessamento, disponibilidade de memória e a quantidade denós pais da RB. Ao usaralguma das soluções apresentadas, um praticante pode definir com maior precisão as TPCsem entender o conceito de nós ranqueados. / One of the key challenges in constructing a Bayesian network (BN) is defining the node probability tables (NPT). For large-scale BN, learning NPT through domain experts knowledge elicitation is unfeasible. Previous works proposed solutions to this problem using the concept of ranked nodes; however, they have limited modeling capabilities or rely on BN experts to apply them, reducing their applicability. In this work, we propose and evaluate three methods to solve the problem. First, an expert system based on production rules. Second, a method using a brute-force algorithm to identify a set of possible combination. Finally, a method using genetic algorithm to define NPTs with no ranked nodes-specific knowledge. To validate this approach, it was executed an experiment with a BN already published in the literature. Results demonstrated the advantages and disadvantages of each method depending on time, memory availability and parents node quantity. By using one of the presented solution, a practitioner can accurately define NPTs without understanding the concept ofranked nodes.
|
50 |
Ferramenta fuzzy-bayesiana para identificação do instante de entrada no regime permanente em ensaios de desempenho de compressoresCasella, Alexandre Victor January 2008 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Metrologia Científica e Industrial. / Made available in DSpace on 2012-10-24T02:59:47Z (GMT). No. of bitstreams: 1
259517.pdf: 1000081 bytes, checksum: 487e0f35a72cddd12f4ddebc1bb26846 (MD5) / Ensaio de desempenho é uma atividade experimental de suma importância para análise de compressores de refrigeração. Os principais resultados obtidos são capacidade de refrigeração, potência consumida e coeficiente de performance. É demorado, demandando normalmente mais de quatro horas, divididas em dois períodos associados a regimes operacionais: transitório e permanente. A efetiva coleta de dados para compor os resultados dos ensaios se dá no regime permanente, o qual é estabelecido por norma em uma hora.
Diversos trabalhos estão sendo desenvolvidos visando reduzir o tempo de ensaio. Atualmente já se vislumbra viabilidade de, no futuro, se ter duração de transitório de aproximadamente uma hora. Embora tais regimes sejam bem definidos por normas, durante o ensaio não é trivial a identificação da passagem de um regime para outro. Essa identificação só se dá quando o ensaio é terminado. O que caracteriza que um ensaio é válido e que pode ser encerrado é a manutenção, por uma hora seguida, de condições de variabilidade das variáveis de ensaio em valores abaixo do previsto em norma. Por isso, só se conhece o instante em que o ensaio entrou em regime permanente após o seu término. A identificação em tempo real de que o regime permanente foi atingido pode possibilitar uma redução substancial do tempo em que as medições são feitas em tal regime, reduzindo a duração do ensaio.
Nesta dissertação foi desenvolvido um sistema especialista probabilístico utilizando redes bayesianas e lógica fuzzy para identificação do instante em que o sistema de ensaio entra em regime permanente no tocante à capacidade de refrigeração. O sistema se baseia numa análise conjunta do comportamento dinâmico de outras variáveis, como temperaturas e grandezas elétricas.
Avaliação experimental do sistema, com base em dados reais de ensaios de compressores, mostrou que a técnica é empregável e que possibilita a determinação do instante da entrada em regime com baixa incerteza. O emprego do método proposto pode ser autônomo ou, para aumento da confiabilidade, associado a outras técnicas.
|
Page generated in 0.076 seconds