Global ETD Search

71	TRACTS : um método para classificação de trajetórias de objetos móveis usando séries temporais Santos, Irineu Júnior Pinheiro dos January 2011 (has links) O crescimento do uso de sistemas de posicionamento global (GPS) e outros sistemas de localização espacial tornaram possível o rastreamento de objetos móveis, produzindo um grande volume de um novo tipo de dado, chamado trajetórias de objetos móveis. Existe, entretanto, uma forte lacuna entre a quantidade de dados extraídos destes dispositivos, dotados de sistemas GPS, e a descoberta de conhecimento que se pode inferir com estes dados. Um tipo de descoberta de conhecimento em dados de trajetórias de objetos móveis é a classificação. A classificação de trajetórias é um tema de pesquisa relativamente novo, e poucos métodos tem sido propostos até o presente momento. A maioria destes métodos foi desenvolvido para uma aplicação específica. Poucos propuseram um método mais geral, aplicável a vários domínios ou conjuntos de dados. Este trabalho apresenta um novo método de classificação que transforma as trajetórias em séries temporais, de forma a obter características mais discriminativas para a classificação. Experimentos com dados reais mostraram que o método proposto é melhor do que abordagens existentes. / The growing use of global positioning systems (GPS) and other location systems made the tracking of moving objects possible, producing a large volume of a new kind of data, called trajectories of moving objects. However, there is a large gap between the amount of data generated by these devices and the knowledge that can be inferred from these data. One type of knowledge discovery in trajectories of moving objects is classification. Trajectory classification is a relatively new research subject, and a few methods have been proposed so far. Most of these methods were developed for a specific application. Only a few have proposed a general method, applicable to multiple domains or datasets. This work presents a new classification method that transforms the trajectories into time series, in order to obtain more discriminative features for classification. Experiments with real trajectory data revealed that the proposed approach is more effective than existing approaches. Inteligência artificial Redes bayesianas Moving object trajectory Trajectory classification Knowledge discovery Data mining Time series
72	Redes Bayesianas: um método para avaliação de interdependência e contágio em séries temporais multivariadas / Bayesian Networks: a method for evaluation of interdependence and contagion in multivariate time series João Vinícius de França Carvalho 25 April 2011 (has links) O objetivo deste trabalho consiste em identificar a existência de contágio financeiro utilizando a metodologia de redes bayesianas. Além da rede bayesiana, a análise da interdependência de mercados internacionais em períodos de crises financeiras, ocorridas entre os anos 1996 e 2009, foi modelada com outras duas técnicas - modelos GARCH multivariados e de Cópulas, envolvendo países nos quais foi possível avaliar seus efeitos e que foram objetos de estudos similares na literatura. Com os períodos de crise bem definidos e metodologia calcada na teoria de grafos e na inferência bayesiana, executou-se uma análise sequencial, em que as realidades que precediam períodos de crise foram consideradas situações a priori para os eventos (verossimilhanças). Desta combinação resulta a nova realidade (a posteriori), que serve como priori para o período subsequente e assim por diante. Os resultados apontaram para grande interligação entre os mercados e diversas evidências de contágio em períodos de crise financeira, com causadores bem definidos e com grande respaldo na literatura. Ademais, os pares de países que apresentaram evidências de contágio financeiro pelas redes bayesianas em mais períodos de crises foram os mesmos que apresentaram os mais altos valores dos parâmetros estimados pelas cópulas e também aqueles cujos parâmetros foram mais fortemente significantes no modelo GARCH multivariado. Assim, os resultados obtidos pelas redes bayesianas tornam-se mais relevantes, o que sugere boa aderência deste modelo ao conjunto de dados utilizados neste estudo. Por fim, verificou-se que, após as diversas crises, os mercados estavam muito mais interligados do que no período inicialmente adotado. / This work aims to identify the existence of financial contagion using a metodology of Bayesian networks. Besides Bayesian networks, the analysis of the international markets\' interdependence in times of financial crises, occurred between 1996 and 2009, was modeled using two other techniques - multivariate GARCH models and Copulas models, involving countries in which its effects were possible to assess and which were subject to similar studies in the literature. With well-defined crisis periods and a metodology based on graph theory and Bayesian inference, a sequential analysis was executed, in which the realities preceding periods of crisis were considered to be prior situations to the events (likelihood). From this combination results the new posterior reality, which serves as a prior to the subsequent period and so on. The results pointed to a large interconnection between markets and several evidences of contagion in times of financial crises, with well-defined responsibles and highly supported by the literature. Moreover, the pairs of countries that show evidence of financial contagion by Bayesian networks in over periods of crises were the same as that presented the highest values of the parameters estimated by copulas and the most strongly significant parameters in the multivariate GARCH model. Thus, the results obtained by Bayesian networks become more relevant, suggesting good adherence of the model to the data set used in this study. Finally, it was found that after the various crises, the markets were much more connected. contágio financeiro cópulas GARCH multivariado interdependência Redes Bayesianas Bayesian Networks copulas financial contagion interdependence multivariate GARCH
73	Detecção e rastreio de faces utilizando redes Bayesianas Candido, Jorge 26 February 2007 (has links) Made available in DSpace on 2016-03-15T19:37:53Z (GMT). No. of bitstreams: 1 Jorge Candido.pdf: 1397085 bytes, checksum: e82ad6a587c16813c068018b87471755 (MD5) Previous issue date: 2007-02-26 / This work presents a face detection system that uses a Bayesian Network to combine information from different computational cheap visual operators. The aim in this work is to show that combining simple features in a Bayesian Network allows building an enhanced face detector system, increasing the detection rate and speeding up the face detection process. This face detector has been developed to work in the stream acquired by a USB computer camera. After the detector finds a face in the stream, a face tracking system begins to work, locating the eyes position at the screen. The system is part of a high precision optical mouse system that will be used in human-computer interface, helpin users with certain disabilities. / Neste trabalho, foi desenvolvido um sistema automático de detecção e rastreio de face. O sistema de detecção de face é composto de três operadores visuais que fazem a detecção de atributos faciais simples. A característica principal destes operadores é que eles são construídos para funcionar com custo computacional baixo, otimizando o tempo de processamento. Os operadores foram construídos utilizando técnicas de redes neurais para a detecção dos olhos, casamento de modelos para a detecção da boca e para a identificação de cor de pele. Os operadores visuais formam os elementos básicos do detector de face cujos resultados são combinados em uma Rede Bayesiana que define o resultado final do algoritmo de detecção de face . O uso da Rede Bayesiana proporciona ao sistema um melhor desempenho em relação aos operadores individualmente . Este detector foi implementado de forma a analisar as imagens captadas quadro a quadro por uma câmera de vídeo USB. Quando acontece uma detecção de face, a mesma passa a ser ratreada por um sistema de rastreio que busca a região de cor de pele da face, determinando sua posição na tela. Este sistema pode ser utilizado em diversas aplicações que requerem a detecção de faces, em particular, este sistema faz parte de um sistema de mouse óptico de alta precisão para, por exemplo, facilitar a interface homem máquina para pessoas com problemas de coordenação motora. redes Bayesianas redes neurais detecção de face Bayesian networks neural networks face detection CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
74	Estudo de técnicas de paralelização de métodos computacionais de fatoração de matrizes esparsas aplicados à redes bayesianas e redes credais / Study of parallelization techniques of computational methods for sparse matrix factorization applied to Bayesian and credal networks Viviane Teles de Lucca Maranhão 19 August 2013 (has links) Neste trabalho demos continuidade ao estudo desenvolvido por Colla (2007) que utilizou-se do arcabouço de álgebra linear com técnicas de fatoração de matrizes esparsas aplicadas à inferência em redes Bayesianas. Com isso, a biblioteca computacional resultante possui uma separação clara entre a fase simbólica e numérica da inferência, o que permite aproveitar os resultados obtidos na primeira etapa para variar apenas os valores numéricos. Aplicamos técnicas de paralelização para melhorar o desempenho computacional, adicionamos inferência para Redes Credais e novos algoritmos para inferência em Redes Bayesianas para melhor eciência dependendo da estrutura do grafo relacionado à rede e buscamos tornar ainda mais independentes as etapas simbólica e numérica. / In this work we continued the study by Colla (2007), who used the framework of linear algebra techniques with sparse matrix factorization applied to inference in Bayesian networks. Thus, the resulting computational library has a clear separation between the symbolic and numerical phase of inference, which allows you to use the results obtained in the rst step to vary only numeric values. We applied parallelization techniques to improve computational performance, we add inference to Credal Networks and new algorithms for inference in Bayesian networks for better eciency depending on the structure of the graph related to network and seek to become more independent symbolic and numerical steps. Computação Paralela Matrizes Esparsas Redes Bayesianas Redes Credais Bayesian Networks Credal Networks Parallel Computing Sparse Matrixes
75	Redes de regulação gênica do metabolismo de sacarose em cana-de-açúcar utilizando redes bayesianas / Gene regulatory networks of the sucrose metabolism in sugarcane using bayesian networks Murad, Natália Faraj, 1989- 23 August 2018 (has links) Orientador: Renato Vicentini dos Santos / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-23T02:31:35Z (GMT). No. of bitstreams: 1 Murad_NataliaFaraj_M.pdf: 15243579 bytes, checksum: a5e50145fbdf4bddfb2ea99313b17991 (MD5) Previous issue date: 2013 / Resumo: A cana-de-açúcar é uma das mais importantes plantas cultivadas no Brasil, que é o maior produtor e exportador mundial. Seu valor econômico é devido principalmente a sua capacidade de estocar sacarose nos colmos. Os padrões de expressão gênica podem regular processos de desenvolvimento da planta e influenciar no acúmulo de sacarose em tecidos de reserva. A regulação desses padrões ocorre através de complexos sistemas de interações entre muitos genes e seus produtos, resultando em uma complexa rede de regulação gênica. Modelos gráficos probabilísticos têm sido amplamente utilizados para inferência e representação dessas redes. Dentre eles, as redes bayesianas são o principal por ser considerado o método mais flexível e também requererem um número reduzido de parâmetros para a descrição do modelo. Sendo assim, este estudo utilizou a metodologia de redes bayesianas para inferência de interações regulatórias entre genes de metabolismo e sinalização de sacarose a partir de dados de expressão gênica, obtidos através de microarrays, disponíveis no Gene Expression Omnibus (GEO). As redes foram obtidas através de softwares para inferência de redes e então analisadas quanto aos genes que as compõem e padrões de expressão. Os genes foram agrupados em clusters considerando-se seus padrões de coexpressão. Os genes mais representados no cluster da enzima sacarose fosfato sintase (SPS) em cana são genes de relacionados à tradução, ligação ao DNA e genes de função desconhecida, enquanto os menos representados são de fotossíntese, resposta a hormônios, e outros eventos metabólicos. A rede do cluster da SPS apresentou sete genes principais (hubs) que aparentam ter um importante papel dentro do cluster. Foi obtida também uma rede considerando genes selecionados em estudos com experimentos de microarrays previamente publicados. Uma dessas redes possui 136 genes e apresentou 6 genes principais, sendo que a maioria deles é de fotossíntese. Na rede considerando genes diferencialmente expressos nesses experimentos (265 genes), genes que pertencem à mesma categoria funcional tenderam a sofrer regulação por um único gene em comum, formando grupos de funções semelhantes em cada hub / Abstract: Sugarcane is one of the most important plants cultivated in Brazil which is the world's largest producer and exporter. Its economic yield is mainly due to its high sucrose content. The patterns of gene expression may regulate processes of plant development and influence the accumulation of sucrose by storage tissues. The regulation of these patterns occurs through complex systems of interactions between many genes and their products, resulting in a complex gene regulatory network. Probabilistic graphical models have been widely used for inference and representation of these networks. Among them, Bayesian networks are the main for being considered to be the most flexible method and also requiring a reduced number of parameters to the model description. Then, this work has used the Bayesian network methodology for inference of regulatory interactions between signaling and sucrose metabolism genes from gene expression data, obtained from microarrays, available on Gene Expression Omnibus (GEO). Networks were generated by networks inference softwares, and then analyzed observing their composing genes and expression patterns. The genes were grouped considering their coexpression patterns. The most represented genes in the sacarose phosphate syntase (SPS) cluster are related with translation, DNA biding and unknown function genes while the least represented are of photosynthesis, hormone response and other metabolic events. The SPS cluster network presented 7 main hubs that seem to play an important role in the cluster. It was also obtained a network considering genes selected from studies with microarray experiments previously published. One of these gene networks has 136 genes and it presented 6 main genes, being the most of them are from photosynthesis. In the network considering differential expressed in this experiments, genes that are from the same functional category tended to suffer regulation for one unique common gene, forming groups of genes with similar function on each hub / Mestrado / Genetica Vegetal e Melhoramento / Mestra em Genética e Biologia Molecular Redes reguladoras de genes Cana-de-açúcar Redes bayesianas Gene regulatory networks Sugar-cane Bayesian networks
76	Avaliação probabilística de risco via modelo causal híbrido em cirurgia: o caso da histerectomia vaginal OLIVEIRA, Felipe Andrade Gama de January 2006 (has links) Made available in DSpace on 2014-06-12T17:42:09Z (GMT). No. of bitstreams: 2 arquivo7393_1.pdf: 6657569 bytes, checksum: 3ca8f1d5810f2745659af9b2fe042065 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2006 / A análise probabilística de risco é uma metodologia que identifica, avalia e quantifica os riscos nos mais diversos procedimentos, desde de sistemas de alta complexidade tecnológica a sistemas onde só existe o homem executando tarefas. Esta análise tem como objetivo melhorar a segurança e o desempenho destes processos. A área de saúde ainda encontra-se bastante carente de estudos que analisem e quantifiquem os riscos envolvidos nos seus procedimentos. E é com este intuito, que este trabalho propõe uma metodologia de avaliação probabilística de risco para cirurgias, sendo apresentado o caso da histerectomia vaginal. Esta análise aborda tanto os aspectos da confiabilidade humana como a confiabilidade dos equipamentos utilizados. No modelo híbrido proposto, a análise de riscos é baseada na integração dos diagramas de seqüências de eventos, árvore de falhas e redes Bayesianas. Na modelagem os eventos pivotais dos diagramas de seqüência de eventos relacionados a erros humanos, ou seja, resultantes diretamente de ações humanas, são modelados via redes Bayesianas, proporcionando uma representação mais realista da natureza dinâmica destas ações, enquanto que os eventos pivotais relacionados à falha de equipamentos são modelados via árvores de falhas. Assim esta metodologia contribui para a melhoria do processo de gerenciamento dos riscos envolvidos durante a execução da atividade cirúrgica Histerectomia Vaginal Árvores de Falhas Redes Bayesianas Diagramas de Seqüência de Eventos Confiabilidade Humana Análise Probabilística de Risco
77	Análise probabilística de riscos via Redes Bayesianas : uma aplicação na construção de poços multilaterais SANTOS, Wagner Barbosa dos January 2005 (has links) Made available in DSpace on 2014-06-12T17:42:21Z (GMT). No. of bitstreams: 2 arquivo7441_1.pdf: 1476766 bytes, checksum: 966c97680d6347ba16c47188da5e72dd (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2005 / A análise probabilística de riscos é um método que ajuda a identificar e avaliar o risco, em sistemas de tecnologia complexa, com o propósito de através de uma análise de custobenefício melhorar a segurança e desempenho. O método tradicional faz uso de duas técnicas de modelagem e avaliação: árvore de falhas e árvore de eventos. Porém, estas técnicas possuem algumas limitações, tais como: O modelo se torna, algumas vezes, uma aproximação grosseira da realidade, devido a considerações necessárias na modelagem do sistema; Dentro deste conceito tem-se a consideração de independência entre variáveis, que algumas vezes não são; a necessidade em descrever os eventos como dicotômicos, que em alguns casos possuem vários estados possíveis. Outra limitação está na dificuldade em atualizar as informações já modeladas a partir de uma nova informação. Diante destas limitações, a utilização de redes Bayesianas, foi a saída encontrada para modelar sistemas de forma mais aproxima a realidade. Possibilitando a constante atualização com base nas informações obtidas, no decorrer da vida útil do sistema. A análise probabilística de riscos via redes Bayesianas, foi validada pela aplicação da técnica na análise da tecnologia multilateral, que são sistemas utilizados em poços multilaterais de petróleo. A aplicação teve como objetivo, avaliar o risco na construção de poços multilaterais, e com base no modelo, realizar o gerenciamento do risco durante a execução da atividade Análise de Probabilística de Riscos Confiabilidade Humana Redes Bayesianas Teorema de Bayes Poços Multilaterais Árvores de Eventos.
78	Uma metodologia para avaliação da confiabilidade humana em atividades de substituição de cadeias de isoladores em linhas de transmissão MENÊZES, Regilda da Costa e Silva January 2005 (has links) Made available in DSpace on 2014-06-12T17:42:24Z (GMT). No. of bitstreams: 2 arquivo7448_1.pdf: 1841405 bytes, checksum: 67bd6c1d263317c4e54b44bfbc8d21e6 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2005 / A análise de confiabilidade humana (ACH) estuda a execução das ações humanas em um determinado sistema, considerando suas limitações e os fatores que influenciam no seu desempenho. A literatura apresenta os métodos de ACH de primeira e segunda geração, onde a maioria foi desenvolvido para indústria nuclear. Esses métodos apresentam algumas deficiências. Dentre elas, destacam-se suposições irreais de independência e simples representação binária de eventos. Estas são conseqüências da utilização de ferramentas como análise de árvore de eventos e de falhas. Diante disso, apresentam uma grande dificuldade na modelagem das ações humanas, bem como na quantificação dos modelos causais. Portanto, percebe-se que modelar as causalidades existentes nas ações humanas tornou-se um grande desafio para ACH ao longo dos anos. Diante deste contexto, este trabalho mostra que modelar ações humanas por redes Bayesianas proporciona uma maior flexibilidade às variáveis componentes de um determinado sistema, pois além de permitir uma representação mais realista da natureza dinâmica da interface homem-sistema e homem-homem em eventos normais ou anormais de um processo, também representa a relação de dependência entre os eventos e entre os fatores de desempenho. Neste trabalho, utiliza-se redes Bayesianas para avaliação da confiabilidade humana em atividades de substituição de cadeias de isoladores em linhas de transmissão. Ele apresenta claramente a modelagem das ações humanas, bem como a utilização de métodos para construção de rede, com destaque para os mecanismos de quantificação de redes Bayesianas Análise de Confiabilidade Humana (ACH) Inferência Bayesiana Redes Bayesianas Fatores de desempenho Opinião de especialistas Método de educão do conhecimento.
79	Caracterización y detección de contribuyentes que presentan facturas falsas al SII mediante técnicas de data minig Castellon González, Pamela Andrea January 2012 (has links) Magíster en Gestión de Operaciones / Ingeniero Civil Industrial / El presente trabajo de título tiene por objetivo identificar patrones de comportamiento de los contribuyentes declarantes de IVA, que transan facturas falsas para evadir impuestos. Para ello se utiliza el proceso KDD, el cual considera una serie de pasos y técnicas que permiten extraer conocimiento oculto a partir de un gran volumen de datos, para encontrar relaciones o patrones asociados a un cierto fenómeno. La utilización y venta de facturas falsas tiene un impacto significativo en la recaudación que percibe el Estado, generando además efectos negativos que ponen en riesgo la competitividad de las empresas. Históricamente, la evasión por este concepto ha representado entre un 20% a un 30% de la evasión en el IVA, alcanzando la cifra de $450 millones de pesos durante la crisis económica de 2009. Adicionalmente, la detección, investigación, sanción y cobro de los impuestos adeudados, provoca un importante costo administrativo, debido a la cantidad de facturas transadas en el año y al tiempo requerido para su detección. En ese contexto, resulta necesario contar con procedimientos sistematizados y efectivos que gestionen la información disponible para detectar potenciales defraudadores de impuestos, focalizando los recursos en aquellos contribuyentes de mayor riesgo tributario. Para la construcción del vector de características se utiliza la información de casos registrados con facturas falsas en el año 2006, considerando información del pago de impuestos en tal período, características particulares, comportamiento histórico en diferentes etapas de su ciclo de vida e indicadores del comportamiento de sus relacionados, entre otros. En una primera instancia, se aplican técnicas de SOM y Gas Neuronal, para analizar el potencial de contribuyentes que tienen un buen o mal comportamiento tributario e identificar sus características más relevantes. Posteriormente, se utilizan Árboles de Decisión, Redes Neuronales y Redes Bayesianas, para identificar aquellas variables que están relacionadas con un comportamiento de fraude y/o no fraude y detectar patrones de conducta, estableciendo en qué medida se pueden predecir estos casos con la información disponible. El resultado indica que las variables que más discriminan entre fraude y no fraude en las micro y pequeñas empresas son el porcentaje de créditos generado por facturas, el resultado de las fiscalizaciones previas, la cantidad de facturas emitidas en el año y su relación con las facturas timbradas en los últimos dos años, el monto de IVA total declarado, la relación entre remanentes y créditos, los delitos e irregularidades históricas asociadas a facturas, y la participación en otras empresas. En las medianas y grandes empresas, en tanto, las variables más relevantes son la cantidad de remanente acumulado, el porcentaje de crédito asociado a facturas, el total de créditos, la relación entre gastos rechazados y activos, el capital efectivo, la cantidad de irregularidades previas asociadas a facturas, la cantidad de fiscalizaciones históricas, y el número de representantes legales. En relación a los modelos predictivos, el mejor resultado se obtuvo con la red neuronal, donde el porcentaje de casos con fraude correctamente asignado fue de un 92% para las micro y pequeñas empresas, y de 89% para las empresas medianas y grandes. De acuerdo a esto y al potencial universo de usuarios de facturas falsas (120.768 empresas), se estima que con los modelos obtenidos se puede generar un potencial de recaudación de $101.446 millones de pesos al año, lo que permitiría reducir la evasión por concepto de IVA de manera significativa. Finalmente, se concluye que es posible caracterizar y predecir contribuyentes que evaden impuestos a través de facturas falsas utilizando técnicas de Data Mining, y que los factores que inciden en la probabilidad que un contribuyente utilice facturas falsas dependen del tamaño o segmento del contribuyente, relación que hasta el momento se establecía sólo de manera intuitiva. Se recomienda, para trabajos futuros, generar nuevas variables de comportamiento históricas relacionadas con fiscalizaciones y cobertura, explorar otros métodos para el preprocesamiento y selección de las variables, con los que eventualmente podrían obtenerse resultados diferentes. Igualmente, sería interesante explorar técnicas de validación cruzada y aplicar otras técnicas de data mining para mejorar la predicción de casos de fraude. Delitos tributarios Evasión de impuestos Minería de datos Redes Bayesianas
80	A data-driven solution for root cause analysis in cloud computing environments. / Uma solução guiada por dados de análise de causa raiz em ambiente de computação em nuvem. Rosangela de Fátima Pereira 05 December 2016 (has links) The failure analysis and resolution in cloud-computing environments are a a highly important issue, being their primary motivation the mitigation of the impact of such failures on applications hosted in these environments. Although there are advances in the case of immediate detection of failures, there is a lack of research in root cause analysis of failures in cloud computing. In this process, failures are tracked to analyze their causal factor. This practice allows cloud operators to act on a more effective process in preventing failures, resulting in the number of recurring failures reduction. Although this practice is commonly performed through human intervention, based on the expertise of professionals, the complexity of cloud-computing environments, coupled with the large volume of data generated from log records generated in these environments and the wide interdependence between system components, has turned manual analysis impractical. Therefore, scalable solutions are needed to automate the root cause analysis process in cloud computing environments, allowing the analysis of large data sets with satisfactory performance. Based on these requirements, this thesis presents a data-driven solution for root cause analysis in cloud-computing environments. The proposed solution includes the required functionalities for the collection, processing and analysis of data, as well as a method based on Bayesian Networks for the automatic identification of root causes. The validation of the proposal is accomplished through a proof of concept using OpenStack, a framework for cloud-computing infrastructure, and Hadoop, a framework for distributed processing of large data volumes. The tests presented satisfactory performance, and the developed model correctly classified the root causes with low rate of false positives. / A análise e reparação de falhas em ambientes de computação em nuvem é uma questão amplamente pesquisada, tendo como principal motivação minimizar o impacto que tais falhas podem causar nas aplicações hospedadas nesses ambientes. Embora exista um avanço na área de detecção imediata de falhas, ainda há percalços para realizar a análise de sua causa raiz. Nesse processo, as falhas são rastreadas a fim de analisar o seu fator causal ou seus fatores causais. Essa prática permite que operadores da nuvem possam atuar de modo mais efetivo na prevenção de falhas, reduzindo-se o número de falhas recorrentes. Embora essa prática seja comumente realizada por meio de intervenção humana, com base no expertise dos profissionais, a complexidade dos ambientes de computação em nuvem, somada ao grande volume de dados oriundos de registros de log gerados nesses ambientes e à ampla inter-dependência entre os componentes do sistema tem tornado a análise manual inviável. Por esse motivo, torna-se necessário soluções que permitam automatizar o processo de análise de causa raiz de uma falha ou conjunto de falhas em ambientes de computação em nuvem, e que sejam escaláveis, viabilizando a análise de grande volume de dados com desempenho satisfatório. Com base em tais necessidades, essa dissertação apresenta uma solução guiada por dados para análise de causa raiz em ambientes de computação em nuvem. A solução proposta contempla as funcionalidades necessárias para a aquisição, processamento e análise de dados no diagnóstico de falhas, bem como um método baseado em Redes Bayesianas para a identificação automática de causas raiz de falhas. A validação da proposta é realizada por meio de uma prova de conceito utilizando o OpenStack, um arcabouço para infraestrutura de computação em nuvem, e o Hadoop, um arcabouço para processamento distribuído de grande volume de dados. Os testes apresentaram desempenhos satisfatórios da arquitetura proposta, e o modelo desenvolvido classificou corretamente com baixo número de falsos positivos. Análise de Causa Raiz Computação em nuvem Redes Bayesianas Bayesian networks Cloud computing Root cause analysis

Search results