Spelling suggestions: "subject:"processos estocástico"" "subject:"processos estocástica""
81 |
Análise Crítica da Dinâmica de uma Cavidade Pendular Quântica / Critical Analyse of Dynamical of Quantum Pendular CavityAndrea Barroso Melo 30 November 2004 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Desenvolvemos uma análise quântica de uma cavidade pendular, utilizando a representação P positiva, mostrando que o estado quântico do movimento de um espelho,um objeto macroscópico, tem efeitos notáveis na dinâmica deste sistema. Este foi proposto anteriormente como um candidato para medidas quanticamente limitadas de pequenos deslocamentos do espelho devido à pressão de radiação, para a produção de estados com emaranhamento entre espelho e o campo e também para estados de superposição do espelho. Contudo, quando tratamos o espelho oscilante como um oscilador quântico encontramos que este sistema sempre oscila, não possui estados estacionários e exibe incertezas na posição e no momento que são tipicamente maiores que os valores médios. Isto significa que a análise linearizada das flutuações
realizadas predominantemente para prever estes estados quânticos são de uso limitado. Achamos que a acuracidade alcançável na realização das medidas é muito pior do que o limite quântico padrão, devido ao ruído térmico, que para parâmteros experimentais típicos é enorme mesmo em 2mK. / We perform a quantum mechanical analysis of a pendular cavity, using the positive-P
representation, showing that the quantum state of the moving mirror, a microscopic object, has noticeable eects on the dynamics. This system was previously been proposed as a candidate for the quantum-limited measurement of small displacements os the mirror due to radiation pressure, for the production of states with entanglement between the mirror and the field, and even for superposition states of the mirror.
However, when we treat the oscillating mirror quantum mechanically, we find that it always oscillates, has no stationary steady-state, and exhibits uncertainties in position and momentum wich are typically large than the mean values. This means that previous linearised fluctuation analyses wich have been used to predict these highly quantum states are of limited use. We find that achievable accuracy in measurement
is far worse than the standard quantum limit due to thermal noise, which, for typical
experimental parameters, is overwhelming even at 2mK.
|
82 |
Dinâmica de populações: um estudo a partir de autômatos celulares probabilísticos / Population dynamics: a study from cell probabilistic automataKelly Cristina de Carvalho 16 February 2005 (has links)
Apresentamos dois autômatos celulares com regras de interação locais que permitem descrever a dinâmica de população de um sistema predador-presa. Os modelos são definidos sobre uma rede regular quadrada e se diferenciam pelo caráter isotrópico ou anisotrópico da interação entre os sítios. A cada sítio é associada uma variável estocástica, que pode assumir três estados - vazio, presa ou predador. A dinâmica de competição entre espécies animais que nos interessa é a mesma descrita pelo modelo de Lotka-Volterra no qual as populações de presas e predadores oscilam temporalmente. Nosso objetivo é a análise dessas oscilações, como se comportam com o aumento da rede e se permanecem estáveis. Para a obtenção das séries temporais realizamos simulações de Monte Carlo. Para o autômato definido sobre o espaço isotrópico, também realizamos análise de campo médio dinâmico. Os resultados indicam que a oscilação é um efeito local (não sobrevive em sistemas infinitos), e é mais significativo devido à migração das espécies pelos subsistemas. O estudo da anisotropia revela alguns padrões espaciais organizados e que as oscilações são menos intensas do que no caso isotrópico e como consequência a fase ativa é mais abrangente. / We present two cellular automata with local interaction rules which allow us to describe the dynamical population of a predator-prey system. The models are defined on a regular square lattice and are distinguished by the isotropic or anisotropic character of the interaction between sites. To each site a stochastic variable is associated, which can assume three states- void, prey or predator. The competition dynamics between animal species which interest us is the same described by the Lotka-Volterra model in which the populations of preys and predators oscillate in time. Our aim is the analysis of these oscillations, how they behave with an increasing lattice and if they remain stable. In order to obtain temporal series we perform Monte Carlo simulations. For the automaton defined on isotropic space, dynamical mean field analysis was also performed. Results indicate that the oscillation is a local effect ( vanishing in infinite systems), and is more significant due to migration of species through the subsystems. The study of anisotropy reveals some organized spatial patterns and that oscillations are less intense than in the isotropic case and as a consequence the active phase is more comprehensive.
|
83 |
Uma generalização do modelo de spins e bóson para a transcrição de genes sob múltiplo controle / A generalization of the spin-boson model for gene transcription under multiple controlGuilherme da Costa Pereira Innocentini 04 June 2012 (has links)
Nesta tese propomos um modelo estocástico multimodal para regulação da expressão gênica em nível de transcrição. A definição de um espaço de parâmetros que contém o conteúdo biológico do sistema aliada à escolha apropriada de uma base para construir a matriz de acoplamento entre os estados do sistema levaram à obtenção de soluções exatas do modelo. Tais soluções são obtidas transformando as equações mestras em equações diferenciais parciais usando a técnica das funções geradoras e escrevendo os coeficientes das equações parciais em termos dos parâmetros biológicos do modelo. No regime estacionário obtivemos uma relação de recorrência para os coeficientes das séries de potências que definem as funções geradoras e a especificação das configurações de equilíbrio do sistema permite que estas séries sejam calculadas exatamente. Com as soluções exatas calculadas não só as distribuições de probabilidade foram obtidas como os momentos das distribuições. As distribuições de probabilidade de equilíbrio apresentam estruturas multimodais com vários picos e a análise do ruído (flutuação) mostra que a existência de um estado intermediário de eficiência transcricional leva a redução do ruído global do sistema. A inspeção dos autovalores da matriz de acoplamento mostrou que existem regiões onde a dinâmica dos momentos é de caráter oscilatória com amortecimento. Diferentes esquemas de acoplamento levam à diferentes regimes transientes, tal característica revela que o sistema multimodal apresentam maior flexibilidade adaptativa quando comparado com sistemas de um ou dois estados. / In this thesis we propose a stochastic model for multimodal regulation of gene expression at the transcriptional level. The definition of a parameter space that contains the contents of the biological system coupled with the appropriate choice of a base to build the coupling matrix between the states of the system led to the exact solutions of the model. Such solutions are obtained by transforming master equations in partial differential equations using the technique of generating functions and writing the coefficients of partial equations in terms of biological parameters of the model. In the steady a recurrence relation for the coefficients of power series defining the generating functions was obtained and specification of the equilibrium configurations of the system allows the exact calculation of these series. With the exact solutions calculated not only the probability distributions were obtained but also the moments of the distributions. The equilibrium distributions probability is multimodal and presents several peaks. Analysis of the noise (fluctuation) shows that the existence of an state with intermediate transcriptional efficiency leads to a reduction of the overall system noise. Inspection of the eigenvalues of the coupling matrix showed that there are regions where the dynamics of the moments is damped oscillating. Different coupling schemes lead to different transient regimes, this feature reveals that the multimodal system have greater adaptive flexibility when compared to systems of one or two states.
|
84 |
Mapeamento semântico com aprendizado estatístico relacional para representação de conhecimento em robótica móvel. / Semantic mapping with statistical relational learning for knowledge representation in mobile robotics.Fabiano Rogério Corrêa 30 March 2009 (has links)
A maior parte dos mapas empregados em tarefas de navegação por robôs móveis representam apenas informações espaciais do ambiente. Outros tipos de informações, que poderiam ser obtidos dos sensores do robô e incorporados à representação, são desprezados. Hoje em dia é comum um robô móvel conter sensores de distância e um sistema de visão, o que permitiria a princípio usá-lo na realização de tarefas complexas e gerais de maneira autônoma, dada uma representação adequada e um meio de extrair diretamente dos sensores o conhecimento necessário. Uma representação possível nesse contexto consiste no acréscimo de informação semântica aos mapas métricos, como por exemplo a segmentação do ambiente seguida da rotulação de cada uma de suas partes. O presente trabalho propõe uma maneira de estruturar a informação espacial criando um mapa semântico do ambiente que representa, além de obstáculos, um vínculo entre estes e as imagens segmentadas correspondentes obtidas por um sistema de visão omnidirecional. A representação é implementada por uma descrição relacional do domínio, que quando instanciada gera um campo aleatório condicionado, onde são realizadas as inferências. Modelos que combinam probabilidade e lógica de primeira ordem são mais expressivos e adequados para estruturar informações espaciais em semânticas. / Most maps used in navigational tasks by mobile robots represent only environmental spatial information. Other kinds of information, that might be obtained from the sensors of the robot and incorporated in the representation, are negleted. Nowadays it is common for mobile robots to have distance sensors and a vision system, which could in principle be used to accomplish complex and general tasks in an autonomously manner, given an adequate representation and a way to extract directly from the sensors the necessary knowledge. A possible representation in this context consists of the addition of semantic information to metric maps, as for example the environment segmentation followed by an attribution of labels to them. This work proposes a way to structure the spatial information in order to create a semantic map representing, beyond obstacles, an anchoring between them and the correspondent segmented images obtained by an omnidirectional vision system. The representation is implemented by a domains relational description that, when instantiated, produces a conditional random field, which supports the inferences. Models that combine probability and firstorder logic are more expressive and adequate to structure spatial in semantic information.
|
85 |
Análise de um sistema de navegação para veículo submarino autônomo. / Navigation system analysis for autonomous underwater vehicles.Rodrigo Eiji Yamagata Diana 07 May 2018 (has links)
O ambiente aquático tem notória importância para a pesquisa, pela biodiversidade e vastidão, e também do ponto de vista comercial, para a indústria militar e de óleo&gás por exemplo. Entretanto, a sua exploração é prejudicada por diversos fatores, entre eles devido à dificuldade de navegação. Infelizmente, carece-se de sinal GPS (Global Positioning System) embaixo d\'água, o que exige outras técnicas de localização. Assim, este trabalho analisa um sistema de navegação para um veículo submarino autônomo. Graças a sensores de velocidade, girômetros, bússola, entre outros, aplica-se o princípio de dead reckoning para calcular a posição atual do veículo a partir da última posição conhecida. Para tal, é feito inicialmente um estudo dos sensores a serem utilizados e um algoritmo de navegação é proposto, cujos resultados são expressos em coordenadas geodésicas (latitude e longitude), permitindo a visualização da trajetória do veículo em mapas geo-referenciados. Além disso, problemas práticos de medição são tratados. Em seguida, é feito um estudo sobre o ruído dos sensores, utilizando a curva de variância de Allan para caracterização dos sinais dos girômetros e do DVL (Doppler Velocity Logger). Por meio de equações de propagação de erro, os ruídos são recuperados em simulação, permitindo a estimação do erro de posição e de atitude (posição angular) acumulados para uma dada manobra. Finalmente, discute-se um critério de emersão a partir das estimativas de erro de posição. / The main part of our planet is filled with water, so the aquatic environment has notorious research and commercial importance. However, its exploration faces many difficulties. In navigation, the lack of GPS signal (Global Positioning System) during underwater missions requires different techniques, so this document focus on analyzing a navigation system for autonomous underwater vehicles. Thanks to different embedded sensors, like DVL (Doppler Velocity Logger), compass, gyrometers and others, the processes of dead reckoning is applied, witch calculates vehicle\'s current position by using the previously determined position. To do so, a navigation algorithm is implemented, providing geodesic coordinates to plot vehicle\'s trajectories on geo-referenced maps. Also, practical difficulties are discussed and treated. To improve the quality of the results, girometer\'s and DVL\'s errors are analyzed using Allan\'s variance and the navigation errors are estimated using first order time derivative equations in an augmented state space. Lastly, it is discussed a criterion to emerge and correct the vehicle\'s position using GPS signal.
|
86 |
Modelos de transição para dados binários / Transition models for binary dataIdemauro Antonio Rodrigues de Lara 31 October 2007 (has links)
Dados binários ou dicotômicos são comuns em muitas áreas das ciências, nas quais, muitas vezes, há interesse em registrar a ocorrência, ou não, de um evento particular. Por outro lado, quando cada unidade amostral é avaliada em mais de uma ocasião no tempo, tem-se dados longitudinais ou medidas repetidas no tempo. é comum também, nesses estudos, se ter uma ou mais variáveis explicativas associadas às variáveis respostas. As variáveis explicativas podem ser dependentes ou independentes do tempo. Na literatura, há técnicas disponíveis para a modelagem e análise desses dados, sendo os modelos disponíveis extensões dos modelos lineares generalizados. O enfoque do presente trabalho é dado aos modelos lineares generalizados de transição para a análise de dados longitudinais envolvendo uma resposta do tipo binária. Esses modelos são baseados em processos estocásticos e o interesse está em modelar as probabilidades de mudanças ou transições de categorias de respostas dos indivíduos no tempo. A suposição mais utilizada nesses processos é a da propriedade markoviana, a qual condiciona a resposta numa dada ocasião ao estado na ocasião anterior. Assim, são revistos os fundamentos para se especificar tais modelos, distinguindo-se os casos estacionário e não-estacionário. O método da máxima verossimilhança é utilizado para o ajuste dos modelos e estimação das probabilidades. Adicionalmente, apresentam-se testes assintóticos para comparar tratamentos, baseados na razão de chances e na diferença das probabilidades de transição. Outra questão explorada é a combinação do modelo de efeitos aleatórios com a do modelo de transição. Os métodos são ilustrados com um exemplo da área da saúde. Para esses dados, o processo é considerado estacionário de ordem dois e o teste proposto sinaliza diferença estatisticamente significativa a favor do tratamento ativo. Apesar de ser uma abordagem inicial dessa metodologia, verifica-se, que os modelos de transição têm notável aplicabilidade e são fontes para estudos e pesquisas futuras. / Binary or dichotomous data are quite common in many fields of Sciences in which there is an interest in registering the occurrence of a particular event. On the other hand, when each sampled unit is evaluated in more than one occasion, we have longitudinal data or repeated measures over time. It is also common, in longitudinal studies, to have explanatory variables associated to response measures, which can be time dependent or independent. In the literature, there are many approaches to modeling and evaluating these data, where the models are extensions of generalized linear models. This work focus on generalized linear transition models suitable for analyzing longitudinal data with binary response. Such models are based on stochastic processes and we aim to model the probabilities of change or transitions of individual response categories in time. The most used assumption in these processes is the Markov property, in which the response in one occasion depends on the immediately preceding response. Thus we review the fundamentals to specify these models, showing the diferences between stationary and non-stationary processes. The maximum likelihood approach is used in order to fit the models and estimate the probabilities. Furthermore, we show asymptotic tests to compare treatments based on odds ratio and on the diferences of transition probabilities. We also present a combination of random-efects model with transition model. The methods are illustrated with health data. For these data, the process is stationary of order two and the suggested test points to a significant statistical diference in favor of the active treatment. This work is an initial approach to transition models, which have high applicability and are great sources for further studies and researches.
|
87 |
Processo de otimização aplicada à análise de risco de investimento em geração de energia elétrica com fontes renováveis / Optimization process applied to investment risk analysis in power generation from renewable sourcesPinheiro Neto, Daywes 31 August 2017 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-09-22T14:00:22Z
No. of bitstreams: 2
Tese - Daywes Pinheiro Neto - 2017.pdf: 2567797 bytes, checksum: e19e41358dab14d4c81db95a21c6f3ce (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-09-22T14:01:46Z (GMT) No. of bitstreams: 2
Tese - Daywes Pinheiro Neto - 2017.pdf: 2567797 bytes, checksum: e19e41358dab14d4c81db95a21c6f3ce (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-09-22T14:01:46Z (GMT). No. of bitstreams: 2
Tese - Daywes Pinheiro Neto - 2017.pdf: 2567797 bytes, checksum: e19e41358dab14d4c81db95a21c6f3ce (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2017-08-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work presents a methodology for multiobjective optimization applied to risk analysis of investment in electricity generation from renewable sources. Analysis of hydro (large-scale and small-scale), wind, and photovoltaic energy is carried out considering the economic profile and demand of the investor. The methodology of risk analysis applies the Monte Carlo method to generate synthetic time series of the random variables. The investment analysis approaches are made for individual sources and also for different portfolios, using detailed modeling for the cash flow. The proposed mathematical modeling of multiobjective optimization takes into account aspects of commercialization, legislation, taxation, financing, and the investor's demand. The results provide information of the generation potential, statistical indicators of the Net Present Value and Modified Internal Rate of Return, as well as the Pareto frontiers. Thus, the investor can choose the best portfolio with hydro, wind and photovoltaic energy which satisfies their demand characteristics and their financial risk profile. Therefore, this work offers a valuable tool to support decision making and to contribute with the electric sector development. / Este trabalho apresenta metodologia para otimização multiobjetivo aplicada à análise de risco de investimento em geração de energia elétrica a partir de fontes renováveis. Realiza-se análise das fontes hidrelétrica (grande e pequeno porte), eólica e solar fotovoltaica, considerando o perfil econômico e a demanda do investidor. Para cada fonte, será apresentada metodologia de análise de risco que utiliza modelos econométricos, com a aplicação do método de Monte Carlo, para geração de séries sintéticas das variáveis aleatórias. São apresentadas abordagens de análise de investimento considerando as fontes separadamente e também a formação de portfólios, utilizando detalhada modelagem para o fluxo de caixa. É proposta modelagem matemática de otimização multiobjetivo que considera os aspectos de comercialização no Ambiente de Contratação Livre e no Ambiente de Contratação Regulado, a legislação pertinente ao setor elétrico e o atendimento à demanda do projeto. Os resultados fornecem informações do potencial de geração, indicadores estatísticos das distribuições de probabilidade do Valor Presente Líquido, da Taxa Interna de Retorno Modificada e do Payback Descontado, e também fronteiras de Pareto com as soluções ótimas para investimento, onde o investidor poderá optar pela melhor carteira de investimento, composta por usinas PCH, eólica e solar fotovoltaica, que satisfaz suas características de demanda e seu perfil de risco financeiro. Portanto, este trabalho oferece ferramenta de apoio à tomada de decisão que visa contribuir para o desenvolvimento do setor elétrico.
|
88 |
Tópicos em dinâmica evolucionária: monomorfismo no jogo hawk-dove e seleção multinível / Evolution dynamics topics; monomorphism in the hawk-dove game and multilevel selectionPaulo Victor Camargo Rossi 18 March 2013 (has links)
Nesta dissertação aplicamos conceitos de Teoria de Jogos Evolucionária ao jogo Hawk-Dove introduzido originalmente por Maynard Smith como um modelo para lutas convencionais [37]. Estudamos então a competição entre estratégias puras (consistentes) e mistas/aleatórias (inconsistentes) em uma extensão deste jogo que, sujeita a efeitos estocásticos, apresenta um mecanismo de drift que leva à população a um equilíbrio monomórfico da estratégia inconsistente. Também estudamos o problema do altruísmo forte e os efeitos de uma demografia de grupos em sua evolução, baseado no framework 2LFW de Schonman, Vicente e Caticha [58]. Elaboramos uma fórmula para a probabilidade de extinção do processo em seus estágios iniciais e calculamos e simulamos os equilíbrios estáveis do framework no regime de seleção fraca em t ! 1 para alguns jogos de interesse. / In this dissertation we have applied Evolutionary Game Theory concepts to the Hawk-Dove game that has been originally introduced by Maynard Smith as a model for conventional aggression [37]. We then studied the competition between pure (consistent) and mixed/random (inconsistent) strategies in an extension of this game which, subject to stochastic effects, presents a drift mechanism that drives the population to a monomorphic equilibrium of the inconsistente strategy. We have also studied the problem of Strong Altruism and the effects of a group demography in its evolution, based on Schonman, Vicente and Catichas 2LFW framework [58]. We have elaborated a formula for the processs extinction probability in its initial stages and calculated and simulated the stable equilibriums of the framework under weak selection for t ! 1 for some games of interest.
|
89 |
Não monotonicidade do parâmetro crítico no modelo dos sapos / Non monotonicity of the critical parameter in the Frog ModelAlexandre Ribeiro Leichsenring 18 February 2003 (has links)
Estudamos um modelo de passeios aleatórios simples em grafos, conhecido como modelo dos sapos. Esse modelo pode ser descrito de maneira geral da seguinte forma: existem partículas ativas e partículas desativadas num grafo G. Cada partícula ativa desempenha um passeio aleatório simples a tempo discreto e a cada momento ela pode morrer com probabilidade 1-p. Quando uma partícula ativa entra em contato com uma partícula desativada, esta é ativada e também passa a realizar, de maneira independente, um passeio aleatório pelo grafo. Apresentamos limites superior e inferior para o parâmetro crítico de sobrevivência do modelo dos sapos na árvore, e demonstramos que este parâmetro crítico não é uma função monótona do grafo em que está definido. / We study a system of simple random walks on graphs, known as frog model. This model can be described generally speaking as follows: there are active and sleeping particles living on some graph G. Each particle performs a simple random walk with discrete time and at each moment it may disappear with probability 1 - p. When an active particle hits a sleeping particle, the latter becomes active and starts to perform, independently, a simple random walk on the graph. We present lower and upper bounds for the surviving critical parameter on the tree, and we show that this parameter is not a monotonic function of the graph it is defined on.
|
90 |
Construção e aplicação de HMMs de perfil para a detecção e classificação de vírus / Construction and application of profile HMMs for the specific detection and classification of virusesGuimarães, Miriã Nunes 22 February 2019 (has links)
Os vírus são as entidades biológicas mais abundantes encontradas na natureza. O método clássico de estudo dos vírus requerem seu isolamento e propagação in vitro. Contudo, necessita-se ter um conhecimento prévio sobre as condições necessárias para seu cultivo em células, sendo assim a maior parte dos vírus existentes não é conhecida. Análises metagenômicas são uma alternativa para a detecção e caracterização de novos vírus, uma vez que não requerem um cultivo prévio e as amostras podem conter material genético de múltiplos organismos. Uma vez obtidas as sequências montadas a partir das leituras metagenômicas, o método mais utilizado para a identificação e classificação dos organismos é a busca de similaridade com o programa BLAST contra bancos de sequências conhecidas. Contudo, métodos de alinhamento pareado são capazes de identificar apenas sequências com identidade superior a 20-30%. Uma alternativa a essa limitação é o uso de métodos baseados no uso de perfis, que podem aumentar a sensibilidade de detecção de homólogos filogeneticamente distantes. HMMs de perfil são modelos probabilísticos capazes de representar a diversidade de caracteres em posições-específicas de um alinhamento de múltiplas sequências. Nosso grupo desenvolveu a ferramenta TABAJARA, utilizada neste projeto, para a identificação de blocos que podem ser conservados em todas as sequências do alinhamento ou discriminativos entre grupos de sequências. Esses blocos são utilizados para a geração de HMMs de perfil, os quais podem ser usados, no contexto da virologia, para a identificação de grupos taxonômicos amplos como famílias virais ou, ainda, taxa mais restritos como gêneros ou mesmo espécies de vírus. O presente projeto teve como objetivos aplicar e otimizar o programa TABAJARA em diferentes grupos taxonômicos de vírus, construir modelos específicos para cada um desses grupos e validar esses modelos em dados metagenômicos. O primeiro modelo de estudo escolhido foi a ordem Bunyavirales, composta de vírus de ssRNA (-) majoritariamente envelopados e esféricos, com genoma segmentado e pertencentes ao grupo 5 da classificação de Baltimore. Este grupo inclui vírus causadores de várias doenças em humanos, animais e plantas. O segundo modelo de estudo escolhido foi a família Togaviridae, composta de vírus de ssRNA (+) envelopados e esféricos, cujo genoma expressa uma poliproteína e pertencem ao grupo 4 da classificação de Baltimore. Este grupo inclui o vírus Chikungunya e outras espécies que causam diversas patologias ao homem. O terceiro modelo de estudo escolhido foi a subfamília Spounavirinae, compreendendo bacteriófagos que infectam vários hospedeiros bacterianos e em alguns casos possuem potencial terapêutico comprovado contra infecções bacterianas que afetam o homem. Estes fagos apresentam partículas virais com estrutura cabeça-cauda, não são envelopados, apresentam genoma de dsDNA e pertencem ao grupo 1 da classificação de Baltimore. Todos os modelos construídos foram validados quanto à sensibilidade e especificidade de detecção e, ao final, foram utilizados em análises de prospecção de vírus em dados metagenômicos obtidos na base SRA do NCBI. Os HMMs de perfil apresentaram excelente desempenho, comprovando a viabilidade da metodologia proposta neste projeto. Os resultados apresentados neste trabalho abrem a perspectiva da ampla utilização de HMMs de perfil como ferramentas universais para a detecção e classificação de vírus em dados metagenômicos. / Viruses are the most widely biological entities found in nature. Most of the information that can be obtained from these organisms requires viral in vitro isolation and cultivation. However, most of the existing viruses are still unknown because the biological requirements for their successful propagation have not been identified so far. Metagenomic analyses offer an interesting alternative for the detection and characterization of novel viruses, since previous cultivation is not required, and the samples may contain genetic material of multiple organisms. Once assembled sequences are obtained from individual reads, the most widely used method for viral identification and classification is the use of BLAST similarity searches against databases of known sequences. However, pairwise alignment methods are only able to identify sequences that present identity greater than 20-30%. Profile-based methods may increase the sensitivity of detection of remote homologues. Profile HMMs are probabilistic models capable of representing the diversity of amino acid residues at specific positions of a multiple sequence alignment. Our group is developing TABAJARA, a tool for the identification of alignment blocks that are conserved across all sequences of the alignment or discriminative between groups of sequences. These blocks are used to generate profile HMMs, which can in turn be used, in the context of virology, to identify broad taxonomic groups, such as viral families, or narrower taxa as genera or viral species. The present project aimed to apply and standardize the use of TABAJARA in different taxonomic groups of viruses, to build specific models for each of these groups and to validate these models in metagenomic data. We used three viral models for this study. The first chosen model was the Bunyavirales order, composed of mostly enveloped and spherical ssRNA(-) viruses with a segmented genome belonging to group 5 of the Baltimore classification. This group includes viruses that cause several important diseases in humans, animals and plants. The second chosen model was the Togaviridae family, composed of enveloped and spherical ssRNA(+) viruses, with a genome coding for a polyprotein, and belonging to group 4 of the Baltimore classification. This group includes the Chikungunya virus and some other viral species that cause relevant pathologies to humans and animals. Finally, we used the Spounavirinae subfamily, comprising viruses that infect a variety of bacterial hosts and that can potentially be used for phage therapy of some human bacterial diseases. These phages present non-enveloped virions with a head-to-tail structure, a dsDNA genome, and belong to group 1 of the Baltimore classification. All constructed profile HMMs were evaluated in regard to their sensitivity and specificity of detection, as well as tested in viral surveys using metagenomic data from the SRA database. The profile HMMs presented excellent performance, proving the viability of the methodology proposed in this project. The results presented in this work open the perspective of the wide use of profile HMMs as universal tools for the detection and classification of viruses in metagenomic data.
|
Page generated in 0.1188 seconds