Análises filogenéticas são bastante utilizadas para a compreensão das relações existentes entre objetos biológicos, beneficiando as investigações em vários campos das ciências da vida. Vários métodos computacionais para reconstruir filogenias tem sido desenvolvidos. Em geral, os métodos que fornecem filogenias mais confiáveis, requerem significativamente maior tempo computacional, restringindo a aplicação deles a conjuntos de dados relativamente pequenos. Por outro lado, a utilização de conjuntos de dados maiores é fundamental para proporcionar uma amostragem que seja suficiente, para restringir as incongruências na identificação de clados em uma filogenia. Este trabalho propõe uma abordagen (denominada CladeNet) de reamostragem de filogenias, obtidas por algoritmos relativamente eficientes, a fim de melhorar a identificação de clados. Experimentos com sete conjuntos de dados, que variam de dezenas a centenas de sequências de DNA mostram que, em geral, clados encontrados pela abordagem proposta tornam-se mais confiavéis, conforme os tamanhos dos conjuntos de sequências aumentam, com um moderado aumento do tempo computacional relativamente moderado. Além disso, o CladeNet é um método que também inova ao identificar clados de forma automáticamente por meio de um algoritmo de identificação de comunidades em redes. / Phylogenies are useful for understanding relationships among biological objects, benefiting investigations in various fields of life sciences. Several computational methods for reconstructing phylogenies have been developed. In general, methods that provide more reliable phylogenies require significantly larger computing time, constraining their application to relatively small datasets of objects. On the other hand, the use of larger datasets is fundamental to provide enough samples in order to reduce incongruence in clade identification from a phylogeny. This work proposes an approach of resampling phylogenies (called CladeNet) obtained from relatively efficient algorithms, in order to improve clade identification. Experiments with seven datasets with sizes varying from dozens to hundreds of DNA sequences show that, in general, clades found by the proposed approach are more reliable as the dataset sizes augment, with relatively moderate increase of computing time. Moreover, CladeNet is a new method for identifying clades in an automatic way by means of community detection algorithm for networks.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-24012014-105240 |
Date | 11 October 2013 |
Creators | Mansour, Eva Reda Moussa |
Contributors | Delbem, Alexandre Cláudio Botazzo |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0023 seconds