Submitted by Maike Costa (maiksebas@gmail.com) on 2017-07-03T13:42:30Z
No. of bitstreams: 1
arquivototal.pdf: 2175297 bytes, checksum: 0d32244b68ce823204f52f4f1ca022de (MD5) / Made available in DSpace on 2017-07-03T13:42:30Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 2175297 bytes, checksum: 0d32244b68ce823204f52f4f1ca022de (MD5)
Previous issue date: 2017-02-24 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Genomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired
through the phenomenon of horizontal transfer. Usually, these regions provide important
adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects
can be harmful to other species. For these reasons, many computational methodologies
have been proposed for their prediction, however, none of them are capable to precisely
identify the whole repertoire of islands present in a given genomic sequence. Therefore,
the development of new approaches that explore different aspects of these regions is
timely, allowing the identification of those not known. In this paper, it is proposed a novel
method for the identification of GIs, built based on mean shift clustering algorithm, with
the automatic bandwidth calculation, necessary to its operation. Test results with genomic
island inserted in bacterial genomes show that the method is capable of identifying these
regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with
known GIs revealed the potential of the method for their identification and for the discovery
of new island. The detailed study of the new islands content pointed the presence of typical
GIs elements, confirming its effectiveness in the prediction of these regions. / Ilhas genômicas (IGs) são regiões do genoma de bactérias e arqueas adquiridas por meio
do fenômeno da transferência horizontal. Frequentemente, essas regiões proporcionam importantes
adaptações a esses organismos, como resistência a antibióticos e patogenicidade,
cujos efeitos podem ser danosos a outras espécies. Por essa razão, diversas metodologias
computacionais foram propostas para a sua predição, porém nenhuma capaz de identificar o
repertório completo de ilhas presentes em uma determinada sequência genômica. Portanto,
torna-se oportuno o desenvolvimento de novas abordagens que explorem diferentes aspectos
dessas regiões, permitindo a identificação daquelas não conhecidas. Nesse trabalho,
propõe-se um novo método para a identificação de IGs, construído com base no algoritmo
de agrupamento mean shift, com o cálculo automático da largura de banda, indispensável
para o seu funcionamento. Resultados dos testes com ilhas genômicas inseridas em genomas
de bactérias mostram que o método é capaz de identificar essas regiões com taxas de acerto
acima de 99%. Testes realizados com genomas de bactérias com IGs conhecidas revelaram
o potencial do método para a sua identificação e para a descoberta de novas ilhas. O estudo
detalhado do conteúdo das novas ilhas apontou a presença de elementos típicos de IGs,
confirmando a eficácia do método na predição dessas regiões.
Identifer | oai:union.ndltd.org:IBICT/oai:tede.biblioteca.ufpb.br:tede/9040 |
Date | 24 February 2017 |
Creators | Brito, Daniel Miranda de |
Contributors | Rêgo, Thaís Gaudêncio do |
Publisher | Universidade Federal da Paraíba, Programa de Pós-Graduação em Informática, UFPB, Brasil, Informática |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFPB, instname:Universidade Federal da Paraíba, instacron:UFPB |
Rights | info:eu-repo/semantics/openAccess |
Relation | -487746387940377586, 600, 600, 600, 600, -8907815646913317584, 3671711205811204509, 3590462550136975366 |
Page generated in 0.0074 seconds