Return to search

Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas

A região promotora é uma sequência de DNA localizada anteriormente à uma
região codificante e é responsável por iniciar o processo de transcrição. Deste modo,
atua como um elemento regulador. O estudo da regulação da expressão gênica
auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre
a funcionalidade dos genes em diferentes espécies, na resposta celular frente às
mudanças ambientais, entre outras questões. Embora os métodos computacionais
para a predição de genes possuam uma boa acurácia o mesmo não é conseguido
para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao
padrão pouco conservado, o que gera resultados com alto número de falsos
positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na
predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas.
Diferente de outros trabalhos, a predição realizada não foi limitada
apenas aos promotores dos genes constitutivos; foi realizada também para as
demais classes de sequências promotoras. Além da abordagem clássica utilizando a
composição de nucleotídeos foram empregados os valores de estabilidade da
sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma
ferramenta própria para a predição de promotores, foram extraídas regras de
inferência (baseadas no conhecimento produzido durante o treinamento da rede)
que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP.
Até o presente, os resultados obtidos com o BacPP foram satisfatórios e
comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os
fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%;
97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores
pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%.
Considerando a importância da predição de promotores e a ausência de banco de
dados com informações para outras bactérias, implementou-se o IntergenicDB, um
banco de dados com diversas informações sobre as sequencias intergênicas e o
valor de classificação destas para os diferentes fatores σ bacterianos, conforme os
resultados obtidos com o BacPP. / Submitted by Marcelo Teixeira (mvteixeira@ucs.br) on 2014-06-17T12:01:02Z
No. of bitstreams: 1
Tese Scheila de Avila e Silva.pdf: 5973071 bytes, checksum: f889c78c177d3610ab61727477ea5cfc (MD5) / Made available in DSpace on 2014-06-17T12:01:02Z (GMT). No. of bitstreams: 1
Tese Scheila de Avila e Silva.pdf: 5973071 bytes, checksum: f889c78c177d3610ab61727477ea5cfc (MD5) / The promoter region is located some few base pairs before a coding region. It
is responsible for initiating gene expression process, thus, it can plays a regulatory
role. The study about gene expression regulation can assist mainly in the
comprehension of complex metabolic network presented by several organisms and
cellular answer considering the environment changes. The computational methods to
gene prediction have a good accuracy, but this is not achieved in promoter prediction.
This difficulty occurs because of the length of the promoter and its degenerate
pattern. Those features can explain results with a great number of false positives
present in the literature. The present thesis has as its main goal the neural networks
applied to Gram-negative promoter prediction, recognition and characterization.
Beside the classical approach with the nucleotides of the sequence, the prediction
was also made by using stability values. Aiming at developing a own tool for bacterial
promoter prediction, the rules extraction was carried out and the results were
weighted and implemented. This tool, named BacPP, presents results comparable
with the related literature. Currently, the BacPP specific accuracy for σ24, σ28, σ32, σ38,
σ54 and σ70 were 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectively.
Furthermore, when challenged with promoter sequences belonging to other
enterobacteria BacPP maintained 76% accuracy overall. Currently, there is no
databases dedicated for other Gram-negative promoter than E.coli. For this reason,
IntergenicDB was modeled and implemented. This database was projected to collect
several pieces of information about the sequences and the organisms to which they
belong and, the classification results originated from BacPP for each sequence.

Identiferoai:union.ndltd.org:IBICT/oai:vkali40.ucs.br:11338/691
Date19 December 2011
CreatorsSilva, Scheila de Ávila e
ContributorsLemke, Ney, Ferreira, Henrique Bunselmeyer, Ribeiro, Helena Graziottin, Echeverrigaray, Sérgio, Gerhardt, Günther Johannes Lewczuk
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UCS, instname:Universidade de Caxias do Sul, instacron:UCS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds