Return to search

Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos

Orientadora : Profª. Drª. Maria Berenice Steffens / Coorientador : Prof. Dr. Roberto Tadeu Raittz / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 16/05/2013 / Inclui referências / As bactérias são organismos unicelulares que apresentam ampla diversidade morfológica, metabólica e ecológica. Estes microrganismos pertencem ao Domínio Bactéria que, atualmente, conta com 52 Filos. A taxonomia bacteriana inclui a descolberta, descrição e classificaçãode acordo com normas e princípios, o processo formal de atribuição de nome e a identificação propriamente dita, de um organismo desconhecido. Historicamente, a identificação e classificação de bactérias tem se baseado principlamente na morfologia, composição e meio de cultuvo, potencial de patogenicidade, fisiologia e bioquímica. atualmente, são também utilizadas informações de ordem fenotípica, genotípica, ecológica e filogenética para produzir uma taxonomia multidimensional. A proposta deste trabalho foi auxiliar na aplicação dos métodos convencionais atraés da associação da abordagem computacional ao processo de identificação e classificação de bactécrias. Foi aplicado o conceito de aprendizado de máquina no desenvolvimento de uma ferramenta que permite realizar o posicionamento taxonômico de bactérias baseado em ensaios bioquímicos e fisiológicos. O sistema apresenta funcionalidades que permitem ao usuário cadastrar artigos científicos e espécies bacterianas; cadastrar diferentes categorias de testes e os respectivos resultados (características) disponíveis na literatura ou obtidos no laboratório; obter relatórios referentes aos resultados cadastrados e, finalmente extrair características a serem utilizadas no treinamento da rede neural FAN (módulo integrado), para então obter o posicionamento taxonômico, em nível de gênero, de uma dada bactéria. Um protótipo foi construído com dados coletados de artigos que descrevem novas espécies de bactérias e o conjunto contem 228 espécies pertencentes a 10 gêneros. Em paralelo, foi estruturado um banco de dados para armazenamento e consula dos artigos. O treinamento da rede foi validado pelo Cross-validation ( Leave one out) com uma taxa de acerto de 93%. Isto indica que é possível obter a calssificação de bactérias utilizando somente resultados de ensaios bioquímicos e fisológicos.

Palavras chaves: Taxonimia de bactérias, rede neural, bioinformática / Abstract: Bacteria are unicellular organisms that display a wide morphological, metabolic and ecological diversity. These microorganisms belong to the domain Bacteria, which currently has 52 phyla. Bacterial taxonomy includes the discovery, description and classification according to rules and principles, the formal process of naming and identification, strictly speaking, an unknown organism. Historically, the identification and classification of bacteria has been mainly based on the morphology, composition of the culture medium, potential pathogenicity, physiology and biochemistry. Currently, phenotypic, genotypic, phylogenetic and ecological information is also used to produce a multidimensional taxonomy. The purpose of this study was to assist in the application of conventional methods by combining the computational approach to the identification and classification of bacteria process. The concept of machine learning as a tool which allows the taxonomic position of bacteria based on biochemical and physiological tests was applied in the development. The system displays features that allow the user to register scientific articles and bacterial species; to register different categories of tests and results (features) available in the literature or obtained in the laboratory; to obtain reports on the results registered and finally to extract features to be used in the FAN neural network training (integrated module), and then to obtain the taxonomic position of the genus of a certain bacterium. A prototype was built with data collected from articles describing new species of bacteria and the set contained 228 species belonging to 10 genera. In parallel, it was created a database for storage and retrieval of articles. Network training was validated by cross-validation (leave one out) with an accuracy rate of 93%. This indicates that it is possible to obtain the classification of bacteria using only results from biochemical and physiological tests.
Key words: Taxonomy of bacteria, neural network, bioinformatics

Identiferoai:union.ndltd.org:IBICT/oai:dspace.c3sl.ufpr.br:1884/36136
Date January 2013
CreatorsSantana, Julio Galvão
ContributorsSteffens, Maria Berenice Reynaud, Raittz, Roberto Tadeu, Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format108p. : il. algumas color., tabs., grafs., application/pdf
Sourcereponame:Repositório Institucional da UFPR, instname:Universidade Federal do Paraná, instacron:UFPR
Rightsinfo:eu-repo/semantics/openAccess
RelationDisponível em formato digital

Page generated in 0.0178 seconds