Resumo: Genes e proteínas são de grande importância biológica para a compreensão de processos bioquímicos e requerem nomes consistentes. Existem diversas diretrizes para nomenclatura de genes, mas elas não são rigorosamente aplicadas à atribuição de nomes aos genes recém-identificados, gerando assim, inúmeras maneiras de nomear um mesmo gene. Este trabalho tem o objetivo de detectar e minimizar a redundância e a inconsistência de dados para colaborar com a identificação correta de genes. Para isso foram utilizadas técnicas de Inteligência Artificial para identificar os sinônimos realizando um estudo dirigido a dez experimentos distintos. Para selecionar os dados dos experimentos foi construído um banco de dados relacional para armazenar as informações constantes na base NR do NCBI e as informações identificadas neste estudo. Os dados do experimento foram minerados através das técnicas de mapas auto-organizáveis de Kohonen. A Rede SOM de Kohonen foi aplicada para exprimir as relações de similaridade entre os dados. Para identificação dos agrupamentos gerados pela rede SOM foi utilizada a técnica denominada Matriz-U. As informações resultantes deste trabalho permitem inferir os sinônimos dos genes, identificar prováveis nomes para genes nomeados como hipotéticos e apontar possíveis erros de anotação.

Identiferoai:union.ndltd.org:IBICT/oai:dspace.c3sl.ufpr.br:1884/31637
Date11 September 2013
CreatorsOtemaier, Kelly Rafaela
ContributorsMarchaukoski, Jeroniza Nunes, Steffens, Maria Berenice Reynaud, Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFPR, instname:Universidade Federal do Paraná, instacron:UFPR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0017 seconds