Spelling suggestions: "subject:"seqüencia dde nucleotideos"" "subject:"seqüencia dde nucleotídios""
1 |
Avaliação quantitativa de sistemas preditores de função de proteinasRodrigues, Bárbara Nobrega 21 May 2013 (has links)
Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados.
|
2 |
Aplicação da inteligência artificial na anotação automática de genomas bacterianosTibães, Juliana Helena January 2012 (has links)
Orientador : Prof. Dr. Fábio de Oliveira Pedrosa / Co-Orientador: Prof. Dr. Roberto Tadeu Raittz / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 16/02/2012 / Bibliografia: fls. 81-86 / Resumo: O propósito da anotação é identificar sequências de DNA codificadoras de RNAs ou proteínas, esse processo é importante porque atribuem funções moleculares aos produtos gênicos. Para isso, são utilizadas ferramentas computacionais de anotação de genes que usam alinhamentos de sequência de proteína ou de DNA com o propósito de identificar genes homólogos e utilizar as informações de banco de dados de domínio público para inferir a função do gene. Embora sejam técnicas eficientes, elas podem estar sujeitas a erros quando realizada sem curadoria de um perito, em particular quando ocorre inexistência de grau de similaridade significativo de uma sequência comparada com outras sequências ou quando o banco de dados é composto por sequências parciais. Além disso, a taxa de erro de anotação pode ser significativamente aumentada quando a sequência de proteína de consulta é nova, compartilhando nenhuma semelhança com qualquer sequência disponível em bases de dados. Por esses motivos, neste trabalho desenvolveu-se uma ferramenta para verificar anotação de genes em genomas completos de bactérias, o programa Bioinformatics Tool Based on Bacterial Genomes Comparison (BOBBLES). Ele realiza a verificação da predição de genes computacionalmente propostos pelo programa Hybrid-Gene Finder (HGF). O programa BOBBLES compara a anotação de um genoma de referência completo de bactérias com os genes identificados pelo programa HGF. Este programa utiliza duas abordagens de comparação de sequências, uma utilizando pesquisas de similaridade de sequência através do programa BlastP e a outra utilizando o programa SILA. Ambas as abordagens servem para decidir se as sequências sugeridas pelo programa HGF foram anotadas corretamente. Para testar a ferramenta BOBBLES, utilizou-se um conjunto composto por 14 genomas bacterianos completos. Foram encontrados 365 novos genes e 101 genes com melhor ou similar grau alinhamento em fase de leitura diferente do genoma de referência, resultando em uma porcentagem de acerto de aproximadamente 76 % para esse conjunto de genomas, utilizando o alinhamento das sequências com o programa SILA. Já com o alinhamento realizado pelo programa Blastp obteve-se 529 novos genes. No entanto, o tempo médio estimado de execução do programa BOBBLES tendo em seu algoritmo a ferramenta SILA é de pelo menos cinco vezes mais rápido do que utilizando o programa BlastP. Essa diferença de tempo é justificada pelo fato do programa SILA realizar os alinhamentos das sequências com indexação recursiva em um banco de dados local, o banco de dados de proteínas não redundantes do NCBI, conhecido por NR. / Abstract: The annotation purpose is to identify DNA sequences coding for proteins or RNAs, this process is important because it gives the molecular function for the genes products. For that, it's used Gene Annotation tools using protein or DNA sequences alignments to identify homologous genes and use information from the public database to infer gene function. Although these are efficient techniques, they can be error-prone when performed without curation of an expert, particularly in cases of similarity sequence with no degree of similarity with other sequences that may be relevant or when the database is composed by partial sequences. In addition, annotation error rate can be significantly increased when it's a new query protein sequence, sharing no similarity with any available sequence in databases. Therefore, this work has developed a tool to verify genes annotation in complete bacterial genomes, the Bioinformatics Tool Based on Bacterial Genomes Comparison program (BOBBLES). It realizes the computationally gene prediction performed by Hybrid-Gene Finder (HGF). The BOBBLES compares a previous complete bacterial genome annotation with the genes identified by HGF program. This program uses two sequence comparison approaches, the first one using the BlastP program, and another approach using the SILA program, to decide whether they were recorded correctly. The BOBBLES was tested using a set composed of 14 complete bacterial genomes. These tests obtained 365 new genes and 101 genes with better or similar alignment in process of reading different from the reference genome, resulting in 76% of correct results for genomes set which used the alignment of sequences with the SILA program. But using the BlastP program, 529 new genes were obtained. However, the estimated average execution time for the BOBBLES program using SILA program was at least five times faster than using the BlastP program. This time difference is justified by the fact that the SILA program performs the alignments of the sequences with recursive indexing into a local database, the NCBI's non-redundant protein sequence (NR) database.
|
3 |
Genetic Transcript Analyzer : ferramenta computacional para análise de transcrição gênica por RNA-SEQSilva, Jesse Teixeira da January 2012 (has links)
Coorientadora: Profa. Dra. Rose Adele Monteiro / Orientador : Prof. Dr. Luiz Antônio Pereira Neves / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 27/02/2012 / Bibliografia: fls. 61-64 / Resumo: Atualmente, com as inúmeras tecnológicas disponíveis para sequenciamento de transcritos, o problema consiste no número de ferramentas computacionais para a análise de dados. Neste trabalho apresentamos o desenvolvimento do Genetic Transcript Analyzer (GTA), uma nova ferramenta para comparação de resultados da análise de expressões gênicas por RNA-Seq para diferentes amostras, gerando informações mais ricas a partir de dados brutos no formato BAM ou SAM. O sistema proposto é freeware e foi desenvolvido utilizando a linguagem de programação Java® com auxílio da ferramenta SamTools®, uma biblioteca Java para leitura de arquivos no formato SAM e BAM (Heng li et al, 2009). As validações do sistema deram-se através de entrevistas de satisfação dos usuários e comparações diretas com programas de planilhas eletrônicas e também com comparações descritivas com outros softwares disponíveis que possuam módulos semelhantes ao aqui proposto. O resultado desta pesquisa foi o desenvolvimento de uma solução simples e prática para analisar os resultados de sequenciamentos realizados por máquinas de sequenciamento da nova geração através do método Rna-Seq. / Abstract: Nowadays, with a large number of technological tools available, the bottleneck has moved from collection to data analysis. This paper presents the development of the GTA (Genetic Transcript Analyzer), a new tool for comparing biological samples and analysis of statistical data, comparing their gene expression and generating richer information from the raw data type coming from sorted BAM files. The proposed system is freeware and was designed and built using the Java® language with the tool Samtools®, a Java library for reading files in SAM and BAM files(Heng li et al, 2009) . The system validations are made through user satisfactions interviews and direct comparisons with the program actually used by the professional, the Microsoft Excel and also descriptive comparison with others softwares that can make genetic data comparisons . As result we had developed a new computer software able to analyze the results of the new high output machines that works with Rna-Seq.
|
Page generated in 0.0503 seconds