Spelling suggestions: "subject:"informática.""
231 |
Clonagem e expressão do gene E6 do Papilomavírus Bovino do tipo 1. / Cloning and expression of Bovine Papillomavirus type 1 E6 gene.Souza, Jacqueline Mazzuchelli de 27 May 2013 (has links)
O Papilomavírus Bovino do tipo 1 (BPV-1) causa fibropapilomas em bovinos e sarcóide em equinos, associados à expressão de oncoproteínas virais, principalmente E6 e E7. A purificação de oncoproteínas a partir de sistema recombinante possibilita seu estudo. Os objetivos foram expressar o gene E6 do BPV-1, purificar e analisar in silico a proteína recombinante obtida. O amplificado foi clonado em E. coli e os plasmídeos foram sequenciados, confirmando a matriz correta de leitura. Após indução da expressão, a proteína recombinante foi identificada e purificada. A microscopia eletrônica mostrou a formação de corpúsculos de inclusão. As análises in silico apontaram as mutações das sequências gênica e proteica de E6-1 em relação às depositadas. Foi realizada a predição tridimensional da estrutura da proteína recombinante e identificadas as regiões conservadas, antigênicas e capazes de realizar ligações cátion-<font face=\"Symbol\">p. Logo, a proteína recombinante E6 do BPV-1 foi obtida e purificada com sucesso, possibilitando o início de novos experimentos e estudos mais detalhados. / Bovine Papillomavirus type 1 (BPV-1) causes fibropapillomas in cattle and sarcoid in equines, associated with the expression of viral oncoproteins, E6 and E7 particularly. Purification of oncoproteins from recombinant system allows their study. The aim of this study was cloning and expressing BPV-1 E6 gene, purify and analyze in silico recombinant protein. Amplicon was cloned into E. coli and the plasmids were sequenced to confirm the correct reading frame. After induction of expression, the recombinant protein was identified and purified. Electron microscopy showed the inclusion bodies formation. In silico analysis showed mutations in E6-1 gene and protein sequences when there were compared to sequences available in current database. Three-dimensional structure prediction of the recombinant protein was performed and conserved, antigenic and cation-<font face=\"Symbol\">p interaction regions were identified. Therefore, BPV-1 E6 recombinant protein was obtained and successfully purified enabling new experiments and more detailed studies.
|
232 |
Ferramentas computacionais para o estudo estrutural e funcional de genes de dermatófitos potencialmente envolvidos na patogenicidade / Computational tools for the structural and functional study of dermatophytes genes potentially involved in pathogenicitySanches, Pablo Rodrigo 16 September 2015 (has links)
Dermatófitos são fungos filamentosos que infectam substratos queratinizados como pele, unha e cabelo em busca de nutrientes para se desenvolverem e permanecerem no hospedeiro. Pertencem aos gêneros Epidermophyton, Microsporum ou Trichophyton, os quais, dependendo de seu habitat natural, são classificados em espécies geofílicas, zoofílicas ou antropofílicas. O uso indiscriminado de antifúngicos levou à seleção de cepas resistentes, e o comportamento invasivo desses patógenos em pacientes imunodeprimidos aumentou nos últimos anos, dificultando o tratamento das dermatofitoses. Há, portanto, a necessidade de estudos para um melhor entendimento da biologia dos dermatófitos devido as suas importâncias médica e/ou veterinária e o escasso conhecimento da interação destes patógenos com os hospedeiros. No presente trabalho, analisamos oito espécies de dermatófitos: Arthroderma benhamiae, Microsporum canis, Microsporum gypseum, Trichophyton interdigitale, Trichophyton equinum, Trichophyton rubrum, Trichophyton tonsurans e Trichophyton verrucosum. Análises de genômica comparativa e de expressão de genes potencialmente envolvidos na degradação de queratina foram realizadas. Além disso, efetuamos o sequenciamento genômico em larga escala de uma das linhagens. A estrutura dos genes sub3, sub5 e sub7, que codificam serina endopeptidases com atividade queratinolítica, mep3 e mep4, que codificam proteínas pertencentes ao grupo das metaloendopeptidases, dppV, lap1 e lap2, que codificam exopeptidases, foi analisada por meio de ferramentas computacionais. Essas análises revelaram que os genes que codificam proteases possuem alto grau de conservação em suas estruturas, que é menor quando comparadas apenas suas regiões não codificadoras. As análises permitiram também a identificação em regiões promotoras de consensos específicos a gêneros de dermatófitos. Observamos que o acúmulo de transcritos destes genes, avaliados durante o cultivo em queratina, mimetizando o processo infeccioso, não está correlacionado à similaridade das sequências gênicas entre as espécies. Não encontramos correlação entre o nicho preferencial dos dermatófitos e suas sequências gênicas ou níveis transcricionais. Observamos que, na grande maioria das vezes, genes que codificam endo e exopeptidases, possuem acúmulo de transcritos em períodos iniciais de degradação de queratina. Nossos resultados sugerem que diferenças pontuais na sequencia gênica, diferenças em regiões promotoras ou, até mesmo, expressão variável destes genes que codificam um conjunto proteico com funções sinérgicas e provavelmente compensatórias, contribuam para os diferentes graus de reações inflamatórias no hospedeiro, bem como para a especificidade patógeno-hospedeiro. / Dermatophytes are filamentous fungi that infect keratinized substrates such as skin, nail and hair, searching for nutrients for their development and permanence in the host. They belong to the genera Epidermophyton, Microsporum or Trichophyton, and, depending on their natural habitat, are classified into geophilics, zoophilics or anthropophilics species. The indiscriminate use of antifungals has led to the selection of resistant strains, and the invasive behaviour of these pathogens in immunocompromised patients increased in the last years, hampering the treatment of the dermatophytoses. Therefore, there is a need of studies for a better understanding of the biology of the dermatophytes due to their medical and/or veterinary importance and the scarce knowledge about the interaction of these pathogens with their hosts. In this work, we analyzed eight species of dermatophytes: Arthroderma benhamiae, Microsporum canis, Microsporum gypseum, Trichophyton interdigitale, Trichophyton equinum, Trichophyton rubrum, Trichophyton tonsurans, and Trichophyton verrucosum. Comparative genomics and gene expression analyses of genes potentially involved in keratin degradation were performed. Moreover, we performed a large-scale genome sequencing of one of the strains. The structure of the genes sub3, sub5, and sub7, which encode serine endopeptidases with keratinolytic activity, mep3, and mep4, which encode proteins belonging to the group of the metalloendopeptidases, dppV, lap1, and lap2, encoding exopeptidases, were analyzed by computational tools. These analyses revealed that the genes encoding proteases possesses high degree of conservation in their structures, which are lower when their non-coding regions are compared. The analyses also allowed the identification of consensus in promoter regions, specific of dermatophytes genera. We observed that the transcripts accumulation of these genes, evaluated during the cultivation in keratin, mimicking the infection process, is not correlated to the gene sequence similarities among the species. We have not found any correlation between the preferential niche of dermatophytes and their gene sequences or transcription levels. Most of the times, we observed that genes encoding endo and exopeptidases accumulated transcripts at the beginning of keratin degradation. Our results suggest that specific differences in the genic sequencing, differences in promoter regions, or even variable expression of these genes encoding a set of proteins with synergic and probably compensatory functions, contribute to different levels of inflammatory reactions in the host, as well as to the host-pathogen specificity.
|
233 |
Propagação semi-automática de termos Gene Ontology a proteínas com potencial biotecnológico para a produção de bioenergia / Semi-automatic propagation of Gene Ontology terms to proteins with biotechnology potential for bioenergy productionTaniguti, Lucas Mitsuo 18 November 2014 (has links)
O aumento no volume de dados biológicos, oriundos principalmente do surgimento de sequenciadores de segunda geração, configura um desafio para a manutenção dos bancos de dados, que devem armazenar, disponibilizar e, no caso de bancos secundários, propagar informações biológicas para sequências sem caracterização experimental. Tal propagação é crucial , pois o fluxo com que novas sequências são depositadas é muito superior ao que proteínas são experimentalmente caracterizadas. De forma análoga ao EC number (Enzyme Commission number), a organização de proteínas em famílias visa organizar e facilitar operações automáticas nos bancos de dados. Dentro desse contexto este trabalho teve como objetivos a geração de modelos computacionais para famílias de proteínas envolvidas em processos microbianos biotecnologicamente interessantes para a produção de bioenergia. Para a geração dos modelos estatísticos foram escolhidas proteínas referência analisadas a priori em colaboração com o projeto MENGO1 . A partir da proteína referência foram realizadas buscas no UniProtKB com o objetivo de encontrar proteínas representativas para cada família e descrições de função com base na literatura científica. Com a coleção de sequências primárias das proteínas selecionadas foram realizados alinhamentos múltiplos de sequências com o programa MUSCLE 3.7 e posteriormente com o programa HMMER foram gerados os modelos computacionais (perfis de cadeia oculta de Markov). Os modelos passaram por consecutivas revisões para serem utilizados na propagação dos termos do Gene Ontology com confiança.Um total de 1.233 proteínas puderam receber os termos GO. Dessas proteínas 79% não apresentavam os termos GO disponibilizados no banco de dados UniProtKB. Uma comparação dos perfis-HMM com a utilização de redes de similaridade a um E-value de 10-14 confirmou a utilidade dos modelos na propagação adequada dos termos. Uma segunda validação utilizando um banco de dados construído com sequências aleatórias com base nos modelos e na frequência de codons das proteínas anotadas do SwisProt permitiu verificar a sensibilidade da estratégia quanto a recuperar membros não pertencentes aos modelos gerados. / The increase of biological data produced mainly by the second generation technologies stands as a challenge for the biological databases, that needs to adress issues like storage, data availability and, in the case of secondary databases, to propagate biological information to sequences with no experimental characterization. The propagation is important since the flow that new sequences are submited into databases is much higher than proteins having their function described by experiments. Similarly to the EC. number (Enzyme Commission number), an organization of protein families aims to organize and help automatic processes in databases. In this context this work had as goals the generation of computational models for protein families related to microbial processes with biotechnology potential for production of bioenergy. Several proteins annotated by MENGO2, a project in collaboration, were used as seeds to the statistic models. Alignments were made on UniProtKB, querying the seeds proteins, looking for representatives for each family generated and the existence of function descriptions referenced on the cientific literature. Multiple sequence alignment were made on each collection of seeds proteins, representatives of the families, thorough the MUSCLE 3.7 program, and after were generated the computational models (profile Hidden Markov Models) with the HMMER package. The models were consecutively reviewed until the curator consider it reliable for propagation of Gene Ontology terms. A set of 1,233 proteins from UniProtKB were classified in our families, suggesting that they could be annotated by the GO terms using MENGOfams families. From those proteins, 79% were not annotated by the MENGO specific GO terms. To compare the results that would be obtained using only BLAST similarity measures and using pHMMs we generated similarity networks, using an Evaue cutoff of 10-14. The results showed that the classification results of pHMMs are valuable for biological annotation propagation because it identifies precisely members of each family. A second analysis was applied for each family, using the respective pHMMs to query a collection of sequences generated by a null model. For null model were assumed that all sequences were not homologous and could be represented just by the aminoacid frequencies observed in the SwissProt database. No non-homologous proteins were classified as members by the MENGOfams models, suggesting that they were sensitive to identify only true member sequences.
|
234 |
Sinalização mediada pela angiotensina II em um modelo de glioblastoma multiforme: uso da genômica funcional na identificação do papel dos receptores AT1 e AT2. / Transcriptome profile regulated by Angiotensin II in glioma cells: potential insights into the role of AT1 and AT2 receptors.Azevedo, Hátylas Felype Zaneti de 29 November 2012 (has links)
A expressão dos receptores AT1 e AT2 da Angiotensina II (Ang II) em astrocitomas humanos está associada a um pior prognóstico. Para investigar os mecanismos moleculares da ação da Ang II em gliomas, foi analisado por DNA microarray o transcriptoma da linhagem celular C6 tratada com Ang II e antagonistas de AT1 e AT2 nos intervalos de 3 e 6 horas. Os genes diferencialmente expressos obtidos foram submetidos a análises de enriquecimento funcional, diagramas de Venn e interatomas. As alterações observadas no transcriptoma a partir do tratamento com Ang II revelaram genes envolvidos em funções biológicas e vias de sinalização pró-tumorais tais como ciclo celular, migração, ErbB, MAPK e mTOR. Além disso, a identificação das proteínas centrais nos interatomas avaliados forneceu evidências para estudos futuros com foco nesses alvos. Embora a transdução de sinal de AT2 seja distinta da observada em AT1, ambas apresentaram categorias funcionais em comum que podem estar relacionadas ao pior prognóstico observado em pacientes cujos gliomas expressam esses receptores. / The expression of AT1 and AT2 receptors of Angiotensin II (Ang II) in human astrocytomas was associated with a worse prognosis. To investigate the molecular mechanisms of Ang II actions in gliomas, the transcriptomic profile of C6 cells treated with Ang II and antagonists of AT1 and AT2 was evaluated. The differentially expressed genes obtained were submitted to functional enrichment, Venn diagram and transcriptome network analyzes. Ang II treatment caused gene expression changes involved in pro-tumor functions and signaling pathways such as cell cycle, migration, ErbB, mTOR and MAPK. Furthermore, the identification of central proteins in the interactomes provided evidences for future studies focused on these targets. Taken together, these results provided insights into how the transcriptome of glioma cells is affected by Ang II. Moreover, although the signal transduction of AT2 is distinct from the observed for AT1, they present functional categories in common that may be underlying the worst prognosis observed in gliomas expressing Ang II receptors.
|
235 |
Estudos sobre a organização genômica, evolução e expressão de microRNAs / Studies on the genomic organization, evolution and expression of microRNAs.França, Gustavo Starvaggi 13 November 2015 (has links)
Os microRNAs (miRNAs) são pequenos RNAs não codificadores de proteínas presentes na maioria dos eucariotos. Esses RNAs regulam a expressão gênica em nível pós-transcricional através do silenciamento de mRNAs-alvo que possuem sítios complementares às suas sequências, atuando em praticamente todos os processos celulares. Embora a estrutura e função dos miRNAs estejam bem caracterizadas, aspectos relacionados à sua organização genômica, evolução e atuação em doenças são tópicos que apresentam enormes lacunas. Nesta tese, utilizamos abordagens computacionais para investigar estes temas em três trabalhos. No primeiro, processamos e integramos um vasto volume de dados publicamente disponíveis referentes aos miRNAs e genes codificadores de proteínas para cinco espécies de vertebrados. Com isso, construimos uma ferramenta web que permite a fácil inspeção da organização genômica dos miRNAs em regiões inter e intragênicas, o acesso a dados de expressão de miRNAs e de genes codificadores de proteínas (classificados em genes hospedeiros e não hospedeiros de miRNAs), além de outras informações pertinentes. Verificamos que a ferramenta tem sido amplamente utilizada pela comunidade científica e acreditamos que ela possa facilitar a geração de hipóteses associadas à regulação dos miRNAs, principalmente quando estão inseridos em genes hospedeiros. No segundo estudo, buscamos compreender como o contexto genômico e a origem evolutiva dos genes hospedeiros influenciam a expressão e evolução dos miRNAs humanos. Nossos achados mostraram que os miRNAs intragênicos surgem preferencialmente em genes antigos (origem anterior à divergência de vertebrados). Observamos que os miRNAs inseridos em genes antigos têm maior abrangência de expressão do que os inseridos em genes novos. Surpreendentemente, miRNAs jovens localizados em genes antigos são expressos em um maior número de tecidos do que os intergênicos de mesma idade, sugerindo uma vantagem adaptativa inicial que pode estar relacionada com o controle da expressão dos genes hospedeiros, e como consequência, expondo-os a contextos celulares e conjuntos de alvos diversos. Na evolução a longo prazo, vimos que genes antigos conferem maior restrição nos padrões de expressão (menor divergência de expressão) para miRNAs intragênicos, quando comparados aos intergênicos. Também mostramos possíveis associações funcionais relacionadas ao contexto genômico, tais como o enriquecimento da expressão de miRNAs intergênicos em testículo e dos intragênicos em tecidos neurais. Propomos que o contexto genômico e a idade dos genes hospedeiros são fatores-chave para a evolução e expressão dos miRNAs. Por fim, buscamos estabelecer associações entre a expressão diferencial de miRNAs e a quimioresistência em câncer colorretal utilizando linhagens celulares sensíveis e resistentes às drogas 5-Fluoruracil e Oxaliplatina. Dentre os miRNAs identificados, o miR-342 apresentou níveis elevados de expressão nas linhagens sensíveis à Oxaliplatina. Com base na análise dos alvos preditos, detectamos uma significativa associação de miR-342 com a apoptose. A superexpressão de miR-342 na linhagem resistente SW620 evidenciou alterações na expressão de genes da via apoptótica, notavelmente a diminuição da expressão do fator de crescimento PDGFB, um alvo predito possivelmente sujeito à regulação direta pelo miR-342. / MicroRNAs (miRNAs) are short non-coding RNAs found in most eukaryotic species. These RNAs regulate gene expression at post-transcriptional level by silencing target mRNAs through base-pairing of complementary sequences, thus acting on virtually all cellular processes. Although the structure and function of miRNAs are well understood, several aspects related to their genomic organization, evolution and involvement with diseases are largely underexplored. In this thesis, we employed computational methods to investigate such issues in three different studies. In the first one, we have processed and integrated a large amount of public data related to miRNAs and coding genes for five vertebrate species. Then, we developed a webtool to allow the analysis of the miRNA genomic context in inter and intragenic regions, the access of miRNA and gene expression data (classified as host and non-host genes), as well as other relevant information. We noticed that the webtool has been largely used by the scientific community, and we believe that it can facilitate hypothesis generation related to miRNA regulation, especially when they are within host genes. In the following study, we sought to understand how the genomic context and the evolutionary origin of host genes can affect the expression and evolution of human miRNAs. Our findings showed that intragenic miRNAs are preferentially embedded within old host genes (originated before the split of vertebrates). We observed that miRNAs within old genes are more broadly expressed than those within young genes. Surprisingly, young miRNAs within old genes were expressed in more tissues than their intergenic counterparts, suggesting an initial adaptive advantage which might be related to their hosts expression control, and as a consequence, exposing them to a more diverse cellular contexts and target genes. In the long run, we found that old host genes lead to expression constraints (lower expression divergence) between species for intragenic miRNAs, in respect to intergenic ones. We also showed possible functional associations related to miRNA genomic context, such as the enrichment of young intergenic miRNAs in testis, while young intragenic miRNAs were enriched in neural tissues. Thus, we propose that the genomic context and the age of the host genes are key factors in shaping the expression and evolution of miRNAs. Finally, we sought to establish associations between differential expression of miRNAs and chemoresistance in colorectal cancer using resistant and sensitive cell lines to 5-Fluoruracil and Oxaliplatin. Among differentially expressed miRNAs, miR-342 was highly expressed in sensitive cell lines to Oxaliplatin. Based on target prediction analysis, miR-342 is likely associated with apoptosis. The induced overexpression of miR-342 in SW620, a cell line resistant to Oxaliplatin, changed the expression levels of genes linked to the apoptosis pathway, notably the downregulation of PDGFB growth factor, which is a predicted target possibly subjected to direct regulation by miR-342.
|
236 |
OsteoBLAST rotina computacional de análise molecular global aliada à biologia sistêmica e aplicada à produção de biomateriais /Ferreira, Marcel Rodrigues. January 2017 (has links)
Orientador: Willian Fernando Zambuzzi / Resumo: As tendências na terapia com implantes têm incluído a modificação de suas superfícies utilizando ferramentas de nanotecnologia e princípios de bioengenharia, aumentando seu desempenho quando implantado. Embora muito se tenha alcançado em ferramentas para desenvolvimento destes materiais, metodologias de avaliação biológicas não avançaram nesta velocidade. Amparados por ferramentas de bioinformática e utilizando conceitos de biologia sistêmica, o objetivo deste trabalho foi produzir uma metodologia computacional, alternativa ao uso de experimentação animal, capaz de detectar e analisar o quinoma da resposta da interação célula-biomaterial, obtida com ensaio de microarranjo de peptídeos. Estes dados servirão para a construção de um banco de dados para guiar a produção de biomateriais para a área médico-odontológica. Batizaremos este de OsteoBLAST. Para tanto, fizemos uso de superfícies de titânio com diferentes superfícies (maquinado e duplo ataque ácido), as quais foram desafiadas com o cultivo de células tronco indiferenciadas. As amostras biológicas foram utilizadas para avaliar quinases diferencialmente ativadas através de substratos sintéticos, cuja metodologia é conhecida como PamGene, as quais foram reunidas em um banco de dados chamado OsteoBLAST, o qual fora constituído através de um algoritmo em quatro etapas que selecionou os resultados confiados de PamGene, em seguida obetendo o quinoma diferencial e um nível de similaridade com superfícies amplamente usadas na roti... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Current trends in implant therapy have included the modification of their surfaces using nanotechnology tools and principles of bioengineering, increasing their performance when deployed. Although much has been achieved in tools for developing these materials, biological analysis methodologies did not advance at this speed. Supported by bioinformatics tools and using concepts of systemic biology, the objective of this work was to produce a computational methodology, alternative to the use of animal experimentation, capable of detecting and analyzing the kinome of the response of the cell-biomaterial interaction, obtained with microarray peptides. These data will serve to build a database to guide the production of biomaterials for the medical-dental area. We will baptize this one from OsteoBLAST. To do so, we made use of titanium surfaces with different surfaces (machined and double acid etched), which were challenged with the cultivation of undifferentiated stem cells. Biological samples were used to evaluate differentially activated kinases through synthetic substrates, a methodology known as PamGene, as the banks were assembled in a database called OsteoBLAST, which consists of a four-step algorithm that selected the results confident of PamGene, then obtaining the differential kinome and a level of similarity with surfaces widely used in the routine. Our results showed that the EGRF, ENO2, EPHA4, FRK, KRT6B, NCF1, PDPK1, PDGFRB and KDR as proteins involved in this molecul... (Complete abstract click electronic access below) / Mestre
|
237 |
Genix: desenvolvimento de uma nova pipeline automatizada para anotação de genomas microbianos / Genix: development of a new automated pipeline for microbial genome annotationKremer, Frederico Schmitt 17 February 2016 (has links)
Submitted by Maria Beatriz Vieira (mbeatriz.vieira@gmail.com) on 2017-10-18T12:09:03Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
dissertacao_frederico_schmitt_kremer.pdf: 1606431 bytes, checksum: 192db9fb559b24dfd0b3038659fdd5b7 (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2017-10-23T11:10:01Z (GMT) No. of bitstreams: 2
dissertacao_frederico_schmitt_kremer.pdf: 1606431 bytes, checksum: 192db9fb559b24dfd0b3038659fdd5b7 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2017-10-23T11:11:40Z (GMT) No. of bitstreams: 2
dissertacao_frederico_schmitt_kremer.pdf: 1606431 bytes, checksum: 192db9fb559b24dfd0b3038659fdd5b7 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-10-23T11:11:52Z (GMT). No. of bitstreams: 2
dissertacao_frederico_schmitt_kremer.pdf: 1606431 bytes, checksum: 192db9fb559b24dfd0b3038659fdd5b7 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016-02-17 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / O advento do sequenciamento de DNA de nova geração (NGS) reduziu significativamente o custo dos projetos de sequenciamento de genomas. Quanto mais fácil é de obter novos dados genômicos, mais acuradas deve ser a etapa de anotação, de forma a se reduzir a perda de informações relevantes e efetuar o acúmulo de erros que possam afetar a acurácia das análises posteriores. No caso dos genomas bacterianos, um grande número de programas para anotação já foi desenvolvido, entretanto, muitos destes softwares não incorporaram etapas para otimizar os seus resultados, como filtragem de proteínas falso-positivas/spurious e a anotação mais completa de RNA não-codificantes. O presente trabalho descreve o desenvolvimento do Genix, uma nova pipeline automatizada que combina a funcionalidade de diferentes softwares, incluindo Prodigal, tRNAscan-SE, RNAmmer, Aragorn, INFERNAL, NCBI-BLAST+, CD-HIT, Rfam e Uniprot, com a intenção de aumentar a afetividade dos resultados de anotação. Para avaliar a acurácia da presente ferramenta, foram usados como modelo de estudo os genomas de referência de Escherichia coli K-12, Leptospira interrogans cepa Fiocruz L1-130, Listeria monocytogenese EGD-e e Mycobacterium tuberculosis H37Rv. Os resultados obtidos pelo Genix foram comparados às anotações originais e as obtidas pelas ferramentas de anotação RAST e BASys, considerando genes novos, faltantes e exclusivos, informações de anotação funcional e predições de ORFs spurious. De forma a se quantificar o grau de acurácia, uma nova métrica, denominada discrepância de anotação foi também proposta. Na análise comparativa o Genix apresentou para todos os genomas o menor valor de discrepância, variando entre 0,96 e 5,71%, sendo o maior valor observado no genoma de L. interrogans, para o qual RAST e BASys apresentaram valores superiores a 14,0%. Além disso, foram identificadas proteínas spurious nas anotações geradas pelos demais programas, e, em menor número, nas anotações de referência, indicando que a utilização do Antifam permite um melhor controle do número de genes falso positivos. A partir dos testes realizados, foi possível demonstrar que o Genix é capaz de gerar anotação com boa acurácia (baixo discrepância), menor perda de genes relevantes (funcionais) e menor número de genes falso positivos. / The advent of next-generation sequencing (NGS) significantly reduced the cost of genome sequencing projects. The easier it is to generate genomic data, the more accurate the annotation steps must to be to avoid both the loss of information and the accumulation of erroneous features that may affect the accuracy of further analysis. In the case of bacteria genomes, a range of web annotation software has been developed; however, many applications have not incorporated the steps required to improve the output (eg: false-positive/spurious ORF filtering and a more complete non-coding RNA annotation). The present work describes the implementation of Genix, a new bacteria genome annotation pipeline that combines the functionality of the programs Prodigal, tRNAscan-SE, RNAmmer, Aragorn, INFERNAL, NCBI-BLAST+, CD-HIT, Rfam and UniProt, with the intention of increasing the effectiveness of the annotation results. To evaluate the accuracy of Genix, we used as models of study the reference genomes of Escherichia coli K-12, Leptospira interrogans strain Fiocruz L1-130, Listeria monocytogenes EGD-e and Mycobacterium tuberculosis H37Rv. the results obtained by Genix were compared to the original annotation and to those from the annotation pipelines RAST and BASys considering new, missing and exclusive genes, functional annotation information and the prediction of spurious ORFs. To quantify the annotation accuracy, a new metric, called “annotation discrepancy” was developed. In a comparative analysis, Genix showed the smallest discrepancy for the four genomes, ranging for 0.96 to 5.71%, the highest discrepancy was bserved in the L. interrogans genome, for which RAST and BASys resulted in discrepancies greater than 14.0%. Additionally, several spurious proteins were identified in the annotations generated by RAST and BASys, and, in smaller number, in the reference annotations, indicating that the use of the Antifam database allows a better control of the number of false-positive genes. Based on the evaluations, it was possible to show that Genix is able to generate annotations with good accuracy (low discrepancy), low omission of relevant (functional) genes and a small number of false-positive genes.
|
238 |
AAE-DeMo: uma proposta de arquitetura baseada em algoritmos evolutivos para descoberta de Motifs em moléculas biológicas / AAE-DeMo: An Architecture Proposal Based on Evolutionary Algorithms for the Discovery of Motifs in Biological MoleculesSchmidt, Augusto Garcia 18 July 2017 (has links)
Submitted by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-18T14:49:00Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_Augusto_Schmidt.pdf: 1380825 bytes, checksum: 43661cd55f67f8a90201f1208716e6c9 (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-19T14:43:09Z (GMT) No. of bitstreams: 2
Dissertacao_Augusto_Schmidt.pdf: 1380825 bytes, checksum: 43661cd55f67f8a90201f1208716e6c9 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-04-19T14:43:17Z (GMT). No. of bitstreams: 2
Dissertacao_Augusto_Schmidt.pdf: 1380825 bytes, checksum: 43661cd55f67f8a90201f1208716e6c9 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2017-07-18 / Sem bolsa / Motivos não são entidades aleatórias encontradas em cadeias de DNA, podendo ser definidos como um fenômeno não único dentro de uma sequência genética. Os motivos, além de ter padrões recorrentes nas sequências analisadas, também possuem uma função biológica. Os algoritmos evolutivos são amplamente utilizados para encontrar soluções para otimização e padrões de pesquisa na área de ciência da computação. Encontrar motivos em sequências de genes é um dos problemas
mais importantes na bioinformática e pertence à classe NP-Difícil. Portanto, é plausível investigar a hibridação de ferramentas consolidadas, mas limitadas em seu desempenho, em combinação com técnicas de algoritmos evolutivos. Este trabalho tem a premissa de mostrar uma pesquisa das principais técnicas e conceitos de algoritmos evolutivos utilizados na descoberta de padrões (motivos) na em moléculas e também um estudo aprofundado dos principais algoritmos de bioinformática que são utilizados para esta função em recentes anos por pesquisadores. Entende-se que tais técnicas em combinação, podem obter resultados interessantes para pesquisa em bioinformática. Assim, propondo uma arquitetura otimizada para descoberta de motivos em moléculas de regiões promotoras da bactéria. Usando tanto algoritmos evolutivos, como algoritmos de bioinformática e técnicas de refinação de seus principais dados fornecidos pelos algoritmos utilizados. Assim, formando uma arquitetura com melhor desempenho devido à hibridização de ferramentas consolidadas para buscar padrões em expressões genéticas. / Motifs are not random entities found in DNA strands, and can be defined as a nonunique phenomenon within a genetic sequence. Motifs, besides having recurrent patterns in the analyzed sequences, also have a biological function. Evolutionary algorithms are widely used to find solutions for optimization and research standards in the area of computer science. Finding motifs in gene sequences is one of the most important problems in bioinformatics and belongs to the NP-Difficult class. Therefore, it is plausible to investigate the hybridization of consolidated but limited tools in their performance, in combination with evolutionary algorithm techniques. This work has the premise of showing a research of the main techniques and concepts of evolutionary algorithms used in the discovery of patterns in molecules and also an in depth study of the main bioinformatics algorithms that have been used for this
function in recent years by researchers. It is understood that such techniques in combination may yield interesting results for research in bioinformatics. Thus, proposing an architecture optimized for the discovery of motifs in molecules of promoter regions of the bacterium. Using both evolutionary algorithms, bioinformatics algorithms and refining techniques of its main data provided by the algorithms used. Thus, forming an architecture with better performance due to the hybridization of consolidated tools to look for patterns in genetic expressions.
|
239 |
Uso de Data Mining na descoberta ou identificação de regras de enovelamento baseado em perfis de hidrofobicidadeStelle, Diogo January 2011 (has links)
Orientador: Luis Paulo Barbour Scott. / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Pós-Graduação em Engenharia da Informação.
|
240 |
Métodos para problemas de seleção de cadeias de caracteresVilca, Omar Latorre January 2013 (has links)
Orientador: Cláudio Nogueira de Meneses / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Pós-Graduação em Ciência da Computação, 2013
|
Page generated in 0.0687 seconds