• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 80
  • 2
  • 1
  • Tagged with
  • 83
  • 66
  • 18
  • 16
  • 15
  • 15
  • 15
  • 13
  • 13
  • 12
  • 11
  • 11
  • 10
  • 9
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Espaços em branco: um convite a anotar

Moraes, Andréa Silva 27 February 2013 (has links)
Submitted by Chaylane Marques (chaylane.marques@ufpe.br) on 2015-03-06T17:22:48Z No. of bitstreams: 2 Dissertação Andrea Silva Moraes .pdf: 5661466 bytes, checksum: 4027364947dd2761089e27b5a00c8e06 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T17:22:48Z (GMT). No. of bitstreams: 2 Dissertação Andrea Silva Moraes .pdf: 5661466 bytes, checksum: 4027364947dd2761089e27b5a00c8e06 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-27 / CNPQ; CAPES / Anotar faz parte das nossas atividades cotidianas, porém é na escola que a prática de tomar notas adquire um novo sentido, especialmente quando somos avaliados. Este trabalho possui como objetivo geral investigar a escrita de anotações em questões de múltipla escolha, observando como elas se organizam e atuam como facilitadores para a resolução das questões. Especificamente, verificamos quais anotações são produzidas durante a resolução dos enunciados, observando-se a recorrência e classificando os tipos encontrados; e analisamos de que maneira as anotações encontradas estão vinculadas à leitura e à compreensão das questões, a partir dos procedimentos descritos pelos informantes em entrevista, verificando como as anotações auxiliam o processo de resolução das questões. Nosso corpus é composto por anotações coletadas em atividade realizada pela equipe do Programa Institucional de Bolsas de Iniciação à Docência (PIBID), no curso de Letras da UFPE, e por entrevistas realizadas com os autores das anotações. Para atender aos nossos objetivos, iniciamos esta dissertação conceituando o que são anotações, observando de que maneira estão inseridas em nossas práticas sociais, especialmente no ambiente escolar. Posteriormente, discutimos os conceitos de leitura e compreensão que subjazem as análises neste trabalho, assim como as noções sobre texto e gênero. Também apresentamos os conceitos de multimodalidade que regem as discussões sobre a composição das anotações. As anotações foram classificadas quanto aos tipos. Em seguida, observou-se seu entrelaçamento com a atividade de ler e o processo de compreender durante a resolução das questões. Os resultados encontrados revelam que, do ponto de vista composicional, as anotações não se restringem apenas à utilização de um modo, mas agregam diversos recursos semióticos para fazer sentido; e as anotações estão relacionadas ao processo de resolução das questões, auxiliando cognitivamente o leitor na mobilização de conhecimentos.
2

Um ambiente para anotação de localização e eventos em coleções de fotografias.

ANDRADE, Davi Oliveira Serrano de. 30 August 2017 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2017-08-30T18:38:58Z No. of bitstreams: 1 Um ambiente para anotação de localização e eventos em coleção de fotografias.pdf: 3883256 bytes, checksum: 74320412e37fe20892630275a02326f7 (MD5) / Made available in DSpace on 2017-08-30T18:38:58Z (GMT). No. of bitstreams: 1 Um ambiente para anotação de localização e eventos em coleção de fotografias.pdf: 3883256 bytes, checksum: 74320412e37fe20892630275a02326f7 (MD5) Previous issue date: 2015-03-19 / CNPq / Capes / Em razão do elevado número de fotografias gerado atualmente, técnicas para organizar, buscar e recuperar tais imagens são fundamentais. Organizar uma coleção de fotografias com milhares de imagens não é um trabalho simples. Além disso, associar dados de redes sociais com fotografias é ainda mais trabalhoso. Fotografias pessoais são comumente anotadas tomando-se como referência as seguintes perguntas: "Quem? Onde? Quando?". Considerando-se as informações importantes na recuperação de fotografias, este trabalho centra esforços nas questões “Onde?” e “Quando?”. Com essas duas perguntas em mente, o foco está voltado para a localização (“Onde?”) e os eventos da fotografia (“Onde?” e “Quando?”). O objetivo geral consiste em propor um ambiente para anotação de localização e eventos sociais. Essa anotação é auxiliada pelas técnicas de propagação de localização e de detecção de eventos sociais propostas neste trabalho. Os resultados dos experimentos com técnicas de propagação de localização indicam que a escolha dessa técnica deve ocorrer conforme o comportamento de cada usuário do sistema. Por isso, além das técnicas de propagação, propõe-se, neste trabalho, uma seleção automática de técnica de propagação de localização. Os experimentos realizados para validar a técnica de detecção de eventos sociais apresentaram bons resultados e a referida técnica, além de realizar a detecção de eventos, também pode ser usada para agrupar fotografias pertencentes a um mesmo evento. Por fim, este trabalho apresenta um protótipo de ferramenta web para unir a anotação de localização com a anotação de eventos. / Due to the large number of pictures that is currently generated, it is very important to have techniques to organize, search and retrieve such images. Organize a collection of photos with thousands of images is not a simple job, and to associate data from social networks with the photographs is even more laborious. Personal photographs are commonly organized by reference to the following questions: "Who? Where? When?". Considering the three important questions, this work focuses efforts on the questions "Where?" and "When?". With these two questions in mind, the focus will be on location ("Where?") and events ("Where?" and "When?"). The overall objective is to offer an environment for annotating location and social events. This annotation is aided by the techniques proposed in this work. The experiments with location propagation techniques indicate that the choice of the propagation technique should happen considering the behavior of each user. Therefore, in addition to propagation techniques, is proposed, in this work, an automatic selection of location propagation techniques. The experiments performed to validate the social event detection technique presented good results and, in addition to performing event detection, can also be used to group photographs belonging to the same event. Finally, this work presents a tool to unite the annotation location with the annotation of events.
3

Interações bióticas e abióticas em feijão- caupi (Vigna unguiculata) pela técnica de SAGE (Serial Analysis of Gene Expression)

Kelle de Araújo Barbosa, Pedranne 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:55:21Z (GMT). No. of bitstreams: 2 arquivo64_1.pdf: 5203988 bytes, checksum: 2716f553a36cd79192020095b593be96 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Danos provocados por estresses bióticos e/ou abióticos são fatores limitantes na produção do feijão-caupi (Vigna unguiculata), favorecendo a redução no crescimento e na produtividade desta cultura. Uma alternativa a estes fatores limitantes é o uso de cultivares com características genéticas competitivas e eficientes contribuindo para alcançar um padrão de agricultura mais sustentável e com melhores condições de produção. Assim, pesquisas que possibilitem compreender funções específicas de genes preditos de plantas e seus perfis de expressão em resposta a uma dada condição, são de extrema importância. Com base nisso, uma das metas do projeto NordEST (http://www.vigna.ufpe.br) consistiu na análise funcional de genes de feijão-caupi associados a estes tipos de estresses. Neste âmbito, o presente trabalho teve como objetivo analisar o perfil de expressão diferencial de genes através da técnica de SuperSAGE a partir de transcritos de folhas de feijão-caupi submetidas a injúria mecânica (biblioteca C2) e ao estresse causado pelo vírus do mosaico severo do feijãocaupi (CPSMV) (biblioteca BRM), com o intuito de obter um melhor entendimento com relação à resposta específica a este tipo de estresse, comparativamente a um controle negativo (ausência de injúria; biblioteca C1). As tags que apresentaram 100% de identidade com sequências de EST do banco privado de Vigna (banco NordEST), foram analisadas quanto à sua expressão diferencial e os transcritos que tiveram seus genes superexpressados e/ou reprimidos, dentro dos parâmetros requeridos (escore ≥42) foram anotados em categorias funcionais, de acordo com os termos de ontologia gênica (Gene Ontology) relativos a processos biológicos, função molecular e componente celular. Os resultados demonstraram que muitas sequências, tanto das bibliotecas submetidas à injúria, quanto as bibliotecas inoculadas com CPSMV estão relacionadas à categorias associadas a estresse, seguido de categorias relacionadas ao processos de tradução, ligação de proteínas, regulação da transcrição, redução de oxidação, transporte, proteólise, entre outros. Estas categorias estão relacionadas a rotas metabólicas importantes na resposta a estresses bióticos, indicando que estas tags representam um potencial real para descobertas de novos genes responsivos à injúria ou à resistência ao CPSMV, talvez ainda não descritos e/ou caracterizados
4

Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático

SILVA, Filipe Santana da 18 July 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-08-30T12:02:06Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE - FILIPE SANTANA DA SILVA.pdf: 5962947 bytes, checksum: 59a26fcd52c6403dbc9319ff678eaf81 (MD5) / Made available in DSpace on 2017-08-30T12:02:06Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE - FILIPE SANTANA DA SILVA.pdf: 5962947 bytes, checksum: 59a26fcd52c6403dbc9319ff678eaf81 (MD5) Previous issue date: 2016-07-18 / CNPQ / CAPES / Com o crescimento em quantidade e dimensão dos bancos de dados (BDs) biomédicos, ontologias foram incorporadas para anotá-los semanticamente, facilitando a interpretação, acesso, recuperação e processamento dos dados. Entretanto, como ontologias e BDs são criados com propósitos diferentes, não é possível interpretar registros de BDs de forma clara e definida. Ontologias supradomínio podem ser empregadas para fornecer classes e relações, de maneira que o conteúdo de BDs anotados seja representado e interpretado adequadamente. A representação das anotações evita ambiguidades, mantendo o engajamento ontológico e permitindo consultar os dados utilizando raciocínio. Nossa hipótese é de que é possível interpretar ontologicamente o conteúdo de um ou mais BDs anotados, determinando como as entidades anotadas dos BDs se relacionam. O objetivo deste trabalho é avaliar e propor estratégias que auxiliem o usuário no processo de interpretação ontológica de registros de BDs biomédicos como indivíduos, classes e disposições, a partir de ontologias formais. A interpretação ontológica é construída ao empregar classes e relações da BioTopLite2 (BTL2), organizando e estendendo ontologias utilizadas como anotação, e.g. GO, ChEBI, SNOMED e PRO; provenientes dos BDs UniProt, Ensembl e NCBI Taxonomy. São investigadas quatro formas de interpretação, viz. quando as anotações são: indivíduos, subclasses, incluem disposições, e um híbrido entre subclasses e disposições. A interpretação como subclasses é a mais indicada ao comparar questões de desempenho, expressividade e capacidade de consultar, utilizando raciocínio e integração semântica. Demonstramos que esse tipo de interpretação é aplicável na prática, apresentando bom desempenho para consultas utilizando raciocínio. Foi desenvolvido um protótipo integrativO CBR para automatizar a interpretação ontológica como subclasses. A ferramenta é responsável por reconstruir o processo de interpretação ontológica, recuperando indivíduos, identificando classes e gerando uma ontologia como modelo de interpretação. A interpretação ontológica de anotações apresenta benefícios: verificar a consistência do BD, e.g. se existem anotações contraditórias; representação formal e ontológica da organização dos dados; a análise do engajamento ontológico dos dados anotados; e, a criação de consultas que utilizam raciocínio para explorar os dados interpretados. / With the growth of data bases (DBs) in number and size, ontologies have been incorporated to annotate DBs semantically, facilitating the record interpretation, access, retrieval and methods for querying data. However, as ontologies and DBs are designed with different purposes, it is not possible to interpret DB annotated DB records in a clear and defined way. Upper-domain ontologies can be used as provider of classes and relations whether the annotated content of annotated entities from DBs are adequately interpreted and represented. The representation ensure that ambiguities are avoided by keeping the ontological commitment and allowing queries supported by reasoning. Our hypothesis is that it is possible to interpret ontologically annotated content from one or more DBs, determining how annotated entities relate to each other. The aim of this work is to evaluate and propose strategies to assist the user in the ontological interpretation process of Biological DBs as individuals, classes and dispositions. The ontological interpretation of Biological DBs is created by reusing classes and relations from BTL2, organizing and extending ontologies used to annotate data, e.g. GO, ChEBI, SNOMED and PRO; from UniProt, Ensembl and NCBI Taxonomy DBs. Four ways of interpreting annotated data are investigated, viz. as ontology individuals; subclasses; dispositions; and, a hybrid among classes and dispositions. Interpretation as subclasses was identified as the appropriate choice when considering: reasoning performance; expressiveness; and, querying with reasoning and ontology-based data integration approaches are taken into account. It has been shown that this type of interpretation is useful in practice, with a good performance for (both) reasoning and querying. A prototype called integrativO CBR was created in order to automate interpretation as subclasses. This tool is responsible for recreating the process of applying the ontological interpretation, enabling the retrieval of individuals from data, referent classes identification, and generation of an interpretation model. The ontological interpretation of annotations has several benefits, such as: DB consistency evaluation for conflicting annotations; formal and ontological representation of how data is organized; verifying the ontological commitment of annotated data; and, the ability to create queries to explore reasoning.
5

Anotação automática e semiautomática de pessoas em fotografias digitais utilizando eventos compartilhados. / Automatic and semi-automatic annotation of people in digital photographs using shared events.

FIRMINO, Anderson Almeida. 30 July 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-07-30T18:46:14Z No. of bitstreams: 1 ANDERSON ALMEIDA FIRMINO - DISSERTAÇÃO PPGCC 2017..pdf: 8815289 bytes, checksum: e3b4911b743f18579e5834eb56c197a3 (MD5) / Made available in DSpace on 2018-07-30T18:46:14Z (GMT). No. of bitstreams: 1 ANDERSON ALMEIDA FIRMINO - DISSERTAÇÃO PPGCC 2017..pdf: 8815289 bytes, checksum: e3b4911b743f18579e5834eb56c197a3 (MD5) Previous issue date: 2017-07-02 / Diante da popularização de smartphones e dispositivos fotográficos, é fato que as fotografias digitais têm se tornado parte do cotidiano. Milhões de fotos são adicionadas diariamente em redes sociais, como Facebook e Instagram. Diante de isso, tem-se a seguinte questão: "Como gerenciar tamanho acervo de fotos?" Para o usuário, isto não é uma tarefa simples. Para auxiliá-lo na resolução dessa questão, se faz necessário o uso de anotações em fotografias, as quais podem conter informações de localização, data, hora e tags de conteúdo. Para o usuário, a identificação das pessoas presentes na cena é considerada a informação mais importante, permitindo que ele se recorde da fotografia. Por outro lado, utilizar o conceito do evento a qual uma fotografia pertence é uma forma de otimizar a organização de fotografias. Neste trabalho, propõe-se verificar se o conceito de evento compartilhado, o qual consiste em diversas pessoas com smartphones e dispositivos fotográficos participando de um mesmo evento, traz algum incremento na taxa de acerto na anotação de pessoas em fotografias digitais de maneira automática e semiautomática. Para a anotação automática de pessoas, foram utilizados algoritmos de detecção e reconhecimento de faces; e para a anotação semiautomática de pessoas, foram utilizados estimadores baseados nas informações de contexto das fotografias (como localização geográfica, por exemplo) e de conteúdo (como as faces detectadas, por exemplo). Os experimentos realizados apresentaram bons resultados, demonstrando assim que a utilização do conceito de evento compartilhado aumenta a taxa de acerto para a anotação automática e para a anotação semiautomática de pessoas em fotografias digitais / Faced with the popularization of smartphones and photographic devices, it is a fact that digital photographs have become part of daily life. Millions of photos are added daily on social networks such as Facebook and Instagram. Faced with this, one has the following question: "How to manage huge photo collections?" For the user, this is not a simple task. To assist in resolving this issue, it is necessary to use photo annotations, which may contain location information, date, time, and content tags. For the user, identifying the people present in the scene is considered the most important information, allowing him to remember the photograph. On the other hand, using the concept of the event to which a photograph belongs is a way of optimizing the organization of photographs. In this work, it is proposed to verify if the concept of shared event, which consists of several people with smartphones and photographic devices participating in the same event, brings some increase in the hit rate in annotating people in digital photographs in an automatic and semi-automatic way. For the automatic people annotation, we used algorithms of face detection and recognition; and for the semi-automatic people annotation, estimators based on the context information of the photographs (such as geographic location, for example) and content (such as detected faces, for example) were used. The experiments performed showed good results, thus demonstrating that the use of the concept of shared event increases the hit rate for both people automatic and semiautomatic annotation of in digital photographs.
6

Sifter-T: Um framework escalável para anotação filogenômica probabilística funcional de domínios protéicos / Sifter-T: A scalable framework for phylogenomic probabilistic protein domain functional annotation

Silva, Danillo Cunha de Almeida e 25 October 2013 (has links)
É conhecido que muitos softwares deixam de ser utilizados por sua complexa usabilidade. Mesmo ferramentas conhecidas por sua qualidade na execução de uma tarefa são abandonadas em favor de ferramentas mais simples de usar, de instalar ou mais rápidas. Na área da anotação funcional a ferramenta Sifter (v2.0) é considerada uma das com melhor qualidade de anotação. Recentemente ela foi considerada uma das melhores ferramentas de anotação funcional segundo o Critical Assessment of protein Function Annotation (CAFA) experiment. Apesar disso, ela ainda não é amplamente utilizada, provavelmente por questões de usabilidade e adequação do framework à larga escala. O workflow SIFTER original consiste em duas etapas principais: A recuperação das anotações para uma lista de genes e a geração de uma árvore de genes reconciliada para a mesma lista. Em seguida, a partir da árvore de genes o Sifter constrói uma rede bayesiana de mesma estrutura nas quais as folhas representam os genes. As anotações funcionais dos genes conhecidos são associadas a estas folhas e em seguida as anotações são propagadas probabilisticamente ao longo da rede bayesiana até as folhas sem informação a priori. Ao fim do processo é gerada para cada gene de função desconhecida uma lista de funções putativas do tipo Gene Ontology e suas probabilidades de ocorrência. O principal objetivo deste trabalho é aperfeiçoar o código-fonte original para melhor desempenho, potencialmente permitindo que seja usado em escala genômica. Durante o estudo do workflow de pré-processamento dos dados encontramos oportunidades para aperfeiçoamento e visualizamos estratégias para abordá-las. Dentre as estratégias implementadas temos: O uso de threads paralelas; balanceamento de carga de processamento; algoritmos revisados para melhor aproveitamento de disco, memória e tempo de execução; adequação do código fonte ao uso de bancos de dados biológicos em formato utilizado atualmente; aumento da acessibilidade do usuário; expansão dos tipos de entrada aceitos; automatização do processo de reconciliação entre árvores de genes e espécies; processos de filtragem de seqüências para redução da dimensão da análise; e outras implementações menores. Com isto conquistamos aumento de performance de até 87 vezes para a recuperação de anotações e 73,3% para a reconstrução da árvore de genes em máquinas quad-core, e redução significante de consumo de memória na fase de realinhamento. O resultado desta implementação é apresentado como Sifter-T (Sifter otimizado para Throughput), uma ferramenta open source de melhor usabilidade, velocidade e qualidade de anotação em relação à implementação original do workflow de Sifter. Sifter-T foi escrito de forma modular em linguagem de programação Python; foi elaborado para simplificar a tarefa de anotação de genomas e proteomas completos; e os resultados são apresentados de forma a facilitar o trabalho do pesquisador. / It is known that many software are no longer used due to their complex usability. Even tools known for their task execution quality are abandoned in favour of faster tools, simpler to use or install. In the functional annotation field, Sifter (v2.0) is regarded as one of the best when it comes to annotation quality. Recently it has been considered one of the best tools for functional annotation according to the \"Critical Assessment of Protein Function Annotation (CAFA) experiment. Nevertheless, it is still not widely used, probably due to issues with usability and suitability of the framework to a high throughput scale. The original workflow SIFTER consists of two main steps: The annotation recovery for a list of genes and the reconciled gene tree generation for the same list. Next, based on the gene tree, Sifter builds a Bayesian network structure in which its leaves represent genes. The known functional annotations are associated to the aforementioned leaves, and then the annotations are probabilistically propagated along the Bayesian network to the leaves without a priori information. At the end of the process, a list of Gene Ontology functions and their occurrence probabilities is generated for each unknown function gene. This work main goal is to optimize the original source code for better performance, potentially allowing it to be used in a genome-wide scale. Studying the pre-processing workflow we found opportunities for improvement and envisioned strategies to address them. Among the implemented strategies we have: The use of parallel threads; CPU load balancing, revised algorithms for best utilization of disk access, memory usage and runtime; source code adaptation to currently used biological databases; improved user accessibility; input types increase; automatic gene and species tree reconciliation process; sequence filtering to reduce analysis dimension, and other minor implementations. With these implementations we achieved great performance speed-ups. For example, we obtained 87-fold performance increase in the annotation recovering module and 72.3% speed increase in the gene tree generation module using quad-core machines. Additionally, significant memory usage decrease during the realignment phase was obtained. This implementation is presented as Sifter-T (Sifter Throughput-optimized), an open source tool with better usability, performance and annotation quality when compared to the Sifter\'s original workflow implementation. Sifter-T was written in a modular fashion using Python programming language; it is designed to simplify complete genomes and proteomes annotation tasks and the outputs are presented in order to make the researcher\'s work easier.
7

PATO: um ambiente integrado com interface gráfica para a curadoria de dados de sequências biológicas / PATO: an integrated enviroment with GUI to data curation of biological sequences

Oliveira, Liliane Santana 22 November 2013 (has links)
A evolução das tecnologias de sequenciamento de DNA tem permitido a elucidação da sequência genômica de um número cada vez maior de organismos. Contudo, a obtenção da sequência nucleotídica do genoma é apenas a primeira etapa no estudo dos organismos. O processo de anotação consiste na identicação as diferentes regiões de interesse no genoma e suas funcionalidades. Várias ferramentas computacionais foram desenvolvidas para auxiliar o processo de anotação, porém nenhuma delas permite ao usuário selecionar sequências, processá-las de forma a encontrar evidências a respeito das regiões genômicas, como predição gênica e de domínios protéicos, analisá-las gracamente e adicionar informações a respeito de suas regiões em um mesmo ambiente. Assim, o objetivo desse projeto foi o desenvolvimento de uma plataforma gráca para a anotação genômica que permite ao usuário realizar as tarefas necessárias para o processo de anotação em uma única ferramenta integrada a um banco de dados. A idéia é proporcionar ao usuário liberdade para trabalhar com o seu conjunto de dados, possibilitando a seleção de sequências para análise, construção dos pipelines processamento das mesmas e análise dos resultados encontrados a partir de visualizador que permite ao usuário adicionar in- formações às regiões e fazer a curadoria das sequências. A ferramenta resultante é facilmente extensível, permitindo o acoplamento modular de novas funcionalidades de anotação e sua estrutura permite ao usuário trabalhar tanto com projetos de sequências expressas como anotação de genomas. / The evolution of the technologies of DNA sequencing has permitted the elucidation of genomic sequence of an increasing number of organisms. Though, the obtainment of the genome nucleotide sequence is only the rst step in the study of organisms. The annotation process consists in the identication of different regions of interest on the genome and their features. Several computational tools were developed to support the annotation process, however none allow the user to select sequences, process them, analyze them graphically and add information about its regions in the same surrounding. Thus, the aim of this project was to develop a graphic platform to genome annotation that allows the user to realize your tasks required from the annotation process in a single tool integrated to a database. The idea is to provide from the user liberty to work with your dataset, enabling the selection of sequences for analyze, pipeline construction, processing them and analyze of results from the viewer that allows the user to add information in the regions and to do the trusteeship of sequences. The resulting tool is easily extensible; allowing the engagement modular of new functionalities of annotation and its structure allows the user works both projects of expressed sequences and with genome annotation.
8

Uma Abordagem Para Enriquecimento Semântico de Metadados Para Publicação de Dados Abertos

Lira, Márcio Angelo Bezerra de 02 September 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-09T19:45:29Z No. of bitstreams: 2 DISSERTAÇÃO Márcio Angelo Bezerra de Lira.pdf: 2325407 bytes, checksum: 0dfe2a2eee4108d58d6bd08c5a45a1e0 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T19:45:29Z (GMT). No. of bitstreams: 2 DISSERTAÇÃO Márcio Angelo Bezerra de Lira.pdf: 2325407 bytes, checksum: 0dfe2a2eee4108d58d6bd08c5a45a1e0 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2014-09-02 / A publicação de Dados Abertos vem alcançando cada vez mais adeptos, principalmente no domínio de dados governamentais. Um dos fatores do sucesso da publicação dos dados em formato aberto seria a disponibilização de metadados capazes de descrever os dados de forma satisfatória. Estes metadados oferecem meios para que usuários, desenvolvedores e sistemas automatizados possam compreender e processar os dados. Porém, apesar da sua importância, a ausência de metadados tem sido um problema comum no cenário atual de publicação de dados abertos. Além da ausência de metadados, outro fator crítico diz respeito ao reuso de metadados. Uma vez que os metadados são publicados, é importante que possam ser reutilizados, a fim de facilitar o processo de publicação de dados de maneira geral. Neste contexto, este trabalho propõe uma abordagem para o enriquecimento semântico de metadados para descrição de dados abertos. A abordagem proposta tem como objetivo facilitar tanto a publicação quanto o reuso de metadados. Para isso, são usadas anotações semânticas e vocabulários padrões. Dessa forma, espera-se que os metadados possam ser facilmente compreendidos e processados. Para avaliação da abordagem proposta, foi desenvolvido um protótipo e foram realizados alguns experimentos.
9

Sifter-T: Um framework escalável para anotação filogenômica probabilística funcional de domínios protéicos / Sifter-T: A scalable framework for phylogenomic probabilistic protein domain functional annotation

Danillo Cunha de Almeida e Silva 25 October 2013 (has links)
É conhecido que muitos softwares deixam de ser utilizados por sua complexa usabilidade. Mesmo ferramentas conhecidas por sua qualidade na execução de uma tarefa são abandonadas em favor de ferramentas mais simples de usar, de instalar ou mais rápidas. Na área da anotação funcional a ferramenta Sifter (v2.0) é considerada uma das com melhor qualidade de anotação. Recentemente ela foi considerada uma das melhores ferramentas de anotação funcional segundo o Critical Assessment of protein Function Annotation (CAFA) experiment. Apesar disso, ela ainda não é amplamente utilizada, provavelmente por questões de usabilidade e adequação do framework à larga escala. O workflow SIFTER original consiste em duas etapas principais: A recuperação das anotações para uma lista de genes e a geração de uma árvore de genes reconciliada para a mesma lista. Em seguida, a partir da árvore de genes o Sifter constrói uma rede bayesiana de mesma estrutura nas quais as folhas representam os genes. As anotações funcionais dos genes conhecidos são associadas a estas folhas e em seguida as anotações são propagadas probabilisticamente ao longo da rede bayesiana até as folhas sem informação a priori. Ao fim do processo é gerada para cada gene de função desconhecida uma lista de funções putativas do tipo Gene Ontology e suas probabilidades de ocorrência. O principal objetivo deste trabalho é aperfeiçoar o código-fonte original para melhor desempenho, potencialmente permitindo que seja usado em escala genômica. Durante o estudo do workflow de pré-processamento dos dados encontramos oportunidades para aperfeiçoamento e visualizamos estratégias para abordá-las. Dentre as estratégias implementadas temos: O uso de threads paralelas; balanceamento de carga de processamento; algoritmos revisados para melhor aproveitamento de disco, memória e tempo de execução; adequação do código fonte ao uso de bancos de dados biológicos em formato utilizado atualmente; aumento da acessibilidade do usuário; expansão dos tipos de entrada aceitos; automatização do processo de reconciliação entre árvores de genes e espécies; processos de filtragem de seqüências para redução da dimensão da análise; e outras implementações menores. Com isto conquistamos aumento de performance de até 87 vezes para a recuperação de anotações e 73,3% para a reconstrução da árvore de genes em máquinas quad-core, e redução significante de consumo de memória na fase de realinhamento. O resultado desta implementação é apresentado como Sifter-T (Sifter otimizado para Throughput), uma ferramenta open source de melhor usabilidade, velocidade e qualidade de anotação em relação à implementação original do workflow de Sifter. Sifter-T foi escrito de forma modular em linguagem de programação Python; foi elaborado para simplificar a tarefa de anotação de genomas e proteomas completos; e os resultados são apresentados de forma a facilitar o trabalho do pesquisador. / It is known that many software are no longer used due to their complex usability. Even tools known for their task execution quality are abandoned in favour of faster tools, simpler to use or install. In the functional annotation field, Sifter (v2.0) is regarded as one of the best when it comes to annotation quality. Recently it has been considered one of the best tools for functional annotation according to the \"Critical Assessment of Protein Function Annotation (CAFA) experiment. Nevertheless, it is still not widely used, probably due to issues with usability and suitability of the framework to a high throughput scale. The original workflow SIFTER consists of two main steps: The annotation recovery for a list of genes and the reconciled gene tree generation for the same list. Next, based on the gene tree, Sifter builds a Bayesian network structure in which its leaves represent genes. The known functional annotations are associated to the aforementioned leaves, and then the annotations are probabilistically propagated along the Bayesian network to the leaves without a priori information. At the end of the process, a list of Gene Ontology functions and their occurrence probabilities is generated for each unknown function gene. This work main goal is to optimize the original source code for better performance, potentially allowing it to be used in a genome-wide scale. Studying the pre-processing workflow we found opportunities for improvement and envisioned strategies to address them. Among the implemented strategies we have: The use of parallel threads; CPU load balancing, revised algorithms for best utilization of disk access, memory usage and runtime; source code adaptation to currently used biological databases; improved user accessibility; input types increase; automatic gene and species tree reconciliation process; sequence filtering to reduce analysis dimension, and other minor implementations. With these implementations we achieved great performance speed-ups. For example, we obtained 87-fold performance increase in the annotation recovering module and 72.3% speed increase in the gene tree generation module using quad-core machines. Additionally, significant memory usage decrease during the realignment phase was obtained. This implementation is presented as Sifter-T (Sifter Throughput-optimized), an open source tool with better usability, performance and annotation quality when compared to the Sifter\'s original workflow implementation. Sifter-T was written in a modular fashion using Python programming language; it is designed to simplify complete genomes and proteomes annotation tasks and the outputs are presented in order to make the researcher\'s work easier.
10

PATO: um ambiente integrado com interface gráfica para a curadoria de dados de sequências biológicas / PATO: an integrated enviroment with GUI to data curation of biological sequences

Liliane Santana Oliveira 22 November 2013 (has links)
A evolução das tecnologias de sequenciamento de DNA tem permitido a elucidação da sequência genômica de um número cada vez maior de organismos. Contudo, a obtenção da sequência nucleotídica do genoma é apenas a primeira etapa no estudo dos organismos. O processo de anotação consiste na identicação as diferentes regiões de interesse no genoma e suas funcionalidades. Várias ferramentas computacionais foram desenvolvidas para auxiliar o processo de anotação, porém nenhuma delas permite ao usuário selecionar sequências, processá-las de forma a encontrar evidências a respeito das regiões genômicas, como predição gênica e de domínios protéicos, analisá-las gracamente e adicionar informações a respeito de suas regiões em um mesmo ambiente. Assim, o objetivo desse projeto foi o desenvolvimento de uma plataforma gráca para a anotação genômica que permite ao usuário realizar as tarefas necessárias para o processo de anotação em uma única ferramenta integrada a um banco de dados. A idéia é proporcionar ao usuário liberdade para trabalhar com o seu conjunto de dados, possibilitando a seleção de sequências para análise, construção dos pipelines processamento das mesmas e análise dos resultados encontrados a partir de visualizador que permite ao usuário adicionar in- formações às regiões e fazer a curadoria das sequências. A ferramenta resultante é facilmente extensível, permitindo o acoplamento modular de novas funcionalidades de anotação e sua estrutura permite ao usuário trabalhar tanto com projetos de sequências expressas como anotação de genomas. / The evolution of the technologies of DNA sequencing has permitted the elucidation of genomic sequence of an increasing number of organisms. Though, the obtainment of the genome nucleotide sequence is only the rst step in the study of organisms. The annotation process consists in the identication of different regions of interest on the genome and their features. Several computational tools were developed to support the annotation process, however none allow the user to select sequences, process them, analyze them graphically and add information about its regions in the same surrounding. Thus, the aim of this project was to develop a graphic platform to genome annotation that allows the user to realize your tasks required from the annotation process in a single tool integrated to a database. The idea is to provide from the user liberty to work with your dataset, enabling the selection of sequences for analyze, pipeline construction, processing them and analyze of results from the viewer that allows the user to add information in the regions and to do the trusteeship of sequences. The resulting tool is easily extensible; allowing the engagement modular of new functionalities of annotation and its structure allows the user works both projects of expressed sequences and with genome annotation.

Page generated in 0.4417 seconds