Estudos de expressão gênica geralmente envolvem a realização de processos de análise integrados para a obtenção de respostas biológicas de interesse. A realização destes processos frequentemente requer o uso combinado de uma série de ferramentas de software. No entanto, o processo de integração manual de ferramentas pode ser demorado e propenso a erros devido ao crescente número de ferramentas e formatos de dados disponíveis no domínio. De modo a automatizar o processo de integração, algumas abordagens têm sido propostas tanto para a adaptação das ferramentas de análise existentes como serviços web semânticos, quanto para o desenvolvimento de ambientes de suporte à integração (composição) de serviços web semânticos. Embora estas abordagens representem avanços, nenhuma solução adequada para o desenvolvimento e composição de serviços foi especificamente definida para o domínio de genômica funcional. Neste contexto, o principal objetivo deste projeto foi investigar uma solução completa para o desenvolvimento e composição de serviços web semânticos para a análise de expressão gênica. Como parte da solução proposta, definimos uma metodologia integrada para a implementação de serviços web semânticos criados a partir de ferramentas de software existentes e para a anotação semântica destes serviços. Nossa metodologia fornece diretrizes concretas para o desenvolvimento sistemático de serviços, considerando também os principais aspectos técnicos associados ao processo de desenvolvimento. Esta metodologia foi aplicada a um conjunto representativo de serviços que fornecem suporte às principais atividades de análise realizadas em diferentes tipos de dados de expressão gênica. De forma complementar, definimos uma solução completa para a composição semântica de serviços no domínio de análise de expressão gênica. A solução proposta foi implementada em uma plataforma de suporte semi-automático à composição de serviços web semânticos, chamada SemanticSCo. Esta plataforma fornece suporte flexível a todas as atividades envolvidas no processo de composição de serviços, incluindo a criação, publicação, requisição, descoberta, seleção, composição e execução de serviços. Além disto, a plataforma SemanticSCo foi projetada para prover suporte adequado a diferentes tipos de usuários, incluindo biologistas e bioinformatas. Neste sentido, a plataforma fornece aos usuários um alto nível de abstração para a definição de seus processos de análise, permitindo que os mesmos se concentrem mais nas questões de pesquisa biológicas do que nos aspectos subjacentes do processo de composição. Adicionalmente, a plataforma SemanticSCo suporta a definição e incorporação não apenas de serviços simples, definidos em termos de uma única operação, mas também de serviços complexos, definidos em termos de um conjunto de condições que restringem a ordem de invocação de suas operações. Finalmente, de modo a avaliar a plataforma de suporte desenvolvida, definimos diferentes cenários de composição para a análise (integrada) de dados de expressão gênica. O uso da plataforma SemanticSCo facilitou a definição destes cenários, permitindo assim a reprodução dos resultados obtidos a partir de diferentes estudos de expressão gênica previamente documentados na literatura / Gene expression studies usually involve the creation of integrated analysis processes for obtaining responses for a biological question. The creation of such processes often require the combined use of a number of software tools. However, the manual integration of tools can be cumbersome and error prone due to the increasing number of tools and data formats available in the domain. In order to automate the integration process, some approaches have been proposed for the adaptation of existing analysis tools as semantic web services as well as for the development of software environments to support the integration (composition) of semantic web services. Although these approaches present advances, to the best of our knowledge, no suitable solution has been proposed for the development and composition of web services in the functional genomics domain. In this context, this project aimed at investigating a complete solution for the development and composition of semantic web services to support gene expression analysis. As part of the proposed solution, we have defined an integrated methodology for the implementation of semantic web services created from existing software tools and the semantic annotation of such services. Our methodology provides concrete guidelines for the systematic development of services, also taking into account the main technical aspects associated with the development process. This methodology has been applied in the development of a representative set of services that support the main analysis activities performed on different types of gene expression data. Complementary to our methodology, we have defined a complete solution for the semantic composition of web services in the gene expression analysis domain. The proposed solution has been implemented in a software platform to support the semi-automatic composition of semantic web services, named SemanticSCo. This platform provides flexible support to all activities involved in the service composition process including service creation, publication, request, discovery, selection, composition and execution. Additionally, the SemanticSCo platform has been designed to support different types of users, including biologists and bioinformaticians. In this sense, the platform provides users with a high level of abstraction in the definition of their analysis processes, thus allowing them to focus more on biological research issues rather than on underlying details of the composition process. In addition, the SemanticSCo platform supports not only the definition and incorporation of (simple) services defined in terms of a single operation, but also (complex) services defined in terms of a set of conditions that constrain the order in which service operations should be invoked. Finally, in order to evaluate the developed support platform, we have defined a number of composition scenarios for the (integrated) analysis of gene expression data. The use of the SemanticSCo platform has facilitated the definition of these scenarios, thus allowing the reproduction of the results obtained from different gene expression studies previously documented in the literature.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-28102016-101702 |
Date | 12 August 2016 |
Creators | Guardia, Gabriela Der Agopian |
Contributors | Farias, Clever Ricardo Guareis de |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Tese de Doutorado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0028 seconds