• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 143
  • 8
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 3
  • 1
  • Tagged with
  • 150
  • 150
  • 54
  • 52
  • 34
  • 31
  • 31
  • 24
  • 22
  • 21
  • 20
  • 20
  • 19
  • 19
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Reprogramação metabólica e possíveis alvos terapêuticos em adenocarcinoma pulmonar

França, Fernanda Stapenhorst January 2016 (has links)
O câncer de pulmão é a neoplasia maligna mais insidiosa da oncologia, sendo responsável pelo maior número de mortes relacionadas ao câncer no mundo. Oitenta e cinco por cento dos casos de câncer de pulmão são de não-pequenas células (CPNPC), onde sua maioria é adenocarcinoma. Apesar dos progressos nas pesquisas em câncer, o prognóstico de pacientes em estágios avançados permanece ruim, portanto faz-se necessária o desenvolvimento de novas abordagens terapêuticas. Nesse trabalho, focamos no metabolismo energético tumoral, o qual apresenta alto consumo de glicose e liberação de lactato mesmo na presença de oxigênio, o chamado Efeito Warburg. Outras vias metabólicas também encontram-se alteradas, processo conhecido como reprogramação metabólica. Dessa forma, o objetivo desse trabalho é buscar possíveis marcadores tumorais e alvos terapêuticos envolvidos no metabolismo energético, através de uma abordagem que começa na bioinformática, de forma a prospectar candidatos a partir de uma vasta gama de genes envolvidos com o metabolismo. Foram selecionados os genes IDH1, LDHA e PYGB a partir de uma análise de enriquecimento gênico, os quais foram submetidos a análises de sobrevida em bancos de dados de microarranjo. Em seguida, o nível de expressão das proteínas IDH1 e LDHA foi avaliado por imunohistoquímica em uma coorte clínica, onde pudemos observar um aumento na expressão de IDH1 em tumores em relação a tecidos pulmonares sadios. Ainda, em modelo celular, observamos que ambas as proteínas estavam aumentadas em células tumorais de adenocarcinoma pulmonar em relação a células sadias de pulmão. Ao combinar o inibidor de LDHA, oxamato, com cisplatina na linhagem de adenocarcinoma pulmonar A549, foi observado uma interação de sinergismo e, na linhagem pulmonar sadia NHBE, foi observado um antagonismo, de forma que essa abordagem se mostra promissora na terapêutica. Já ao combinar o inibidor de IDH1, oxalomalato, com cisplatina na linhagem A549, foi observado um antagonismo. Assim, esse estudo demonstrou um possível papel de biomarcador para adenocarcinoma pulmonar para a enzima IDH1 e um possível papel terapêutico para a enzima LDHA.
52

Contribuições para modelagem e predição do metabolismo de bactérias expostas à ação de antibióticos

Montezano, Daniel Matos January 2016 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2016. / Made available in DSpace on 2017-01-31T03:11:33Z (GMT). No. of bitstreams: 1 343682.pdf: 2819403 bytes, checksum: 248286588753491207623482e77331f5 (MD5) Previous issue date: 2016 / Neste trabalho estudou-se o metabolismo do Mycobacterium tuberculosis com ferramentas computacionais. Compreender a fisiologia e o metabolismo dos organismos patogênicos é de primordial importância na pesquisa e desenvolvimento de antibióticos, pois a compreensão do mecanismo de ação de uma nova droga passa pela compreensão de como a exposição do organismo ao antibiótico afeta e altera o seu metabolismo. Esse conhecimento se torna ainda mais importante em situações em que o organismo desenvolve resistência aos compostos. É sabido que o Mycobacterium tuberculosis possui um grande poder de adaptação e capacidade de desenvolver resistência a muitos dos compostos atualmente utilizados para o tratamento da tuberculose. As linhagens resistentes adaptam-se e desenvolvem a capacidade de sobreviver mesmo em presença de um composto a que antes eram susceptíveis. A sobrevivência do organismo está associada diretamente com a capacidade de manter o seu metabolismo em um estado funcional após exposto ao composto bactericida. A sobrevivência das cepas resistentes, portanto, depende de um uso diferenciado dos caminhos metabólicos. Estudar o metabolismo permite compreender a gama de variações metabólicas executadas pelo organismo para manter a sua sobrevivência. O estudo computacional do metabolismo em escala genômica apresenta entretanto diversos desafios. Três principais problemas são (1) o reduzido número de amostras em grande parte dos experimentos de bancada, devido ao alto custo da implementação e complexidade dos métodos de obtenção de dados (2) a inerente alta dimensionalidade dos dados e (3) como incorporar conhecimento biológico existente em modelos computacionais. Este trabalho busca soluções para contornar esses três problemas, com um estudo sobre geração de dados sintéticos, técnicas de estimação, e propostas de modelos com dimensionalidade reduzida e uso de informação biológica a priori em modelos computacionais. Os resultados mostram que a aplicação de técnicas computacionais para estudo de metabolismo de organismos expostos à ação de antibióticos é de fundamental importância na identificação de caminhos metabólicos de sobrevivência, além de produzir uma maior compreensão do mecanismo de ação de compostos antibióticos sobre um organismo patogênico.<br> / Abstract : In this work the metabolism of the Mycobacterium tuberculosis (Mtb) was studied with computational biology tools. To understand the physiology and metabolism of pathogenic organisms is of paramount importance in antibiotics R & D, because in order to understand the mechanism of action of a new drug it is necessary to understand how exposing an organism to the antibiotics affects and alters its metabolism. Even more important is this knowledge in situations when the organism may develop resistance to the compound. It is known that the Mycobacterium tuberculosis is highly adaptable and is able to develop resistance to a great number of the anti-tubercular compounds used for tuberculosis (TB) treatment today. The resistant strains adapt and develop the ability to survive even in the presence of a bactericidal compound for which they were once susceptible. The survival of the organism is directly linked to its ability to keep metabolism in a functional state after drug exposure. Therefore, the survival of Mtb resistant strains hinges on being able to use its metabolic mechanisms in a different way. By studying metabolism one may be able to understand the large spectrum of metabolic variations performed by the organism in order to remain alive. A computational study of metabolism in a genomic-scale however presents a number of challenges. Three main difficulties that arise are: (1) the small number of samples available in the majority of wetlab experiments, due to high cost and complexity of methods used for experimental data gathering, (2) the high dimensionality of the data and (3) how to incorporate available biological knowledge in computational models. This work has searched for solutions to overcome these three problems with a study on synthetic data generation, estimation tools, models with reduced dimensionality, and with inclusion of a priori biological knowledge. The results show that the use of computational techniques to study the metabolism of organisms exposed to antibiotics is of fundamental importance for identification of metabolic pathways used for survival and also for producing a better understanding of the mechanism of action of antibiotic compounds on a pathogenic organism.
53

Otimização e análise de algoritmos de ordenamento de redes proteicas

Kuentzer, Felipe Augusto January 2014 (has links)
Made available in DSpace on 2014-06-28T02:01:45Z (GMT). No. of bitstreams: 1 000458957-Texto+Completo-0.pdf: 14358950 bytes, checksum: 7458b8a1472071b48772b030a52573a6 (MD5) Previous issue date: 2014 / Analysis by Transcriptogram was developed as a solution to noise reduction, usually present in the microarray measuring technique of the Transcriptome, and has demonstrated potential to be applied as a method of disease diagnostics. The noise reduction in the measure is achived by the protein interaction network ordering, allowing gene expression analysis in whole genome scale. The Transcriptogram's efficiency to noise reduction was analyzed, however, it still lacks an analisys of the ordering quality, so that the best parameter setting for the ordering algorithm is used by the Transcriptogram. So far, this analysis is hindered by the high runtime of the ordering algorithm. In this work, an analysis of the ordering algorithm stages allows some optimizations, and consequent reduction in execution time, also allowing further analysis on which parameters settings have the greatest influence on the ordering quality. Applying the Transcriptogram to a diagnostic problem, the diagnostic measure is used to characterize the influence of the parameters of the ordering algorithm to achive better diagnoses. The results show that the protein network used in previous works doesn't produce the best diagnostics. Moreover, the ordering minimization, achieved by executing the ordering algorithm for longer periods, does not necessarily increase the probability to find better diagnosis compared to random ordering. Eventhough the experimental diagnostic results could not statistically difFerentiate random ordering from optimized ordering, these results cannot be considered conclusive since a single disease has been evaluated. / A análise por Transcriptograma foi desenvolvida como uma solução para a redução de ruído, comum nas medidas do Transcriptoma provenientes da técnica de microarranjo, e tem demonstrando potencial se aplicada como método para diagnósticos de doenças. A redução do ruído existente nas medidas se dá pelo ordenamento da rede de interações proteicas do organismo, permitindo a análise da expressão gênica em escala de genoma completo. A eficiência do Transcriptograma para a redução do ruído já foi analisada, entretanto, ainda carece a avaliação da qualidade do ordenamento, definindo para isso, amelhor configuração de parâmetros para o algoritmo de ordenamento utilizado pelo Transcriptograma. Até o momento, essa análise é dificultada pelo elevado tempo de execução do algoritmo de ordenamento. Neste trabalho, uma análise das etapas do algoritmo de ordenamento possibilita a realização de otimizações, e consequente redução no tempo de execução, além de permitir a análise mais aprofundadadas configurações dos parâmetros que tem maior influência na qualidade do ordenamento. Aplicando o Transcriptograma a um problema de diagnóstico, utiliza-se a medida do diagnóstico para caracterizar a influência dos parâmetros do algoritmo de ordenamento na obtenção de melhores diagnósticos. Observa-se nos resultados, que a rede proteica utilizada em trabalhos anteriores não apresenta os melhores diagnósticos. Além disso, a minimização do ordenamento, alcançada por meio da execução prolongada do algoritmo de ordenamento, não necessariamente aumenta a probabilidade de encontrar um melhor diagnóstico comparado com o ordenamento aleatório. Mesmo que os resultados experimentais com o diagnóstico não diferenciem estatisticamente o ordenamento aleatória do ordenamento otimizado, estes resultados não podem ser considerados conclusivos pois uma única doença foi avaliada.
54

Reprogramação metabólica e possíveis alvos terapêuticos em adenocarcinoma pulmonar

França, Fernanda Stapenhorst January 2016 (has links)
O câncer de pulmão é a neoplasia maligna mais insidiosa da oncologia, sendo responsável pelo maior número de mortes relacionadas ao câncer no mundo. Oitenta e cinco por cento dos casos de câncer de pulmão são de não-pequenas células (CPNPC), onde sua maioria é adenocarcinoma. Apesar dos progressos nas pesquisas em câncer, o prognóstico de pacientes em estágios avançados permanece ruim, portanto faz-se necessária o desenvolvimento de novas abordagens terapêuticas. Nesse trabalho, focamos no metabolismo energético tumoral, o qual apresenta alto consumo de glicose e liberação de lactato mesmo na presença de oxigênio, o chamado Efeito Warburg. Outras vias metabólicas também encontram-se alteradas, processo conhecido como reprogramação metabólica. Dessa forma, o objetivo desse trabalho é buscar possíveis marcadores tumorais e alvos terapêuticos envolvidos no metabolismo energético, através de uma abordagem que começa na bioinformática, de forma a prospectar candidatos a partir de uma vasta gama de genes envolvidos com o metabolismo. Foram selecionados os genes IDH1, LDHA e PYGB a partir de uma análise de enriquecimento gênico, os quais foram submetidos a análises de sobrevida em bancos de dados de microarranjo. Em seguida, o nível de expressão das proteínas IDH1 e LDHA foi avaliado por imunohistoquímica em uma coorte clínica, onde pudemos observar um aumento na expressão de IDH1 em tumores em relação a tecidos pulmonares sadios. Ainda, em modelo celular, observamos que ambas as proteínas estavam aumentadas em células tumorais de adenocarcinoma pulmonar em relação a células sadias de pulmão. Ao combinar o inibidor de LDHA, oxamato, com cisplatina na linhagem de adenocarcinoma pulmonar A549, foi observado uma interação de sinergismo e, na linhagem pulmonar sadia NHBE, foi observado um antagonismo, de forma que essa abordagem se mostra promissora na terapêutica. Já ao combinar o inibidor de IDH1, oxalomalato, com cisplatina na linhagem A549, foi observado um antagonismo. Assim, esse estudo demonstrou um possível papel de biomarcador para adenocarcinoma pulmonar para a enzima IDH1 e um possível papel terapêutico para a enzima LDHA.
55

Comparação paralela exata de seqüências biológicas longas com uso limitado de memória

Batista, Rodolfo Bezerra 20 March 2006 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006. / Submitted by Kathryn Cardim Araujo (kathryn.cardim@gmail.com) on 2009-11-13T16:17:42Z No. of bitstreams: 1 2006_Rodolfo Bezerra Batista.pdf: 6981460 bytes, checksum: 79be4013795ebfc7b4d57c71316c4757 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2009-11-16T14:30:34Z (GMT) No. of bitstreams: 1 2006_Rodolfo Bezerra Batista.pdf: 6981460 bytes, checksum: 79be4013795ebfc7b4d57c71316c4757 (MD5) / Made available in DSpace on 2009-11-16T14:30:34Z (GMT). No. of bitstreams: 1 2006_Rodolfo Bezerra Batista.pdf: 6981460 bytes, checksum: 79be4013795ebfc7b4d57c71316c4757 (MD5) Previous issue date: 2006-03-20 / O alinhamento de seqüências biológicas é um método muito importante usado pela biologia computacional para relacionar organismos e compreender os processos evolutivos envolvidos entre eles. O algoritmo de Smith-Waterman, método exato para obtenção de alinhamentos locais ótimos entre seqüências de DNA (ácido desoxirribonucleico), possui complexidade O(n2) tanto de espaço quanto de tempo. Esta complexidade é um obstáculo à comparação de seqüências muito longas. O BLAST é uma ferramenta capaz de produzir alinhamentos locais em curto espaço de tempo e baixo custo de memória. No entanto, a sensibilidade dos resultados produzidos é baixa em comparação aos métodos exatos, devido às heurísticas utilizadas no BLAST. A programação paralela é utilizada para lidar com problemas computacionais que demandam muito tempo de processamento. Clusters de computadores provêm alto poder computacional a baixo custo. Entretanto, para se ter benefícios com o uso de clusters, os problemas precisam ser adaptados antes de serem resolvidos sobre tal plataforma computacional. A presente dissertação propõe uma estratégia paralela exata para a comparação de seqüências longas de DNA em um espaço limitado de memória. A estratégia proposta foi implementada em um cluster de estações de trabalho, atingindo speedups muito bons para seqüências maiores que 50Kbp e sendo capaz de produzir alinhamentos locais ótimos para seqüências de mais de 3 milhões de pares de bases. ____________________________________________________________________________________________ ABSTRACT / Biological sequence alignment is a very important method used by computational biology to relate organisms and understand the evolutionary processes involved between them. The Smith-Waterman algorithm, an exact method used to obtain optimal local alignments between DNA (deoxyribonucleic acid) sequences, has O(n2) space and time complexity. This complexity is an obstacle to the comparison of very long sequences. BLAST is a tool capable of producing local alignments in short time at a low memory cost. However, the results produced have a low sensibility when compared to exact methods, due to the heuristics used in BLAST. Parallel programming is used to deal with high processing time demanding computational problems. Clusters of computers provide high computational power at low cost. However, in order to have benefits with the use of clusters, the problems must be adapted before being solved on such computational platform. The present dissertation proposes an exact parallel strategy to the comparison of long DNA sequences in limited memory space. The proposed strategy was implemented in a cluster of workstations, reaching very good speedups for sequences longer than 50Kbp and being able to produce optimal local alignments for sequences with over 3 million base pairs.
56

Comparação algebrica de genomas : o caso da distancia de reversão / Algebraic genome comparison : the case of reversal distance

Almeida, André Atanasio Maranhão, 1981- 23 February 2007 (has links)
Orientador: João Meidanis / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-08T13:34:53Z (GMT). No. of bitstreams: 1 Almeida_AndreAtanasioMaranhao_M.pdf: 3188069 bytes, checksum: b0743bc208c47e2d263f7d5503c22c07 (MD5) Previous issue date: 2007 / Resumo: Nas últimas décadas presenciamos grandes avanços na biologia molecular que levaram ao acúmulo de um grande volume de dados acerca de moléculas, tais como DNAs e proteínas, essenciais para a vida e para seu entendimento.O estágio atual é de busca por ferramentas que permitam extrair informações com relevância biológica destes dados. Neste contexto, a comparação de genomas surge como uma das ferramentas e nesta categoria incluímos rearranjo de genomas. Em rearranjo, o genoma é representado por uma seqüência de blocos conservados e, dados dois genomas e um conjunto de operações, busca-se pela que transformem um genoma no outro. Em 1995, Hannenhallie Pevzner apresentaram o primeiro algoritmo polinomial para o problema da ordenação por reversões orientadas. Tal algoritmo executa em tempo O(n4) e foi o primeiro algoritmo polinomial para um modelo realístico de rearranjo de genomas. Desde então, surgiram algoritmos que apresentam desempenho assintoticamente melhor. O melhor deles, apresentado por Tannier e Sagot em 2004, é capaz de executar em tempo O (n(n log n)1/2). Há um algoritmo linear, desenvolvido por Bader e colegas[2], mas este capaz de determinar a seqüência de reversões, apenas calcula a distância. Motivado pela carência de uma derivação algébrica mais formal da teoria desenvolvida em rearranjo de genomas, desenvolvemos uma solução formal para o problema da distância de reversão com sinal. Utilizamos, em tal solução, um formalismo algébrico para rearranjo de genomas que relaciona a recente teoria de rearranjo de genomas ?basicamente fundamentada no trabalho de Hannenhalli e Pevzner ? e a teoria de grupos de permutação de uma nova forma. Pretendemos criar a base para grandes avanços na área através de um formalismo algébrico forte / Abstract: In the last decades we have seen a great progress in molecular biology. That lead to a large volume of data on molecules, DNA and proteins, essential for life.The current stage of research lies in the pursuit of tools to extract information with biological relevance from this data. In this context, comparison of genomes is an important tool and genome rearrangements is a way of doing that comparison. In rearrangement analysis the genome is represented by a sequence of conserved blocks. The aim is to ?nd a minimum sequence of operations that transform a genome into another given as input two genomes and a set of allowed operations. In 1995, Hannenhalli and Pevzner presented the ?rst polinomial algorithm for sorting signed permutations by reversals. This algorithm has complexity O(n4) in time and was the ?rst polinomial algorithm for a realistic model of genome rearrangement. Since then, new algorithms with better asintotic performance had appeared. The fastest algorithm, with complexity O(n?n logn), was developed byTannier and Sagot in 2004. Motivated by a lack of a more formal derivation in the genome rearrangement developed theory, we developed a formal solution for the signed reversal distance problem. We use an algebraic formalism that relates the recent genome rearrangement theory ? basically based on a work of Hannenhalli and Pevzner ? to permutation group theory in a new form. We intend to build a solid theoretical base for further advances in the area through strong algebraic formalism / Mestrado / Teoria da Computação / Mestre em Ciência da Computação
57

Comparação de genomas completos de especies da familia Vibrionacea empregando rearranjo de genomas / A rearrangement-based approach to compare whole genomes of Vibrionacea strains

Cogo, Patricia Pilisson 23 February 2007 (has links)
Orientador: João Meidanis / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-11T06:12:01Z (GMT). No. of bitstreams: 1 Cogo_PatriciaPilisson_M.pdf: 1149626 bytes, checksum: 10816aa20a620eb105df492903697347 (MD5) Previous issue date: 2008 / Resumo: A evolução das técnicas de seqüenciamento tornou possível a obtenção de uma enorme quantidade de dados genômicos. O desafio atual é analisar esses dados e construir novos conhecimentos a partir deles. Neste contexto, um problema importante e ainda em aberto é a criação de métodos de análise taxonômica de genomas completos. Especialmente para organismos procariontes, para os quais ainda não há um conceito claro de espécie, a comparação de genomas completos pode significar uma importante contribuição. Neste trabalho propomos uma metodologia para comparação de genomas completos baseada na teoria de Rearranjo de Genomas, aplicando-a a organismos da família Vibrionaceae ¿ uma família heterogênea que compreende organismos de cinco diferentes gêneros, incluindo o vibrião causador da cólera, uma doença grave e que ainda causa anualmente milhares de mortes em países em desenvolvimento. As distâncias genômicas obtidas quando analisamos separadamente cada um dos dois cromossomos que compõem o genoma desses organismos estão de acordo com as árvores filogenéticas construídas empregando outros métodos de comparação genômica. Esse resultado corrobora nosso método e a utilização da teoria de rearranjo de genomas como uma alternativa para análise de genomas completos. Além disso, pode indicar que os eventos modelados neste trabalho, como perda de genes, transferências horizontais, reversões entre outros, exercem um papel importante na evolução desses organismos. Compreender a dinâmica desses eventos e combiná-la a outros métodos de análise genômica pode significar um grande avanço para a construção de uma filogenia mais acurada para estes vibriões / Abstract: The evolution in genomic sequencing techniques has resulted in a large amount of genomic data. The challenge that arises from this scenario is to analyze these data and to extract from them relevant biologic information. In this context, taxonomic analysis of complete genome sequences is still an open problem. Futhermore, it is critical for procaryotes, which still lack a clear definition of species, and whose taxonomic classification is in continuous evolution, where complete genomes comparison may well play a significant role. In this work, we propose a methodology to compare complete genomes based on genome rearrangement theory. We have applied our method to organisms of Vibrionaceae family ¿ a heterogeneous family that comprehends organisms from five different genera, including the agent responsible for cholera, a severe disease in developing countries. The genomic distances obtained when we analysed each chromosome individually are in agreement with phylogenic trees built using other genomic methods. This result validates our method and the genomic rearrangement theory as an alternative to analyze complete genomes. It also can indicate the importance played by rearrangement events in the vibrio genomic evolution. The understanding of these events, combined with other genomic methods, can play an important role in the construction of a robust vibrio phylogeny / Mestrado / Biologia Computaçional / Mestre em Ciência da Computação
58

Aplicação de protocolos e métodos em bioinformática para análise de sequenciamento de exomas humanos = Application of bioinformatics protocols and methods for human exome sequencing analysis / Application of bioinformatics protocols and methods for human exome sequencing analysis

Borges, Murilo Guimarães, 1989- 27 August 2018 (has links)
Orientador: Iscia Teresinha Lopes Cendes / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas / Made available in DSpace on 2018-08-27T18:55:52Z (GMT). No. of bitstreams: 1 Borges_MuriloGuimaraes_M.pdf: 8164302 bytes, checksum: cc367cbf534276995150e7db644f6e94 (MD5) Previous issue date: 2015 / Resumo: Os avanços técnicos em sequenciamento alcançados em menos de uma década, atrelados ao desenvolvimento e barateamento do sequenciamento de alto desempenho, oferecem-nos a possibilidade de aplicação dessas tecnologias na medicina genômica. Nesse contexto, surge o sequenciamento do exoma humano, constituído das regiões codificantes do genoma, menor que 2% de sua totalidade. O sequenciamento do exoma (WES) se estabelece hoje como uma ferramenta custo-efetiva com a finalidade de identificar variantes de sequência relacionadas a várias doenças humanas. A análise através da bioinformática é essencial para lidar com o alto volume de dados gerados e realizar a ligação entre o experimento biológico e os dados obtidos. Objetivo: Aplicar e avaliar protocolos e aplicações disponíveis na análise dos dados gerados pelo sequenciamento de exomas humanos, bem como aplicar e aperfeiçoar protocolos e aplicações disponíveis para predizer variantes como potencialmente patológicas a partir de dados gerados pelo sequenciamento de exomas humanos. Materiais e métodos: Foram utilizadas as seguintes ferramentas: FastQC, Rqc, BWA, Picard, GATK e VEP. Estas foram então aplicadas às sequências do exoma humano possibilitando a identificação de variações nos perfis de qualidade das sequências, realinhamento local ao redor de inserções e deleções, recalibração da qualidade e posterior chamada das variantes potencialmente envolvidas nos fenótipos em estudo. No intuito de avaliar se a cobertura no exoma sofre variações mediante diferenças técnicas e étnicas, selecionamos amostras do Projeto 1000 Genomas. Resultados: A aplicação de nosso protocolo em 27 amostras WES resultou em gráficos de controle de qualidade pré e pós-alinhamento, que nos permitiram avaliar de modo global os perfis de qualidade destas sequências; realinhamento ao redor de inserções e deleções que ocorreu em mais de 15% da definição do exoma, realinhando mais de 79% das sequências; recalibração da qualidade que nos permitiu minimizar sua variação por ciclo da reação. Das sequências empregadas, 72% foram pareadas ao genoma, contudo 46% se estendem para fora da definição do exoma, com uma cobertura média de 59x para o exoma estendido e 66x para o exoma restrito. Temos que a cobertura para WES possui uma tendência a variar de acordo com a metodologia de captura empregada e ao grupo étnico de onde as amostras foram obtidas. Conclusão: A aplicação de um workflow para interrogação de variantes que considera a qualidade das sequências fornecidas pelo sequenciador, o alinhamento contra o genoma, realinhamento ao redor de regiões sabidamente conhecidas como portadoras de variações, recalibração da qualidade e anotação permitiu identificar variantes de sequência. Além disso, através da cobertura obtida pelo sequenciamento do exoma foi possível perceber diferenças técnicas e populacionais, refletindo que a complexidade do genoma pode interferir na reação de captura das sequências, influenciando na efetividade da técnica empregada / Abstract: The technical advances in sequencing made in less than a decade associated with the development and low costs of high throughput sequencing techniques allow their application in genomic medicine. Therefore, Whole Exome Sequencing (WES), which corresponds to less than 2% of the entire genome, emerges as a cost-effective tool that aims to identify variants related to human diseases. Bioinformatics is fundamental to process the big volume of data and link the obtained results with the biology. Objective: We aim to apply and evaluate protocols and applications designed for WES data analysis on human subjects. We also intend to apply and enhance protocols and applications designed to predict variants as potentially pathological from WES data. Materials and Methods: We used the following tools: FastQC, Rqc, BWA, Picard, GATK e VEP. We applied them to exome data, determining variation in quality profiles, local realignment, quality recalibration and variant calls. We also evaluated whether or not technical and population differences affect the depth profiles of samples from the 1000 Genomes Project. Results: We applied our protocol on 27 samples, resulting in pre and post-alignment quality control charts. Local realignment took place at more than 15% of the exome definition, extending to more than 79% of sequences. Quality recalibration minimized per cycle variation. In total, 72% of the sequences were paired against the genome, nevertheless 46% extended off-target. The mean coverage was 59X for the exome. We also detected that depth tends to vary based on technical and population differences between samples. Conclusion: We applied a variant-calling workflow that accounts for sequence quality, the alignment against the genome, local realignment, quality recalibration and annotation. In addition, we concluded that depth depends on technical and population differences, showing that genomic complexity may interfere with the capturing phase, affecting downstream analyses / Mestrado / Fisiopatologia Médica / Mestre em Ciências
59

Ferramentas de auxílio ao seqüenciamento de DNA por montagem de fragmentos: um estudo comparativo. / DNA fragments assembly programs: a comparative study.

Said Sadique Adi 05 April 2000 (has links)
Atualmente, existe um grande número de ferramentas para montagem de fragmentos de DNA disponíveis. Neste trabalho apresentamos um estudo comparativo das ferramentas CAP2, FAKtory, TIGR e PHRAP. Para realizarmos este estudo, primeiramente executamos esses sistemas de montagem sobre 12 casos de testes distintos. Após isso, tomamos os resultados obtidos por cada um deles e os comparamos com as seqüências de onde os fragmentos foram originalmente obtidos. Os testes utilizados avaliam a eficiências dos programas com relação a três problemas associados ao processo de montagem (erros no sequenciamento, fragmentos quimeras e regiões repetidas) e pudemos ver que nenhum dos sistemas é claramente superior aos demais no tratamento de todos eles. Cada ferramenta de montagem parece tratar de melhor forma um problema em especial.Além de avaliarmos os resultados, realizamos também um estudo. / Noways, several peckages for DNA fragment assembly are aviable. In this wok we present a comparative study of the preformances of the programs CAP2, FAKtory, TIGR e PHrap. To get to our objetives, we firt ran each of these programs on twelve intances. After this,we compared the outputs with the sequences from wich the fragments were originally obtained. In this comparison,we took into consideration three problems related to fragments assembly (sequencing errors, chimeric fragments and repeats regions). We conclude that no one of the packages we tested is more efficient than the others when considering all the problems cited above. If we consider a particular problem, the we observed different performances among the programs. Even more, we compare the packages with respect to theirs to CPU times.
60

Desenvolvimento de uma abordagem computacional para a tradução in silico de variantes de splicing detectadas no transcriptoma humano

Silva, Raphael Tavares da January 2012 (has links)
Submitted by Priscila Nascimento (pnascimento@icict.fiocruz.br) on 2013-03-27T18:14:58Z No. of bitstreams: 1 Raphael_Tavares_da_Silva_BCS_Dissertacao_Aprovada_Definitiva.pdf: 4336076 bytes, checksum: f1085dad138bd375d802492afe1782ff (MD5) / Approved for entry into archive by Priscila Nascimento(pnascimento@icict.fiocruz.br) on 2013-03-27T18:24:55Z (GMT) No. of bitstreams: 1 Raphael_Tavares_da_Silva_BCS_Dissertacao_Aprovada_Definitiva.pdf: 4336076 bytes, checksum: f1085dad138bd375d802492afe1782ff (MD5) / Made available in DSpace on 2013-03-27T18:24:55Z (GMT). No. of bitstreams: 1 Raphael_Tavares_da_Silva_BCS_Dissertacao_Aprovada_Definitiva.pdf: 4336076 bytes, checksum: f1085dad138bd375d802492afe1782ff (MD5) Previous issue date: 2012 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil. / Um dos mecanismos capaz de aumentar a diversidade do proteoma de eucariotos é o splicing alternativo nos pré-mRNAs. Este mecanismo celular ocorre durante a transcrição dos genes, sendo ocasionado por um ou mais dos seguintes eventos: retenção de íntrons, uso alternativo de sítio de splice 5', uso alternativo de sítio de splice 3' e uso alternativo de éxons. Análises recentes de Bioinformática utilizando experimentos de RNA-Seq mostram que aproximadamente 90% dos genes humanos produzem mais de um transcrito decorrente de eventos de splicing alternativo. O impacto do splicing alternativo no proteoma humano vem sendo alvo de algumas abordagens de Bioinformática, sendo esperado que uma grande porção de tais transcritos alternativos possa alterar o conteúdo da cadeia polipeptídica obtida após a sua tradução. Devido à sua importância, diversos trabalhos já foram desenvolvidos com o objetivo de facilitar a identificação de eventos de splicing alternativo a partir de dados provenientes de cDNA, bem como sua associação com a estrutura das proteínas de suas isoformas. Entretanto, são poucas as abordagens que realizaram a tradução in silico do transcriptoma humano na busca por variantes de splicing e a utilização de dados oriundos de sequenciadores de segunda geração (NGS) ainda é muito pouco explorada para tratar do tema. Desta maneira, o presente projeto tem como objetivo a aplicação de uma nova abordagem para a identificação e tradução de variantes de splicing alternativo usando dados de NGS. Foram utilizadas leituras da plataforma de sequenciamento Roche/454 oriundas de estudos de câncer para um enriquecimento de nosso banco de dados original que continha previamente mRNAs completos e ESTs. Após o enriquecimento, a metodologia empregada pelo nosso grupo conseguiu detectar 4.574 variantes de splicing inéditas em nosso banco. O novo banco gerado foi traduzido levando a criação de um repertório proteico contendo 159.638 sequências polipeptídicas não redundantes. Na busca por variantes inéditas utilizando dados de proteômica, foram identificadas três possíveis nos genes humanos tubulina 2b, tubulina 4b e actina. Dados de sequenciamento da plataforma Illumina também foram utilizados para uma avaliação da sua contribuição em número de variantes e sequências polipeptídicas traduzidas em nosso repertório. Encontramos que a nossa abordagem foi capaz de anotar 53% mais sequências polipeptídicas quando comparada ao repertório de ENSEMBL Gene. Desta forma, acreditamos que o presente projeto pode auxiliar no melhoramento da anotação de peptídeos encontrados por técnicas de proteômica, bem como no descobrimento de novos marcadores moleculares. / Alternative splicing of pre-mRNAs is one of the mechanisms capable to increase the proteome diversity in eukaryotes. This cellular mechanism occurs during the transcription of genes and is associated with one or more of the following events: intron retention, 5’ alternative splice, 3’ alternative splice and exon skipping. Recent Bioinformatics analysis using RNA-Seq experiments showed that approximately 90% of human genes produce more than one transcript due to alternative splicing events. The impact of alternative splicing in the human proteome has been the focus of some Bioinformatics approaches and is expected that the majority part of these alternative transcripts can alter the polypeptide chain produced after its translation. Due to its importance, many studies have been developed focused on facilitating the identification of alternative splicing events based on cDNA data, as well as to study the protein structure of its isoforms. However, few studies performed the in silico translation of the human transcriptome to search for new splicing isoforms using Next Generation Sequencing (NGS) data. In this way, our project aims to the development of a new approach to identify and translate alternative splicing isoforms using NGS data. Roche/454 reads of cancer studies were used to enrich our initial database, which was previously populated with full-length mRNAs and ESTs data. After the enrichment step, the methodology developed by our group could detect 4,574 new splicing variants in our database. The enriched database was translated, producing a protein repository with 159,638 non-redundant polypeptide sequences. Searching for new isoforms using experimental proteomic data, three possible new isoforms were identified for the human genes tubulin 2b, tubulin 4b and actin. Illumina sequencing data was used to assess its contribution for the number of new isoforms and the translated polypeptide sequences on our database. We realized that our approach was capable to annotate 53% more polypeptide sequences when compared with the ENSEMBL Gene repository. In this way, we believe that our project can support the improvement of peptide annotation found by proteomic techniques, as well as to discover new molecular markers.

Page generated in 0.1266 seconds