• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 27
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 565
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 42
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Predicción computacional de genes de ARN no codificante pequeño en genomas bacterianos

Rogers Ahumada, Andrés Eduardo January 2012 (has links)
Magíster en Ciencias de la Ingeniería, Mención Química / El objetivo de este estudio es desarrollar un método computacional capaz de predecir con alta especificidad y sensibilidad los genes pequeños de ARN no codificante en genomas bacterianos, identificando las variables involucradas de mayor importancia que deben ser consideradas para su correcta clasificación. El trabajo aquí presentado consistió en investigar y analizar el estado del arte en métodos de predicción computacional de genes pequeños de ARN no codificante en bacterias, recopilar un listado de las variables involucradas y determinar estadísticamente aquellas que diferencian con mayor precisión los genes pequeños de ARN no codificante de secuencias genéticas al azar, comparar distintos métodos de predicción e identificar el que otorgue mejores resultados. Finalmente, se compararon los resultados del método con otros preexistentes y se aplicó el método al genoma completo de Escherichia coli. Los principales resultados obtenidos en este estudio son la identificación de 4 variables que influyen significativamente en la detección correcta de genes pequeños de ARN no codificante. Estas son: Valor z, Valor de partición, EMPI y Porcentaje de bultos, las cuales corresponden al subconjunto de variables con mayor capacidad discriminatoria. Por este motivo se recomienda que futuros métodos predictivos consideren la inclusión de estas 4 variables. Las variables seleccionadas muestran que existe una presión selectiva en la evolución de los genes pequeños de ARN no codificante, la que apunta a aumentar la estabilidad de la molécula al modificar su estructura para disminuir la energía de plegamiento y eliminar subestructuras desestabilizantes no funcionales. El mejor método de clasificación corresponde al Perceptrón Multicapa basado en redes neuronales, con una alta sensibilidad (88,8%) y alta especificidad (85,5%), teniendo una tasa de falsos positivos relativamente baja (14,5%). Con este subconjunto de variables y el método de clasificación, se realizó una predicción sobre el genoma de la bacteria Escherichia coli, generando 1192 predicciones, con un valor de sensibilidad de 30,5% y un valor predictivo positivo de 1,51 % respecto a los genes pequeños de ARN no codificante conocidos. Seleccionando las predicciones cercanas a promotores σ70 o terminadores intrínsecos (independientes del factor ρ), se obtiene un desempeño predictivo similar al logrado por otros autores en la literatura, con el beneficio adicional de requerir la medición de sólo 4 variables y sin la necesidad de información sobre genes homólogos en organismos cercanos filogenéticamente. La contribución de este trabajo consiste en profundizar el conocimiento acerca de las características de los genes de ARN no codificante, al haber estudiado las variables utilizadas previamente en la literatura y definir las 4 más relevantes, las cuales se relacionan directamente con la estructura secundaria y su energía mínima de plegamiento. En segundo lugar se propone un listado de 1192 secuencias del genoma de Escherichia coli y un listado más corto con las 5 más probables de ser genes sARN, estas secuencias pueden ser comprobadas experimentalmente. Estos resultados inciden positivamente en mejorar la calidad de las anotaciones de estos genes en genomas bacterianos, permitiendo mayores avances en estudios de genómica funcional y regulación en redes metabólicas.
92

Influência do microbioma intestinal no desenvolvimento de doença de Crohn

Andrighetti, Tahila. January 2019 (has links)
Orientador: Ney Lemke / Resumo: A doença de Crohn é um subtipo de doença inflamatória intestinal caracterizada pela inflamação intestinal e disbiose da microbiota. A doença é causada uma manifestação atípica da resposta imune à presença de proteínas microbianas alteradas na interface da mucosa intestinal. Várias análises meta-ômicas têm sido executadas para caracterizar a microbiota intestinal em casos de doença de Crohn. Entretanto, devido à limitações das tecnologias e desvantagens inerentes aos métodos experimentais existentes, os mecanismos mediados pelas proteínas do microbioma alterado de doença de Crohn ainda não foram exploradas. Para analisar essa interação a nível molecular, executamos uma abordagem computacional que combina conjuntos de dados de metaproteômica publicados de um estudo clínico de pares de gêmeos com predições de interação entre proteínas microbianas e humanas. Essa predição baseia-se em características estruturais, inferências de regiões desordenadas, vias de sinalização e redes de interação para determinar as possíveis funções mediadas pelas proteínas microbianas. Como resultado, foi obtida uma rede de interação microbioma-hospedeiro que inicia sua sinalização com proteínas bacterianas que interagem com proteínas humanas de superfície celular. A expansão desse sinal foi modelada em direção ao núcleo da célula, onde observamos potenciais pontos de modulação de genes de autofagia: um dos processos celulares mais modificados em células de doença de Crohn em comparação às saudáveis. E... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Crohn’s disease (CD) is a subtype of inflammatory bowel disease (IBD) characterized by intestinal inflammation and microbiome dysbiosis. The disease is caused by an atypical manifestation of immune response to altered microbial proteins located in the intestinal mucosa. Various meta-omic based analyses have been carried out to profile and characterize the gut microbiota upon onset of CD. However, the molecular mechanisms mediated by the altered CD microbiome wasn’t explored yet due to the technology limitations and disavantages of the experimental methods. In order to analyse this interactio in a molecular level, we performed a computational approach which uses metaproteomic datasets from a twin-pair CD cohort study and prediction of the interaction between human and bacterial proteins. This prediction relies on structural feature based interaction prediction between microbial and host receptor proteins, disordered region inferences, signalling pathways and interaction networks to determine the possible functions mediated by the microbial proteins. As a result, we obtained a host-microbiome interaction network which starts the molecular signal with bacterial proteins interacting with human receptor proteins interactions. The expansion of this signal was modeled in direction to the cellular nucleus, where reaches autophagy genes modulation spots, hence autophagy is one of the key cellular processes to CD development. This model revealed potential differences between CD and hea... (Complete abstract click electronic access below) / Doutor
93

Alinhamento múltiplo de genomas de eucariotos com montagens altamente fragmentadas / Multiple alignment of large eukaryotic genomes with highly fragmented assemblies

Epamino, George Willian Condomitti 04 August 2017 (has links)
O advento do sequenciamento de nova geração (NGS - Next Generation Sequencing) nos últimos anos proporcionou um aumento expressivo no número de projetos genômicos. De maneira simplificada, as máquinas sequenciadoras geram como resultado fragmentos de DNA que são utilizados por programas montadores de genoma. Esses programas tentam juntar os fragmentos de DNA de modo a obter a representação completa da sequência genômica (por exemplo um cromossomo) da espécie sendo sequenciada. Em alguns casos o processo de montagem pode ser executado com maior facilidade para organismos com genomas de tamanhos pequenos (por exemplo bactérias com genoma em torno de 5Mpb), através de pipelines que automatizam a maior parte da tarefa. Um cenário mais complicado surge quando a espécie possui genoma com grande comprimento (acima de 1Gpb) e elementos repetidos, como no caso de alguns eucariotos. Nesses casos o resultado da montagem é geralmente composto por milhares de fragmentos (chamados de contigs), uma ordem de magnitude muito superior ao número de cromossomos estimado para um organismo (comumente da ordem de dois dígitos), dando origem a uma montagem altamente fragmentada. Uma atividade comum nesses projetos é a comparação da montagem com a de outro genoma como forma de validação e também para identificação de regiões conservadas entre os organismos. Embora o problema de alinhamento par-a-par de genomas grandes seja bem contornado por abordagens existentes, o alinhamento múltiplo (AM) de genomas grandes em estado fragmentado ainda é uma tarefa de difícil resolução, por demandar alto custo computacional e grande quantidade de tempo. Este trabalho consiste em uma metologia para fazer alinhamento múltiplo de genomas grandes de eucariotos com montagens altamente fragmentadas. Nossa implementação, baseada em alinhamento estrela, se mostrou capaz de fazer AM de grupos de montagens com diversos níveis de fragmentação. O maior deles, um conjunto de 5 genomas de répteis, levou 14 horas de processamento para fornecer um mapa de regiões conservadas entre as espécies. O algoritmo foi implementado em um software que batizamos de FROG (FRagment Overlap multiple Genome alignment), de código aberto e disponível sob licença GPLv3. / The advent of Next Generation Sequencing (NGS) in recent years has led to an expressive increase in the number of genomic projects. In a simplified way, sequencing machines generate DNA fragments that are used by genome assembler software. These programs try to merge the DNA fragments to obtain the complete representation of the genomic sequence (for example a chromosome) of the species being sequenced. In some cases the assembling process can be performed more easily for organisms with small-sized genomes (e.g. bacteria with a genome length of approximately 5Mpb) through pipelines that automate most of the task. A trickier scenario arises when the species has a very large genome (above 1Gbp) and complex elements, as in the case of some eukaryotes. In those cases the result of the assembly is usually composed of thousands of fragments (called contigs), an order of magnitude much higher than the number of chromosomes estimated for an organism (usually in the order two digits), giving rise to a highly fragmented assembly. A common activity in these projects is the comparison of the assembly with that of another genome as a form of validation and also to identify common elements between organisms. Although the problem of pairwise alignment of large genomes is well circumvented by existing approaches, multiple alignment of large genomes with highly fragmented assemblies remains a difficult task due to its time and computational requirements. This work consists of a methodology for doing multiple alignment of large eukaryotic genomes with highly fragmented assemblies, a problem that few solutions are able to cope with. Our star alignment-based implementation, was able to accomplish a MSA of groups of assemblies with different levels of fragmentation. The largest of them, a set of 5 reptilian genomes where the B. jararaca assembly (800,000 contigs, N50 of 3.1Kbp) was used as anchor, took 14 hours of execution time to provide a map of conserved regions among the participating species. The algorithm was implemented in a software named FROG (FRagment Overlap multiple Genome alignment), available under the General Public License v3 (GPLv3) terms.
94

Bioinformática e biogeografia para buscar produtos naturais em metagenomas / Bioinformatics and biogeography to mine natural products in metagenomes

Frias, Ulysses Amâncio de 14 December 2017 (has links)
Os produtos naturais microbianos (NP) tem demonstrado ser inestimáveis pontos de partida na descoberta e desenvolvimento de medicamentos aprovados pelo FDA. A abordagem tradicional para a identificação de produtos naturais microbianos exige a cultura em laboratório. Infelizmente, os métodos convencionais baseados nesta metodologia foram desestimulados devido a altas taxas de redescoberta de moléculas. Os métodos independentes de cultura que se baseiam no sequenciamento do metagenoma microbiano sugerem a ocorrência de um enorme reservatório inexplorado de clusters biossintéticos de produtos naturais (BGCs) no meio ambiente. Neste trabalho utilizamos uma metodologia baseada em PCR e barcoding amplicon-sequencing para buscar importantes famílias de produtos naturais como peptídeos não ribossomais (NRP), ácido 3-amino-5-hidroxibenzóico (AHBA), dímeros de triptofano (TD), policetídeos, aminoglicosídeos e outros. Para isto desenvolvemos um script chamado SecMetPrimer que nos permitiu bioinformaticamente desenhar conjuntos de primers contendo um gradiente de degenerâncias. No total, desenhamos 165 conjuntos de primers. Os amplicons foram obtidos por PCR padrão, tendo sido concatenados barcodes específicos por amostra e sequenciados através de Illumina MiSeq. Para validar, utilizamos eDNA (environmental DNA) de bibliotecas metagenômicas, totalizando 223 milhões de clones. Através das análises bioinformáticas, as curvas de rarefação foram calculadas e a diversidade para cada família foi determinada. Foi realizada uma reamplificação dos domínios de adenilação de peptídeo não ribossomal e domínios de cetosintase de policetídeos utilizando eDNA isolado de 25 amostras diferentes coletadas em Mata Atlântica, Cerrado e ambiente marinho. Nossos dados indicaram a correlação entre distância geográfica e o tipo ecológico dos biomas. Deste modo, foi possível assim atribuir genes relacionados à clusters biossintéticos que codificam importantes produtos naturais à informações taxonômicas e metabólicas. Deste modo identificamos os melhores hotspots para busca de diversidade biossintética dentre as amostras analisadas. / Microbial natural products (NP) have proven to be invaluable starting points in the discovery and development of many drugs approved by FDA. The traditional approach to identify microbial natural products requires the culturing in the laboratory. Unfortunately, conventional culture-based methods have been deemphasized due to high rediscovery rates. Culture-independent methods applying microbial (meta)genome sequencing suggest the occurrence of an enormous untapped reservoir of natural-product-encoding biosynthetic gene clusters (BGCs) in the environment. Here we have used a PCR-based approach and barcoding ampliconsequencing derived from important families of microbial natural products such as nonribosomal peptides (NRP), polyketides (PK), 3-amino-5-hydroxybenzoic acidcontaining NPs (AHBA), tryptophan dimmers (TD), aminoglycosides, phosphonocontaining NPs and others. We have written an internal script called SecMetPrimer that allowed us to bioinformatically design sets of primers containing a range of degeneracy to amplify these genes. At the total, we designed 165 different sets of primers. The amplicons were obtained by standard PCR containing double-barcodedtarget primers and sequenced by Illumina MiSeq platform. The validation process was conducted using eDNA from metagenomic libraries containing a 223 millions of clones. The rarefaction and diversity analyses were assigned, and the best-hit primer for each family was chosen. We have re-amplified the nonribosomal peptide adenylation domains and polyketide ketosynthase domains, using as substrate environmental DNA isolated from 25 different samples collected in Atlantic Forest, Cerrado and marine environment. Our data indicate a correlation between geographic distance and biome-type, and the biosynthetic diversity found in these environments. Thus, by assigning reads to known BGCs against taxonomic and metabolic profiles, we have identified the hotspots of relevant biosynthetic diversity among the analyzed samples.
95

Perseus:uma nova técnica para tratar árvores de sufixo persistentes / Perseus: a novel technique to handle persistent suffix trees

Carelo, Caio Cesar Mori 31 August 2009 (has links)
O avanço tecnológico dos laboratórios de biologia molecular tem proporcionado um grande aumento no volume de seqüências de nucleotídeos armazenadas em bancos de dados biológicos, introduzindo o desafio de pesquisar eficientemente estes dados. Neste contexto, a árvore de sufixo é um método de acesso utilizado por muitas aplicações que envolvem pesquisa em dados biológicos. Entretanto, o custo de construção das árvores de sufixo é alto devido ao tamanho da estrutura de indexação gerado e à necessidade da árvore de sufixo caber em memória principal para ser construída com complexidade linear em relação ao tempo. Esta dissertação propõe o Perseus, uma nova técnica para tratar árvores de sufixo persistentes. A técnica Perseus apresenta os seguintes diferenciais. Ela introduz uma abordagem que realiza a construção de árvores de sufixo persistentes cujos tamanhos podem exceder a capacidade da memória principal. Além disso, ela provê um algoritmo que constrói árvores de sufixo por meio do particionamento destas árvores somente quando necessário. Esta construção também permite que o usuário escolha quais subseqüências de uma seqüência devem ser indexadas, de acordo com os requisitos particulares de suas aplicações. Por fim, a técnica proposta também introduz um algoritmo de casamento exato que permite a busca por uma seqüência de consulta em árvores de sufixo que podem estar particionadas. A validação do Perseus foi realizada por meio de testes de desempenho considerando genomas de vários organismos, os quais possuem diferentes ordens de magnitude de tamanho. Os resultados obtidos foram comparados com a técnica Trellis+, a qual representa o estado da arte nesta linha de pesquisa. Os testes indicaram que o Perseus construiu árvores de sufixo mais rapidamente do que o Trellis+, reduzindo o tempo total gasto na construção em até 24%. Perseus também criou árvores de sufixo mais compactas, atingindo uma redução média de 27% no espaço de memória secundária utilizado. Já com relação ao tempo total gasto no processamento de consultas, Perseus sempre produziu os melhores resultados, respondendo consultas em média 49% mais rápido do que o seu principal concorrente. Com relação à indexação de subseqüências escolhidas pelo usuário, comparando os resultados obtidos com o Trellis+, os testes mostraram que Perseus proveu uma redução no tempo de construção de árvores de sufixo de 97% na média e uma redução no tempo gasto no processamento de consultas de genes de 93% na média / Due to the technological advances in molecular biology laboratories, biological databases are extremely voluminous and tend to become more voluminous as data on new genome organisms are available. This introduces the challenge of searching nucleotide sequences efficiently. The suffix tree is an access method used for several applications that search for these data. However, the cost of building suffix trees is high, since they are extremely large data structures and they should fit in the main memory to be constructed in linear time. In this masters thesis, we propose the Perseus, a novel technique that handles persistent suffix trees. The Perseus introduces the following distinctive good properties. It is based on an approach that constructs persistent suffix trees whose sizes may exceed the main memory capacity. Furthermore, it provides an algorithm that allows for users to indicate which substrings of the input string should be indexed, according to the requirements of their applications. Moreover, it proposes an extended exact matching algorithm that searches for a query string into suffix trees that may be partitioned. The Perseus was validated through performance tests using genomes of several organisms of different sizes. The results were compared with the Trellis+ technique, which represents the state-of-the-art in this field. The tests showed that the Perseus reduced the time spent on constructing suffix trees by 24%. The Perseus also constructed compacter suffix trees, providing an average reduction in the secondary memory storage of 27%. Furthermore, the Perseus reduced the time spent on query processing of nucleotide sequences by up to 49%. As for the functionality of indexing substrings according to the users requirements, the Perseus greatly improved the query performance in comparison to the Trellis+. The results showed that the Perseus reduced the time spent on constructing suffix trees by 97% on average and the time spent on query processing of genes by 93% on average
96

Estudo de variações genômicas para a identificação de biomarcadores personalizados e novos alvos terapêuticos em tumores colorretais / Study of genomic variation to identify biomarkers and novel therapeutic targets in colorectal tumors

Moreira, Elisa Rennó Donnard 06 August 2014 (has links)
O câncer colorretal é um dos tipos de tumores mais frequentes no mundo. A atual dificuldade na avaliação correta da resposta ao tratamento torna necessário o desenvolvimento de novas abordagens de detecção tumoral. Atualmente, o sequenciamento genômico em larga escala permite um estudo mais compreensivo das alterações estruturais e de sequência presentes no tumor. A aplicação destas abordagens de maneira personalizada permite o desenvolvimento de biomarcadores tumor específicos que podem facilitar a avaliação de resposta ao tratamento e a presença de doença residual, bem como revelar alterações de sequência em genes capazes de servir de novos alvos terapêuticos. Neste estudo foi desenvolvida uma metodologia eficiente para a identificação de biomarcadores baseados na existência de variações estruturais em genomas de tumores de reto, eliminando a necessidade de sequenciamento do genoma normal do mesmo paciente e diminuindo portanto o custo da abordagem. Os biomarcadores encontrados para cada um dos seis pacientes foram utilizados para avaliar a presença de doença residual após o tratamento através da detecção de DNA tumoral circulante nas amostras de plasma coletadas em momentos diferentes do tratamento. O sequenciamento em baixa cobertura personalizado é portanto uma alternativa viável e promissora para avaliar a resposta ao tratamento em pacientes com tumores de reto. Na segunda parte do estudo, a análise de linhagens celulares de tumores colorretais revelou uma grande quantidade de mutações pontuais somáticas (SNVs e InDels) em genes codificadores para proteínas de superfície celular (surfaceoma). Estas alterações no surfaceoma indicam potenciais novos alvos para drogas e vias regulatórias alteradas neste tipo de tumor. Além disso, estas mutações pontuais também são responsáveis pela geração de epítopos com potencial imunogênico e estes novos epítopos podem ser aplicados como vacinas antitumorais personalizadas e já haviam sido propostos como uma alternativa terapêutica. A presença de novos epítopos, principalmente nas linhagens com elevadas taxas de mutação (resultante da instabilidade de microssatélites e mutações em genes de reparo de DNA tipo mismatch ou POLE), sugerem também um potencial uso de drogas moduladoras do sistema imune em pacientes com tumores que apresentam estas mesmas características. Portanto, o estudo de alterações genômicas em tumores primários e linhagens de câncer colorretal permitiu a detecção de variações estruturais que foram utilizadas como biomarcadores personalizados em pacientes com tumores de reto assim como a identificação de genes contendo mutações pontuais em linhagens celulares de câncer colorretal, que revelam potenciais novos alvos terapêuticos a serem explorados na clínica / Colorectal cancer is one of the more frequent tumor types in the world. To select the appropriate treatment course, it is necessary to develop more precise diagnostic approaches. The current availability of high throughput genome sequencing methods allows for a comprehensive characterization of the structural and sequence alterations present in each tumor. The use of tumor genome sequencing in a personalized setting can result in tumor specific biomarkers that help evaluate response to treatment and the presence of residual disease, improving the clinical management of these patients, and also reveal sequence alterations in genes capable of serving as new therapeutic targets. In this study we developed an efficient bioinformatics pipeline to identify biomarkers based on the existing structural alterations in rectal tumor genomes, eliminating the need to sequence the matched normal genome and therefore reducing the cost for this approach. The biomarkers found for each of the six patients were used to evaluate the presence of residual disease after treatment through the detection of circulating tumor DNA in plasma samples collected at different points during the treatment. Sequencing tumor genomes with low coverage is therefore a viable and promising alternative to follow up rectal cancer patient\'s response to treatment. In the second part of this study, the analysis of colorectal cancer cell lines revealed a large quantity of point mutations (SNVs and InDels) in genes coding for proteins located in the cell surface (surfaceome). These alterations in the surfaceome indicate potential new drug targets and altered pathways in this type of tumor. Furthermore, these point mutations are also responsible for the generation of new epitopes with immunogenic potential and these new epitopes can be applied as personalized tumor vaccines and had previously been proposed as a therapeutic alternative. The presence of new epitopes, especially in the cell lines with elevated mutation rates (resulting from MSI and mutations in DNA mismatch-repair genes or POLE), suggests a potential use of immune checkpoint target drugs in patients with tumors that share these genetic characteristics. With a large-scale bioinformatics approach, we detected new tumor epitopes resulting from point mutations, present in most of the cell lines used. The analysis of gene expression data puts into perspective both the somatic mutations found and which targets are promising as well as the development of therapies based on vaccines derived from tumor epitopes. In conclusion, the study of genomic alterations in primary tumors and colorectal cancer cell lines allowed the detection of structural variations that were used as personalized biomarkers in patients with rectal tumors as well as the identification of genes containing point mutations in colorectal cancer cell lines, that reveal potential new therapeutic targets to be explored in the clinical setting.
97

Algoritmos eficientes para análise de campos aleatórios condicionais semi-markovianos e sua aplicação em sequências genômicas / Efficient algorithms for semi-markov conditional random fields and their application for the analysis of genomic sequences

Bonadio, Ígor 06 August 2018 (has links)
Campos Aleatórios Condicionais são modelos probabilísticos discriminativos que tem sido utilizados com sucesso em diversas áreas como processamento de linguagem natural, reconhecimento de fala e bioinformática. Entretanto, implementar algoritmos eficientes para esse tipo de modelo não é uma tarefa fácil. Nesse trabalho apresentamos um arcabouço que ajuda no desenvolvimento e experimentação de Campos Aleatórios Condicionais Semi Markovianos (semi-CRFs). Desenvolvemos algoritmos eficientes que foram implementados em C++ propondo uma interface de programação flexível e intuitiva que habilita o usuário a definir, treinar e avaliar modelos. Nossa implementação foi construída como uma extensão do arcabouço ToPS que, inclusive, pode utilizar qualquer modelo já definido no ToPS como uma função de característica especializada. Por fim utilizamos nossa implementação de semi-CRF para construir um preditor de promotores que apresentou performance superior aos preditores existentes. / Conditional Random Fields are discriminative probabilistic models that have been successfully used in several areas like natural language processing, speech recognition and bioinformatics. However, implementing efficient algorithms for this kind of model is not an easy task. In this thesis we show a framework that helps the development and experimentation of Semi-Markov Conditional Random Fields (semi-CRFs). It has an efficient implementation in C++ and an intuitive API that allow users to define, train and evaluate models. It was built as an extension of ToPS framework and can use ToPS probabilistic models as specialized feature functions. We also use our implementation of semi-CRFs to build a high performance promoter predictor.
98

Bioinformática estrutural de proteínas modificadas por eventos de splicing alternativo / Structural Bioinformatics of Proteins modified by Alternative Splicing

Durham, Elza Helena Andrade Barbosa 10 December 2007 (has links)
Bioinformática estrutural de proteínas modificadas por eventos de splicing alternativo / Structural Bioinformatics of Proteins modified by Alternative Splicing
99

Modelagem e informatização do processo de análise do sequenciamento de exoma humano / Computational modeling and implementation of the human exome sequencing analysis process

Paula, Marcelo Gomes de 11 October 2018 (has links)
O sequenciamento de nova geração tornou-se recentemente uma opção economicamente viável para a realização de aconselhamento genético, tendo proporcionado oportunidades sem precedentes para a pesquisa genômica personalizada, uma vez que o sequenciamento permite identificar a presença de variantes patogênicas. O teste genético que permite identificar as variantes patogênicas possui procedimentos laboratoriais como a coleta, preparação e sequenciamento do material e outros computacionais como o alinhamento, anotação e análise do exoma. A despeito do fato de que a grande quantidade de dados gerados no sequenciamento torna a atividade de análise relativamente complexa, esta tem sido realizada de forma manual por pesquisadores e profissionais da saúde, apesar de existir uma variedade de ferramentas computacionais disponíveis para auxiliar a análise e a interpretação de variações genéticas pontuais. Isto acontece porque a maioria destas ferramentas são generalistas, pouco amigáveis e não atendem às necessidades em pesquisa e atendimento clínico, não sendo utilizadas rotineiramente nesses ambientes. A análise manual, por sua vez, caracteriza-se por gerar resultados altamente dependentes tanto do conhecimento do pesquisador quanto da especificidade do procedimento realizado. O presente trabalho tem por objetivo desenvolver a modelagem do processo de análise de exoma, considerando a presença e a interação de diferentes papéis de usuário, num processo padronizado, porém flexível, juntamente com a implementação de uma ferramenta computacional amigável para a execução da análise baseada na modelagem proposta de forma organizada e otimizada, oferecendo suporte a atividades relacionadas à pesquisa e ao atendimento clínico. As análises processadas com a ferramenta também têm seus parâmetros e resultados armazenados e disponibilizados para uso em investigações futuras, possibilitando o compartilhamento do conhecimento para geração de novas descobertas. Nas avaliações realizadas para validação da proposta o modelo e a ferramenta mostram-se eficientes e apresentam boa usabilidade para a realização das análises / New generation sequencing has recently become an economically viable option for genetic counseling and has provided unprecedented opportunities for personalized genomic research since sequencing allows the identification of the presence of pathogenic variants. The genetic test that allows to identify the pathogenic variants has laboratory procedures like the collection, preparation and sequencing of the material and other computational as the alignment, annotation and analysis of the exoma. In spite of the fact that the large amount of data generated in the sequencing makes the analysis activity relatively complex, it has been performed manually by researchers and health professionals, although a variety of computational tools are available to aid analysis and the interpretation of specific genetic variations. This is because most of these tools are generalist, unfriendly and do not meet clinical research and care needs and are not routinely used in these settings. The manual analysis, in turn, is characterized by generating results highly dependent on both the knowledge of the researcher and the specificity of the procedure performed. The present work aims to develop the modeling of the exoma analysis process, considering the presence and interaction of different user roles, in a standardized but flexible process, together with the implementation of a user-friendly computational tool for performing the analysis based in the proposed modeling in an organized and optimized way, supporting activities related to research and clinical care. The analyzes processed with the tool also have their parameters and results stored and made available for use in future investigations, allowing the sharing of knowledge to generate new discoveries. In the evaluations carried out to validate the proposal, the model, and the tool are efficient and have good usability for carrying out the analysis
100

Avaliação do perfil genômico dos genes da família HOX em tumores a partir de dados de bancos públicos / Genomic profile evaluation of HOX genes family in cancer using public databases

Plaça, Jessica Rodrigues 11 October 2017 (has links)
A família de genes HOX compreende um conjunto de fatores de transcrição altamente conservados evolutivamente. Em mamíferos, os genes HOX se subdividem em 4 clusters: HOXA, HOXB, HOXC e HOXD, atuando no desenvolvimento embrionário com a regulação de processos biológicos como proliferação, diferenciação, migração, angiogênese e apoptose que são reativados durante a carcinogênese. Estudos recentes apontam que os genes HOX podem exercer papel relevante na formação de diversos tumores sólidos, todavia ainda não foi possível caracterizar sistematicamente a expressão dos genes HOX em tumores bem como determinar seus alvos em tumores. Desta forma, o objetivo geral deste trabalho consistiu na caracterização in silico do modelo de atuação genes HOX na carcinogênese. Para cumprir este objetivo foi identificado o perfil diferencial dos genes HOX entre amostras normais e tumorais. Alvos de genes HOX foram identificados e, quando diferencialmente expressos, foram associados com os genes HOX, independentemente dos índices de metilação e CNA. Por fim, as associações finais entre os genes HOX e seus alvos foram enriquecidas com os bancos de dados KEGG e GO. Identificou-se diferentes assinaturas de expressão de genes HOX em diferentes tumores, associadas com o eixo ântero-posterior do corpo humano, bem como os folhetos embrionários originários aos tecidos tumorais, compatível com o padrão de expressão no desenvolvimento embrionário. Um número considerável de genes HOX atuam preferencialmente via enhancers na regulação de seus alvos. Como exemplo, os genes HOXB7 e HOXC11, que funcionam como moduladores anti tumorais. Finalmente, o estudo mostra que diante do número crescente de dados genômicos públicos, é possível viabilizar projetos de grande valor científico. / The HOX gene family comprises a set of evolutionarily highly conserved transcription factors. In mammals, HOX genes are subdivided into four clusters: HOXA, HOXB, HOXC and HOXD, acting on the embryonic development with regulation of biological processes such as proliferation, differentiation, migration, angiogenesis and apoptosis that are reactivated during carcinogenesis. Recent studies indicate that HOX genes may play a relevant role in the formation of several solid tumors, but it has not been possible to systematically characterize the expression of HOX genes in tumors as well as to determine their targets in tumors. Thus, the general aim of this project was to characterize the in vivo model of HOX genes in carcinogenesis. To accomplish this goal the differential profile of HOX genes was identified between normal and tumor samples. HOX gene targets were identified and, when differentially expressed, were associated with HOX genes regardless of methylation and CNA indices. Finally, the final associations between the HOX genes and their targets were enriched with the KEGG and GO databases. Different signatures of HOX gene expression were identified in different tumors, associated with the anteroposterior axis of the human body, as well as the embryonic leaflets originating from the tumor tissues, compatible with the expression pattern in the embryonic development. A considerable number of HOX genes preferentially act via enhancers in the regulation of their targets. As an example, the HOXB7 and HOXC11 genes, which function as pro-tumor modulators. Finally, the study shows that in view of the growing number of public genomic data, it is possible to make feasible projects of great scientific value.

Page generated in 0.1604 seconds