121 |
Alinhamento de seqüências com rearranjos / Sequences alignment with rearrangementsAugusto Fernandes Vellozo 18 April 2007 (has links)
Uma das tarefas mais básicas em bioinformática é a comparação de seqüências feita por algoritmos de alinhamento, que modelam as alterações evolutivas nas seqüências biológicas através de mutações como inserção, remoção e substituição de símbolos. Este trabalho trata de generalizações nos algoritmos de alinhamento que levam em consideração outras mutações conhecidas como rearranjos, mais especificamente, inversões, duplicações em tandem e duplicações por transposição. Alinhamento com inversões não tem um algoritmo polinomial conhecido e uma simplificação para o problema que considera somente inversões não sobrepostas foi proposta em 1992 por Schöniger e Waterman. Em 2003, dois trabalhos independentes propuseram algoritmos com tempo O(n^4) para alinhar duas seqüências com inversões não sobrepostas. Desenvolvemos dois algoritmos que resolvem este mesmo problema: um com tempo de execução O(n^3 logn) e outro que, sob algumas condições no sistema de pontuação, tem tempo de execução O(n^3), ambos em memória O(n^2). Em 1997, Benson propôs um modelo de alinhamento que reconhecesse as duplicações em tandem além das inserções, remoções e substituições. Ele propôs dois algoritmos exatos para alinhar duas seqüências com duplicações em tandem: um em tempo O(n^5) e memória O(n^2), e outro em tempo O(n^4) e memória O(n^3). Propomos um algoritmo para alinhar duas seqüências com duplicações em tandem em tempo O(n^3) e memória O(n^2). Propomos também um algoritmo para alinhar duas seqüências com transposons (um tipo mais geral que a duplicação em tandem), em tempo O(n^3) e memória O(n^2). / Sequence comparison done by alignment algorithms is one of the most fundamental tasks in bioinformatics. The evolutive mutations considered in these alignments are insertions, deletions and substitutions of nucleotides. This work treats of generalizations introduced in alignment algorithms in such a way that other mutations known as rearrangements are also considered, more specifically, we consider inversions, duplications in tandem and duplications by transpositions. Alignment with inversions does not have a known polynomial algorithm and a simplification to the problem that considers only non-overlapping inversions were proposed by Schöniger and Waterman in 1992. In 2003, two independent works proposed algorithms with O(n^4) time to align two sequences with non-overlapping inversions. We developed two algorithms to solve this problem: one in O(n^3 log n) time and other, considering some conditions in the scoring system, in O(n^3) time, both in O(n^2) memory. In 1997, Benson proposed a model of alignment that recognized tandem duplication, insertion, deletion and substitution. He proposed two exact algorithms to align two sequences with tandem duplication: one in O(n^5) time and O(n^2) memory, and other in O(n^4) time and O(n^3) memory. We propose one algorithm to align two sequences with tandem duplication in O(n^3) time and O(n^2) memory. We also propose one algorithm to align two sequences with transposons (a type of duplication more general than tandem duplication), in O(n^3) time and O(n^2) memory.
|
122 |
Estudo dos componentes de vulnerabilidade genética no transtorno do espectro autista / Study of the components of genetic vulnerability in autism spectrum disorderReis, Viviane Neri de Souza 29 May 2019 (has links)
O transtorno do espectro do autismo (TEA) é um transtorno do neurodesenvolvimento com apresentação clínica heterogênea. A nova classificação dimensional do DSM-5 permitiu a inclusão de toda a variabilidade fenotípica sob o mesmo guarda-chuva, criando a oportunidade de entender melhor os subgrupos de TEA de acordo com seus mecanismos fisiopatológicos heterogêneos. O objetivo deste estudo foi buscar componentes de vulnerabilidade a partir de fatores de risco (escolaridade materna, classe social, estresse e exposição tóxico ambiental durante a gestação, complicações na gravidez e história psiquiátrica familiar) e caracterizar subgrupos de TEA a partir destes componentes. Para evitar qualquer possível agrupamento baseado em parâmetros fenotípicos estabelecidos, como QI e gravidade, analisamos especificamente um grupo de pacientes homogêneos com TEA grave. A análise de componentes principais (PCA) foi realizada em dados de 68 crianças com TEA entre 3 e 7 anos de idade, e encontramos dois componentes principais: PC1, componente de vulnerabilidade genética e metabólica e PC2 componente de vulnerabilidade psicosocial. Com os escores do PCA, realizamos uma análise de clusters . Os resultados mostraram um cluster representando uma dimensão com maior vulnerabilidade genética, e outro com maior exposição a ambiente desfavorável e estressante durante a gestação. A análise de metiloma foi realizada para validar e explorar melhor a diferença entre os subgrupos. Encontramos 11.879 probes (p < 0.05) diferencialmente metiladas (DMPs). Os sítios CpG das DMPs estavam enriquecidos para regiões de metilação variáveis (VMRs). Sondas hipermetiladas apresentaram taxas mais altas nas características rVarBase associadas a SNPs funcionais, indicando maior risco de doença explicado por variações comuns (SNPs). A análise do módulo funcional dos promotores de genes encontrou diferenças relacionadas à resposta imune, processos metabólicos e estresse. A análise do relógio de metilação do DNA mostrou uma tendência de aumento do DNAm Age para ambos o clusters, mas sem diferença estatística. Por fim, a análise do exoma de 33 pacientes representantes dos dois clusters mostrou como esperado que ambos os subgrupos têm variantes raras deletérias, mas sem diferenças entre eles no número de variantes em genes intolerantes à variância de acordo com o escore RVIS. Nossos resultados mostram que estes grupos apresentam diferenças quanto aos componentes de vulnerabilidade uma relacionada com antecedentes genéticos hereditários comuns e, outra mais relacionada à resposta ambiental ao estresse. Este estudo corrobora que variações comuns e raras são importantes, mas influências ambientais devem ser consideradas para melhor encontrar subgrupos de TEA / Autism spectrum disorder (ASD) is a neurodevelopmental disorder with highly heterogeneous clinical presentation. The new dimensional DSM-5 classification allowed the inclusion of all phenotypic variability under the same umbrella, creating the opportunity to better understand ASD subgroups according to its heterogeneous pathophysiology mechanisms. The aim of this study was to search components of vulnerability from risk factors during gestation (mother schooling, social class, stress and environmental toxic exposition during gestation, pregnancy complications and familial psychiatric history) e characterize ASD subgroups from those components. To avoid any possible grouping based on phenotypic established parameters such as IQ and severity, we analysed a group of homogeneous patients with severe ASD specifically. Principal component analysis (PCA) was performed on data from 68 children with ASD between 3 and 7 years of age, and we found two principal components: PC1, component of genetic and metabolic vulnerability e PC2 component of unfavorable social environment vulnerability. With the PCA scores we performed clustering analysis. The results showed one cluster representing a dimension with stronger genetic vulnerability, and the other with more exposure to unfavorable and stressful environment during gestation. Methylome analysis has been performed to better explore subgroup difference. We found 11.879 (p < 0.05) differentially methylated probes (DMPs). CpG sites from those DMPs were found to be enriched in variable methylated regions (VMRs). The clusters have hypermethylated probes presented higher rates in different rVarBase regulatory regions associated to functional SNPs, indicating they may have different affected regulatory regions and more liability to disease explained by common variations (SNPs). Functional module analysis on gene promoters found differences related to immune response , metabolic processes and stress. DNA methylation clock analysis showed a tendency of higher DNAm Age for both Clusters, but here was no statistical DMAm Age acceleration difference. Lastly exome analysis of 33 patients representing both clusters showed as expected that both subgroups have deleterious rare variants, but without differences between them in the number of variants in genes intolerants to variance according to RVIS score. Our results show that this groups presents differences of vulnerability components, one related to common hereditary genetic antecedents, and another more related to the environmental response to stress. This study corroborates that common and rare variants are important, but environmental influences should be considered to better find subgroups of ASD
|
123 |
Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária / Analysis of different methods of high-throughput sequencing of genes involved in hypopituitarism and pituitary embryogenesisBenedetti, Anna Flavia Figueredo 18 April 2019 (has links)
Mutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a ela / Mutations in the genes involved in pituitary embryogenesis have been described related to isolated cases of multiple hormonal deficiency and/or associated with extra-pituitary phenotypes. Mutations found in humans were described in genes involved in pituitary embryogenesis by generating phenotypes knockout animals, serving as the starting point for their search in patients with similar phenotype. This strategy is known as gene candidate search and is performed by the traditional Sanger sequencing technique. In the last decade, with the advancement of new sequencing technologies, several genes have been associated with hypopituitarism, mainly using the exome methodology. However, there is still a large portion of this population without molecular diagnosis, as evidenced by a survey in the literature by Fang et al., This trend was also observed in the outpatient clinic of Developmental Endocrinology of Hospital das Clínicas, where only 14% of the patients had their molecular diagnosis. With this, high throughput sequencing technologies have become a promising tool for the molecular determination of patients\' phenotypes. Therefore, we sequenced the exome of some of our patients, and an analysis of the sequencing quality showed very low coverage regions, which harms the researcher\'s ability to reach a conclusion regarding presence or lack of variants in these regions. Among these regions are the SOX2 and SOX3 genes, which have many variants that are known to cause the phenotype. This work aims to analyze the coverage of the genes involved in pituitary embryogenesis as well as those related to congenital hypopituitarism in four different exome library preparation kits in order to identify the best methodology for a molecular diagnosis of the patients and to determine specific variants of the Brazilian population in the region of interest by searching the ABraOM website. A total of 76 genes were analyzed in a total of 119 samples in three groups: the first group of HapMap samples, the second of a patient with hypopituitarism and his mother, and the third group of random Brazilian samples. The kits used were NimbleGen (Roche), Nextera (Illumina), SureSelect and SureSelect + UTR (Agilent). For this, several bioinformatics programs were used, among them FASTQC, BWA, GATK, Annovar, Qualimap and bedTools. Sequencing quality analysis, as well as the mapping and duplication rate, showed that the samples used presented adequate and similar qualities for the comparison. According to the results obtained in relation to the coverage, the NimbleGen kit shows a drop in its coverage of the genes of interest in relation to its capacity to cover the global exome, something that may be due to the high GC rate in the region of interest, once the capacity of the kit in these regions is not as good as the others. The genes with the worst coverage in all four technologies were the HES5 gene, which despite being part of the pituitary embryology, have no phenotype-related variant in humans, and SOX3 which, despite having very low coverage in NimbleGen, is well covered on SureSelect. This corroborates the analysis of coverage capacity in regions with a high GC rate. In addition to this it was observed that the Brazilian population has 885 unique and exclusive variants. Therefore, we conclude that the Agilent\'s SureSelect kit has the best performance in the region of interest, as well as in the global exome, being recommended for studies in hypopituitarism cohorts, and that the Brazilian population has unique variants inherent to it
|
124 |
Árvores de Ukkonen: caracterização combinatória e aplicações / Ukkonen\'s tree: combinatorial characterization and applicationsSacomoto, Gustavo Akio Tominaga 08 February 2011 (has links)
A árvore de sufixos é uma estrutura dados, que representa em espaço linear todos os fatores de uma palavra, com diversos exemplos de aplicações práticas. Neste trabalho, definimos uma estrutura mais geral: a árvore de Ukkonen. Provamos para ela diversas propriedades combinatórias, dentre quais, a minimalidade em um sentido preciso. Acreditamos que a apresentação aqui oferecida, além de mais geral que as árvores de sufixo, tem a vantagem de oferecer uma descrição explícita da topologia da árvore, de seus vértices, arestas e rótulos, o que não vimos em nenhum outro trabalho. Como aplicações, apresentamos também a árvore esparsa de sufixos (que armazena apenas um subconjunto dos sufixos) e a árvore de k-fatores (que armazena apenas os segmentos de comprimento k, ao invés dos sufixos) definidas como casos particulares das árvores de Ukkonen. Propomos para as árvores esparsas um novo algoritmo de construção com tempo O(n) e espaço O(m), onde n é tamanho da palavra e m é número de sufixos. Para as árvores de k-fatores, propomos um novo algoritmo online com tempo e espaço O(n), onde n é o tamanho da palavra. / The suffix tree is a data structure that represents, in linear space, all factors of a given word, with several examples of practical applications. In this work, we define a more general structure: the Ukkonen\'s tree. We prove many properties for it, among them, its minimality in a precise sense. We believe that this presentation, besides being more general than the suffix trees, has the advantage of offering an explicit description of the tree topology, its vertices, edges and labels, which was not seen in any other work. As applications, we also presents the sparse suffix tree (which stores only a subset of the suffixes) and the k-factor tree (which stores only the substrings of length k, instead of the suffixes), both defined as Ukkonen\'s tree special cases. We propose a new construction algorithm for the sparse suffix trees with time O(n) and space O(m), where n is the size of the word and m is the number of suffixes. For the k-factor trees, we propose a new online algorithm with time and space O(n), where n is the size of the word.
|
125 |
Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter / Implementation of a plant-associated bacteria proteome database:ProBacterAlmeida, Fernanda Nascimento 26 March 2007 (has links)
Made available in DSpace on 2015-03-04T18:50:46Z (GMT). No. of bitstreams: 1
DissertacaoMestrado_FernandaNAlmeida.pdf: 2657877 bytes, checksum: df5f53867efd4a6e183687ebd25aa077 (MD5)
Previous issue date: 2007-03-26 / Coordenacao de Aperfeicoamento de Pessoal de Nivel Superior / This dissertation offers a computation approach to comparative analysis between cmpletely sequenced genomes of plant-associated bacteria. The created system was denominated ProBacter and it is composed of a relational database and computational tools for sequence analysis. The database was created from a diverse data source, including information from GenBank, TrEMBL, Interpro, COG and GO. The proteins were organized into clusters through the BBH
(Bidirectional Best Hits) methodology and categorized according to the functional classification of the Xanthomonas Genome Project. Each entry displayed by the system in a friendly user interface corresponds to an
information sheet with the gene and protein sequence, functional category, domain prediction, and related scientific publications, in addition to the group that
it belongs, and external links. The system offers a search interface similar to other database systems with pre-formatted queries. For advanced queries, the user has access to an interface that can be used without previous knowledge of the SQL language or ProBacter s database arquiteture. The BLASTP program and two multiple sequence alignment tools, namely ClustalW and T-Coffee, were integrated into the system as well, allowing internal and external sequence comparison. In addition, the system makes available visualization tools capable of displaying
the gene position inside a genome and BHH links of clusters. Also, the user is capable of adding new information for each gene in the system.
ProBacter s goal is to collect information available from a large source of databases into one computational environment, organize this information and offer comparative tools for sequence analysis. / Esta dissertação resultou na implementação de uma abordagem computacional para a análise comparativa entre informações de genomas completamente seqüenciados de bactérias associadas à planta. O sistema desenvolvido foi denominado de Probacter e é composto de um banco de dados relacional e de ferramentas computacionais para a análise de seqüências, teve por finalidade agrupar as informações disponíveis em vários bancos de dados em um único ambiente, oferecer uma padronização às informações disponibilizadas e fornecer ferramentas para análises comparativas e de seqüências. O banco de dados contém informações provenientes de diversas fontes, incluindo as bases GenBank, Swiss-Prot, TrEMBL, Interpro, COG e GO. As proteínas foram organizadas dentro de grupos, utilizando a metodologia de BBH (Bidirectional Best Hit) e a anotação padronizada de acordo com a classificação funcional anteriormente descrita para o Projeto Genoma de bactérias do gênero Xanthomonas. Cada entrada disponibilizada pelo sistema numa interface amigável corresponde a uma ficha contendo informações sobre o gene e a proteína por ele codificada, incluindo a categorização funcional, a predição de domínios, a seqüência de aminoácidos da proteína, a ligação com os grupos gerados pelo BBH, referências direta a outros bancos de dados, e as publicações científicas. O sistema oferece uma interface de busca comum a bancos de dados, utilizando consultas pré-definidas. Para consultas mais elaboradas, foi desenvolvida uma interface para ser utilizada sem que o usuário tenha conhecimento prévio de linguagens como SQL e/ou da arquitetura desta base. Ferramentas de alinhamento múltiplo ClustalW e T-Coffee e o programa BLASTP também foram integradas a este sistema, permitindo que sejam feitas comparações entre seqüências internas e externas ao banco. O ProBacter integra ferramentas de visualização gráfica, que permite disponibilizar o posicionamento dos genes pertencentes a grupos no genoma de cada organismo e que permite visualizar as ligações durante a formação dos grupos formados pelo BBH. Por fim, um campo aberto é disponibilizado para que seja possível a intervenção de usuários na anotação de novas informações em determinada entrada, sendo as informações novas oferecidas gravadas diretamente no banco de dados.
|
126 |
Desenvolvimento de metodologias para predição de estruturas de proteínas independente de moldes / Development of free-modeling methodologies for protein structure predictionRocha, Gregório Kappaun 17 September 2015 (has links)
Submitted by Maria Cristina (library@lncc.br) on 2015-10-13T18:53:31Z
No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5) / Approved for entry into archive by Maria Cristina (library@lncc.br) on 2015-10-13T18:53:44Z (GMT) No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5) / Made available in DSpace on 2015-10-13T18:53:59Z (GMT). No. of bitstreams: 1
Tese_Gregorio_LNCC_Set_2015_FINAL.pdf: 24967973 bytes, checksum: 0efd2d2481063521b74d53264c4be5bb (MD5)
Previous issue date: 2015-09-17 / Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio de Janeiro / The protein structure prediciton problem (PSP) consists of discovering the native three-dimensional arrangement of a protein molecule using the information stored in its amino acid sequence. Unveiling the 3D structure of a protein is a way to obtain crucial information about its functions, given that the function of a protein is intrinsically related to its native three-dimensional structure. The experimental determination of the protein structure presents some technical difficulties and is also costly in workload and time. Thus, the investment in computational methods for PSP becomes imminent. This thesis has as main objective to increase the predictive ability of the GAPF protein structure prediction program and contribute to the advancement of theories and methodologies in the free-modeling prediction area. Efforts are directed on two fronts: (i) Improve the modeling of the energy function by the development and Implementing new potential for modeling the problem. (ii) To Increase the conformational search through the development and implementation of a multi-objective genetic algorithm. For the modeling of the problem, they were inserted in the function cost new ad hoc potentials that deal with hydrophobic compactation and with hydrogen bonds, key components in protein folding. For conformational search, a multiobjective steady-state genetic algorithm with phenotypic crowding was proposed. The new methodology was evaluated in a test set of 46 proteins, of all classes, and compared to consolidated methods in the literature, such as quark. The contributions of this thesis provided a major advance in the GAPF's predictive power, increasing the quality of the models and allowing investments in longer sequences. Advances have been notable in beta-sheets predictions, mainly due to the inclusion of hydrogen bonding potentials. Were made available also interesting tools for the future development of the program and GAPF was put as a good candidate for free-modeling predictions against prominent methodologies in the area. / O problema da predição de estrutura de proteínas (PSP) consiste em desvendar o arranjo tridimensional da molécula a partir de sua sequência de aminoácidos. Conhecer a estrutura das proteínas constituintes de um sistema biológico é uma forma de se obter informações cruciais sobre o seu funcionamento, haja vista que a função de uma proteína está intrinsecamente relacionada à sua estrutura nativa tridimensional. A determinação experimental da estrutura de uma proteína além de apresentar dificuldades técnicas, é também dispendiosa em volume de trabalho e de tempo. Sendo assim, o investimento em métodos computacionais para PSP torna-se eminente. Essa tese tem como objetivo geral aumentar a capacidade preditiva do programa de predição de estrutura de proteínas GAPF e contribuir para o avanço das teorias e metodologias na área da predição independente de moldes (free-modeling). Os esforços são direcionados em duas frentes: (i) Melhorar a modelagem da função de energia, através do desenvolvimento e implementação de novos potenciais para a modelagem do problema. (ii) Incrementar a busca conformacional, através do desenvolvimento e implementação de um algoritmo genético multiobjetivo. Para a modelagem do problema, foram inseridos na função custo novos potenciais ad hoc que tratam da compactação hidrofóbica e das ligações de hidrogênio, componentes fundamentais no enovelamento protéico. Para a busca na superfície de energia, um algoritmo genético não-geracional multiobjetivo com crowding fenotípico foi proposto. A nova metodologia foi avaliada em um conjunto teste com 46 proteínas, de todas as classes, e comparada com métodos consolidados na literatura como o QUARK. As contribuições desta tese proporcionaram um grande avanço no poder preditivo do programa GAPF, aumentando a qualidade dos modelos e permitindo investir em sequências maiores. Avanços foram notáveis na predição de folhas-beta, principalmente fruto dos potenciais de ligação de hidrogênio inseridos. Disponibilizou-se, ainda, ferramentas interessantes para o desenvolvimento futuro do programa e colocou o GAPF como um bom candidato para predições independentes de molde frente metodologias de destaque na área.
|
127 |
Alterações transcriptômicas no hipocampo de ratos submetidos a um modelo experimental de epilepsia com insulto precipitante febril / Transcriptome alterations in the hippocampus of rats subjected to experimental febrile seizuresAzevedo, Hátylas Felype Zaneti de 02 March 2017 (has links)
Convulsões febris complexas durante a infância representam um fator de risco importante para o desenvolvimento da epilepsia. Porém, pouco se sabe sobre as alterações moleculares induzidas por crises febris que tornam o cérebro susceptível à atividade epiléptica. Nesse contexto, modelos experimentais de convulsões induzidas por hipertermia (CH) permitem a análise temporal das alterações moleculares no cérebro após CH. Neste projeto, foram investigadas alterações temporais em redes de co-expressão gênica hipocampais durante o desenvolvimento de ratos Wistar submetidos a CH. Amostras de RNA foram obtidas da região CA3 ventral do hipocampo em quatro intervalos de tempo após as CH induzidas no décimo primeiro dia pós-natal (P11). Essas amostras foram utilizadas para a análise da expressão gênica global por meio de técnicas de microarranjos de DNA. Os pontos temporais foram selecionados para investigar as fases aguda (P12), latentes (P30 e P60) e crônica (P120) do modelo experimental. Os dados de expressão gênica foram analisados a partir da construção de redes de co-expressão gênica para investigar módulos de genes co-expressos, dado que esses módulos podem conter genes com funções semelhantes. A análise transcriptômica consistiu na construção de redes de co-expressão gênica, identificação de módulos, análises de correlação entre módulos e grupos experimentais, e avaliação de mudanças de conectividade entre módulos dos grupos experimentais e controles. Os módulos relevantes foram enriquecidos funcionalmente para identificar funções biológicas associadas às CH. Os resultados mostraram que as CH induzem alterações em vias de sinalização envolvidas em processos imunológicos e de desenvolvimento, tais como Wnt, Hippo, Notch, JAK-STAT e MAPK. Módulos associados à diferenciação neuronal e transmissão sináptica foram identificados em todos os intervalos temporais analisados. Estes resultados sugerem que alterações transcricionais desencadeadas por CH podem levar à neurogênese hipocampal, ao remodelamento tecidual e à inflamação crônica, tornando o cérebro susceptível à atividade epiléptica crônica / Complex febrile seizures during infancy constitute an important risk factor for epilepsy development. However, little is known about the alterations induced by febrile seizures that could turn the brain susceptible to epileptic activity. In this context, experimental models of hyperthermic seizures (HS) may allow the temporal analysis of brain molecular changes after HS. Here, we investigated temporal changes in hippocampal gene co-expression networks during the development of rats subjected to HS. Total RNA samples were obtained from the ventral hippocampal CA3 region at four time points after HS at postnatal day 11 (P11) and later used for gene expression profiling. The temporal endpoints were selected to investigate the acute (P12), latent (P30 and P60) and chronic (P120) stages of the HS model. A weighted gene co-expression network analysis was employed to investigate modules of co-expressed genes, as these modules may contain genes with similar biological functions. The transcriptome analysis pipeline consisted in building gene co-expression networks, identifying network modules and hubs, performing gene-trait correlations and examining module connectivity changes. Modules were functionally enriched to identify functions associated to HS. Our data showed that HS induce alterations in developmental and immune pathways, like Wnt, Hippo, Notch, JAK-STAT and MAPK. Interestingly, modules involved in cell adhesion, neuronal differentiation, axonogenesis and synaptic transmission were activated as early as one day after HS. These results suggest that HS trigger transcriptional alterations that may lead to persistent neurogenesis, tissue remodeling and chronic inflammation in the CA3 hippocampus, turning the brain prone to epileptic activity
|
128 |
Alterações transcriptômicas no hipocampo de ratos submetidos a um modelo experimental de epilepsia com insulto precipitante febril / Transcriptome alterations in the hippocampus of rats subjected to experimental febrile seizuresHátylas Felype Zaneti de Azevedo 02 March 2017 (has links)
Convulsões febris complexas durante a infância representam um fator de risco importante para o desenvolvimento da epilepsia. Porém, pouco se sabe sobre as alterações moleculares induzidas por crises febris que tornam o cérebro susceptível à atividade epiléptica. Nesse contexto, modelos experimentais de convulsões induzidas por hipertermia (CH) permitem a análise temporal das alterações moleculares no cérebro após CH. Neste projeto, foram investigadas alterações temporais em redes de co-expressão gênica hipocampais durante o desenvolvimento de ratos Wistar submetidos a CH. Amostras de RNA foram obtidas da região CA3 ventral do hipocampo em quatro intervalos de tempo após as CH induzidas no décimo primeiro dia pós-natal (P11). Essas amostras foram utilizadas para a análise da expressão gênica global por meio de técnicas de microarranjos de DNA. Os pontos temporais foram selecionados para investigar as fases aguda (P12), latentes (P30 e P60) e crônica (P120) do modelo experimental. Os dados de expressão gênica foram analisados a partir da construção de redes de co-expressão gênica para investigar módulos de genes co-expressos, dado que esses módulos podem conter genes com funções semelhantes. A análise transcriptômica consistiu na construção de redes de co-expressão gênica, identificação de módulos, análises de correlação entre módulos e grupos experimentais, e avaliação de mudanças de conectividade entre módulos dos grupos experimentais e controles. Os módulos relevantes foram enriquecidos funcionalmente para identificar funções biológicas associadas às CH. Os resultados mostraram que as CH induzem alterações em vias de sinalização envolvidas em processos imunológicos e de desenvolvimento, tais como Wnt, Hippo, Notch, JAK-STAT e MAPK. Módulos associados à diferenciação neuronal e transmissão sináptica foram identificados em todos os intervalos temporais analisados. Estes resultados sugerem que alterações transcricionais desencadeadas por CH podem levar à neurogênese hipocampal, ao remodelamento tecidual e à inflamação crônica, tornando o cérebro susceptível à atividade epiléptica crônica / Complex febrile seizures during infancy constitute an important risk factor for epilepsy development. However, little is known about the alterations induced by febrile seizures that could turn the brain susceptible to epileptic activity. In this context, experimental models of hyperthermic seizures (HS) may allow the temporal analysis of brain molecular changes after HS. Here, we investigated temporal changes in hippocampal gene co-expression networks during the development of rats subjected to HS. Total RNA samples were obtained from the ventral hippocampal CA3 region at four time points after HS at postnatal day 11 (P11) and later used for gene expression profiling. The temporal endpoints were selected to investigate the acute (P12), latent (P30 and P60) and chronic (P120) stages of the HS model. A weighted gene co-expression network analysis was employed to investigate modules of co-expressed genes, as these modules may contain genes with similar biological functions. The transcriptome analysis pipeline consisted in building gene co-expression networks, identifying network modules and hubs, performing gene-trait correlations and examining module connectivity changes. Modules were functionally enriched to identify functions associated to HS. Our data showed that HS induce alterations in developmental and immune pathways, like Wnt, Hippo, Notch, JAK-STAT and MAPK. Interestingly, modules involved in cell adhesion, neuronal differentiation, axonogenesis and synaptic transmission were activated as early as one day after HS. These results suggest that HS trigger transcriptional alterations that may lead to persistent neurogenesis, tissue remodeling and chronic inflammation in the CA3 hippocampus, turning the brain prone to epileptic activity
|
129 |
Estudi bioinformàtic de la funcionalitat i conservació de l’splicing alternatiuMorata Chirivella, Jordi 28 June 2012 (has links)
L'estudi de les diferències fenotípiques entre espècies, i entre individus, ha estat una de les grans qüestions fonamentals en els camps de la biologia evolutiva i la genètica. Ben aviat, es va fer palès que la regulació de l’expressió gènica tindria un paper clau en establir aquestes diferències de complexitat. L’adveniment de les tècniques massives de seqüenciació no van sinó confirmar aquesta visió primerenca. Avui dia coneixem un grapat de mecanismes que determinen aquestes diferències entre organismes, com són la divergència de seqüència proteica, la duplicació gènica o la divergència de la regió cis-reguladora, entre d’altres.
En la darrera dècada, l’splicing alternatiu ha anat afermant-se com a mecanisme post-transcripcional freqüent i ha anat prenent protagonisme com a font de variabilitat de transcrits i isoformes proteiques, a més a més de jugar un paper regulador de l’expressió gènica. Per tant, l’splicing alternatiu és un ferm candidat a introduir diferències substancials al proteoma que expliquin la diversitat fenotípica entre organismes.
Així doncs, aquest treball es va marcar com a objectiu aclarir fins a quin punt la variabilitat que introduïa l’splicing alternatiu tenia implicacions en el fenotip, quina era la seva conservació i si actuava de manera coordinada o independent amb d’altres mecanismes. En primer lloc, vam estudiar la relació que hi havia entre l’splicing alternatiu i les altres fonts moleculars de diversitat fenotípica i si era possible que l’splicing alternatiu pogués introduir variabilitat amb implicacions fenotípiques per si sola. A continuació, ens vam centrar en els mecanismes reguladors de l’expressió gènica basats en splicing alternatiu, analitzant les seves propietats i la seva conservació entre espècies. Finalment, vam examinar la implicació de l’splicing alternatiu en el fenomen de la domin{ncia gènica, ja que és un procés conegut que determina diferències fenotípiques intraespecífiques.
El primer pas fou, doncs, comparar l’splicing alternatiu amb d’altres fonts moleculars de diferències fenotípiques: les divergències de la seqüència proteica, de la regió cis-reguladora del gen i de l’expressió gènica entre hum{ i ratolí. En un estudi massiu de les propietats de tots aquests fenòmens entre 13970 parelles d’ortòlegs, vam observar que l’splicing alternatiu podia introduir diferències abans que les altres variables poguessin fer-ho. Quan les identitats de seqüència proteica o de la regió cis-reguladora eren massa elevades com per introduir diferències, l’splicing alternatiu ja presentava patrons prou diferents en la concurrència d’splicing entre hum{ i ratolí. A més a més, la relació entre l’equivalència d’isoformes amb aquestes divergències també va resultar ser molt lleu, fet que ens va fer pensar que l’splicing alternatiu pot introduir isoformes específiques que contribueixin a les diferències entre espècies abans que les altres divergències puguin fer-ho.
Pel que fa al segon bloc, vam investigar la conservació i propietats dels mecanismes reguladors de l’expressió gènica basats en AS. Primer de tot, vam confirmar la independència entre les divergències d’expressió gènica i l’splicing alternatiu, fet que ens indica que actuen a diferents nivells. A continuació, vam definir i classificar aquests mecanismes reguladors depenent com l’splicing alternatiu alterava l’arquitectura de dominis de les isoformes. La conservació d’aquests efectes, dels mecanismes reguladors basats en AS, va resultar ser baixa per tots els casos. Pel que fa als esdeveniments on es perdien un o més dominis a les isoformes alternatives, a més a més de ser baixa la conservació del mecanisme, també ho va ser l’equivalència dels esdeveniments d’splicing alternatiu. Així, tot i tenir efectes a nivell de seqüència no homòlegs, la funció es conservava, fet que ens porta a suggerir que aquests esdeveniments d’AS són un exemple de convergència funcional.
Per últim, ens vam fixar en el procés de la dominància, abastament conegut, que introdueix diferències fenotípiques clares entre individus de la mateixa espècie, sobretot en el cas de malalties. Donat el fet que es coneixia una relació inversa entre paralogia i haploinsuficiència, per una banda, i paralogia i splicing per l’altra, sumat a la capacitat d’introduir variabilitat per part de l’splicing alternatiu, vam endegar aquest estudi amb la idea de descriure la relació entre dominància i splicing. El resultat final ens va mostrar una independència dels dos processos, fet que ens va fer qüestionar la relació entre paralogia i splicing alternatiu. Per la resta de variables estudiades, la caracterització de la dominància va concordar amb els resultats de treballs anteriors. / RESUMEN
El estudio de las diferencias fenotípicas entre especies ha sido una de les cuestiones fundamentales de la biología evolutiva y la genética. Muy pronto fue evidente que la regulación de la expresión génica seria clava en el establecimiento de estas diferencias, tesis confirmada con las técnicas masivas de secuenciación actuales. Hoy en día, se conocen una serie de mecanismos que determinan estas diferencias, como son la divergencia de la secuencia proteica, la duplicación génica o la divergencia de la región cis-reguladora.
En la última década, el splicing alternativo (AS) ha ido afianzándose como mecanismo post-transcripcional y ha ido tomando protagonismo como fuente de variabilidad de transcritos y isoformas, además de jugar un papel regulador de la expresión génica. Por lo tanto, el AS es un firme candidato a introducir diferencias sustanciales en el proteoma que expliquen la diversidad fenotípica entre organismos. Así pues, este trabajo se marcó como objetivo aclarar hasta qué punto la variabilidad que introducía el AS tenía implicaciones en el fenotipo, cuál era su conservación y si actuaba de manera coordinada o independiente con otros mecanismos. En primer lugar, estudiamos la relación que había entre el AS y las otras fuentes moleculares de diversidad fenotípica y si era posible que el AS pudiera introducir variabilidad con implicaciones fenotípicas por sí sola. A continuación, nos centramos en los mecanismos reguladores de la expresión génica basados en AS, analizando sus propiedades y su conservación entre especies. Finalmente, examinamos la implicación del AS en la dominancia génica.
En el primer bloque comparamos el AS con otras fuentes moleculares de diferencias fenotípicas: las divergencias de la secuencia proteica, de la región cis-reguladora del gen y de la expresión génica entre humano y ratón. En un estudio masivo de las propiedades de todos estos fenómenos entre 13.970 ortólogos, observamos que el AS podía introducir diferencias antes que las otras variables pudieran hacerlo. Cuando las identidades de secuencia proteica o de la región cis-reguladora eran demasiado elevadas como para introducir diferencias, el AS ya presentaba patrones bastante diferentes en la concurrencia de AS entre humano y ratón. Además, la relación entre la equivalencia de isoformas con estas divergencias también resultó ser muy leve, lo que nos hizo pensar que el AS puede introducir isoformas específicas que contribuyan a las diferencias entre especies antes que las demás divergencias puedan hacerlo.
En el segundo bloque investigamos la conservación y propiedades de los mecanismos reguladores de la expresión génica basados en AS. En primer lugar, confirmamos la independencia entre las divergencias de expresión génica y del AS, lo que nos indica que actúan a diferentes niveles. A continuación, definimos estos mecanismos reguladores dependiendo como el AS alteraba la arquitectura de dominios de las isoformas. La conservación de los mecanismos reguladores basados en AS resultó ser baja en todos los casos. En cuanto a los eventos donde se perdían uno o más dominios en las isoformas alternativas, también fue baja la equivalencia de los eventos de AS. Así, pese a tener efectos a nivel de secuencia no homólogos, la función se conservaba, lo que nos permite sugerir que éste es un escenario de convergencia funcional.
Por último, nos fijamos en el proceso de la dominancia, largamente conocido, que introduce diferencias fenotípicas intraespecíficas. Dado que se conocía una relación inversa entre paralogía y haploinsuficiencia, por un lado, y paralogía y AS por la otra, sumado a la capacidad de introducir variabilidad por parte del AS, iniciamos este estudio con la idea de describir la relación entre dominancia y AS. El estudio nos mostró una independencia de los dos procesos, cuestionando así la relación entre paralogía y AS. Para el resto de variables estudiadas, la caracterización de la dominancia concordó con resultados de trabajos anteriores. / The study of phenotypic differences between species, and between individuals, has been one of the great fundamental questions in the fields of evolutionary biology and genetics. Soon, it became clear that the regulation of gene expression would have a key role in establishing these differences in complexity. The advent of mass sequencing techniques did confirm this view. Nowadays, we know a handful of mechanisms that determine these differences between organisms, such as protein sequence divergence, gene duplication and divergence of cis-regulatory region, among others.
In the last decade, alternative splicing has been asserting itself as a post-transcriptional mechanism and frequently has taken center stage as a source of variability of transcripts and protein isoforms, and also as a key player in the regulation the gene expression. Therefore, alternative splicing is a strong candidate to introduce substantial differences in the proteome that could explain the phenotypic diversity among organisms.
Thus, this work was intended to clarify to what extent the variability introduced the alternative splicing (AS) had implications for the phenotype, which was its conservation and if it acted in a coordinated or independent way relative to other mechanisms. First, we studied the relationship that existed between AS and other sources of molecular and phenotypic diversity and elucidate if AS could introduce phenotypic variability with its own implications. Then we focused on the regulatory mechanisms of gene expression based on AS, analyzing their properties and their conservation between species. Finally, we examined the involvement of AS in the phenomenon of genetic dominance, since it is a known process that determines intraspecific phenotypic differences.
The first step was therefore to compare the AS with other sources of molecular phenotypic differences: differences in the protein sequence, the cis-regulatory region of the gene and gene expression between human and mouse. In a massive study of the properties of these phenomena among 13,970 pairs of orthologous, we observed that alternative splicing could introduce differences before other variables could do it. When the identities of protein sequence or cis-regulatory region were too high for introducing differences, AS patterns appeared quite different in the occurrence of splicing between human and mouse. Furthermore, we found that the relationship between the equivalence of isoforms with those differences was very mild, which made us think that AS can introduce specific isoforms that contribute to differences between species before other divergences can do it.
Regarding the second section, we investigated the properties and the conservation of the regulatory mechanisms of gene expression based on AS. First, we confirmed the independence between the divergence of gene expression and AS, which indicates that they act at different levels. Then we defined and classified these regulatory mechanisms depending on how the AS altered the domain architecture of the isoforms. The conservation of these effects, the regulatory mechanisms based on AS, was found to be low for all cases. With regard to the events where they lost one or more domains in the alternative isoforms, in addition to the low conservation of the mechanism, it was also low the equivalence of alternative splicing events. So, despite having an non-homologue effect on the level of sequence, the function was preserved, which leads us to suggest that these AS events are an example of functional convergence.
Finally, we studied the well known process of dominance which introduces clear phenotypic differences between individuals of the same species, especially in the case of diseases. Given the fact that it is known the inverse relationship between paralogy and haploinsufficiency and, in the other hand, the inverse relationship between paralogy and AS, adding to this the ability of introducing variability by AS, we undertook this study with the idea of describe the relationship between dominance and splicing. The final result showed us that they are two independent processes, which made us question the relationship between paralogy and AS. For the remaining variables, the characterization of the dominance results agreed with previous work.
|
130 |
SeqRibbonHIV – Sistema integrado de acompanhamento epidemiológico, clínico, laboratorial e terapêutico de pacientes portadores do HIV/AIDS / SeqRibbonHIV – System Integrated Monitoring Epidemiological clinical, laboratory and therapeutic for patients with HIV/AIDSRodrigues, Marcelo Pontes January 2010 (has links)
Submitted by Alessandra Portugal (alessandradf@ioc.fiocruz.br) on 2013-09-24T18:27:46Z
No. of bitstreams: 1
Marcelo Pontes Rodrigues_Dissertação.pdf: 4635613 bytes, checksum: 9ca9b8ed781e241056c8bb8667e2ea9d (MD5) / Made available in DSpace on 2013-09-24T18:27:46Z (GMT). No. of bitstreams: 1
Marcelo Pontes Rodrigues_Dissertação.pdf: 4635613 bytes, checksum: 9ca9b8ed781e241056c8bb8667e2ea9d (MD5)
Previous issue date: 2010 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Vice Direção de Ensino, Informação e Comunicação. Rio de Janeiro, RJ, Brasil. / Atualmente, a pesquisa da resistência do vírus da imunodeficiência humana aos
antirretrovirais tem grande importância na eficácia do tratamento dos pacientes portadores do
vírus. No entanto, os sistemas/ferramentas de informática e bioinformática existentes para o
acompanhamento de portadores do HIV-1 não contemplam, de maneira integrada,
informações sobre os perfis mutacionais de resistência do vírus, incorporando dados
epidemiológicos, clínicos, laboratoriais e terapêuticos, que fornecem maiores subsídios para o
sucesso da terapia antirretroviral na supressão do HIV-1. Este trabalho apresenta uma
proposta de sistema informatizado, que alia a funcionalidade de um programa de
monitoramento de indivíduos soropositivos, desde o diagnóstico até a terapia antirretroviral.
Neste sentido, o trabalho descreve o processo de desenvolvimento de um software, aliado a
um banco de dados para armazenamento das informações relacionadas ao acompanhamento
dos pacientes, que permite agilidade na gestão de informações integradas para os profissionais
de saúde. O monitoramento do tratamento, incluindo combinações de antirretrovirais,
genotipagem do HIV-1 e sensibilidade às drogas, serão integradas com informações clínicolaboratoriais,
permitindo a avaliação da eficácia do tratamento e melhoria da terapia recebida.
Informações relacionadas a esquemas imunoprofiláticos e preventivos de doenças
oportunistas também serão disponibilizadas. O sistema proposto prevê a utilização de
interface Web, Sistema Gerenciador de Workflows Científicos, banco de dados e serviços
Web, de modo a oferecer flexibilidade, gerência e interoperabilidade.
Tendo como base a necessidade de uma maior agilidade na gerência dos processos,
relacionados ao acompanhamento do paciente com HIV/AIDS, idealizamos uma estrutura
informatizada que irá auxiliar profissionais de saúde e os pesquisadores na tomada de
decisões/intervenções, relacionadas à assistência e tratamento. Desta forma, este sistema
possibilitará uma diminuição de gastos com exames e antirretrovirais, assim como, uma
melhoria na qualidade de vida dos portadores do HIV/AIDS. Esta ferramenta está sendo
implementada para o acompanhamento de soropositivos pelo Instituto de Biologia do
Exército. / Currently, the research of the resistance to human immunodeficiency virus (HIV)
antiretroviral (ARV) has great importance in the efficacy of treatment of patients with HIV.
However, the systems/information technology and bioinformatics tools that exist for
monitoring the HIV-1 do not include, in an integrated way, information on the mutational
profiles of virus resistance to information incorporating epidemiological, clinical, laboratory
and treatment which give higher subsidies to the success of ARV therapy (TART) in
suppressing HIV-1. This work presents a proposal for a computerized system that combines
the functionality of a monitoring program for seropositive individuals, from diagnosis to
TARV. In this sense, the paper describes the process of software development combined with
a database for storing information related to the monitoring of patients in order to allow
flexibility in the management of integrated information for health professionals. The
monitoring of treatment, including combinations of ARVs, HIV-1 genotyping and drug
sensitivity will be integrated with clinical and laboratory information, allowing the evaluation
of the effectiveness and improving the therapy received. Related information and preventive
regimens Immunoprophylactic opportunistic infections will also be available. The proposed
scheme includes the use of Web interface, Scientific Workflow Management System
(SGWfC), database and Web services, to offer flexibility, management and interoperability.
Based on the need for greater agility in the management of processes related to monitoring of
patients with HIV/AIDS, we designed a computer structure that will assist health
professionals and researchers in making decisions/interventions related to care and treatment.
This will also enable a reduction in costs of tests and ARV and a better quality of life of HIV/
AIDS. This tool is being implemented for the monitoring of positives by the Instituto de
Biologia do Exército (IBEx).
|
Page generated in 1.4488 seconds