• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
531

Identificação de cascatas gênicas com base na modulação transcricional de células sanguíneas mononucleares periféricas de pacientes com diabetes mellitus do tipo 1 / Identification of gene cascades based on the transcriptional modulation of peripheral blood mononuclear cells from type 1 diabetes mellitus patients.

Thais Cristine Arns 15 March 2013 (has links)
O diabetes mellitus do tipo 1 (DM1) é uma doença autoimune crônica, durante a qual as células beta pancreáticas, responsáveis pela secreção de insulina, são seletivamente destruídas. O desenvolvimento desta doença é uma consequência da predisposição genética combinada a fatores ambientais largamente desconhecidos e eventos estocásticos. Neste trabalho foi proposta a comparação da expressão gênica transcricional em grande escala (transcriptoma) entre amostras de pacientes de DM1 e controles, obtidas a partir de células mononucleares do sangue periférico (PBMCs). As alterações resultantes na expressão gênica causada pela doença podem ser amostradas em PBMCs, uma vez que as células imunes efetoras estão presumivelmente em equilíbrio com a população celular circulante. A fim de identificar alterações na expressão gênica, foram utilizados métodos analíticos como a tecnologia de microarrays e o cálculo do coeficiente de correlação de Pearson, sendo possível observar aumento ou diminuição na expressão gênica e também a magnitude desta mudança. Além disso, foi realizada análise de grupos gênicos (gene sets ou GSA), método baseado na significância de conjuntos gênicos pré-definidos, ao invés de genes individuais. Este procedimento é mais adequado para análise de uma doença poligênica, tal como o DM1. A análise de GSA possibilitou a seleção de genes envolvidos, por exemplo, nas seguintes vias: cascata de I-kappaB kinase/NF-kappaB, regulação da via de sinalização do receptor de TGF-ß, regulação da cascata de JAK-STAT e via de sinalização mediada por citocinas e quimiocinas, das quais podem ser identificados marcadores transcricionais. A análise imparcial do transcriptoma de PBMCs permitiu a identificação de gene sets e genes associados ao DM1, seu perfil de expressão preferencial em tipos celulares do sistema imune e seus padrões de modulação. / Type 1 diabetes mellitus (T1DM) is a chronic autoimmune disease, in which the pancreatic beta cells responsible for secretion of insulin are selectively destroyed. The development of this disease is a result of genetic predisposition combined with largely unknown environmental factors and stochastic events. In this work it was proposed to compare the large scale transcriptional gene expression (transcriptome) between samples obtained from T1DM patients and healthy controls, obtained from peripheral blood mononuclear cells (PBMCs). The resulting changes in gene expression caused by the disease can be sampled in PBMCs, as immune effector cells are presumably in equilibrium with the circulating cell population. In order to identify changes in gene expression, we used analytical methods such as microarray technology and calculating the Pearson correlation coefficient, where it was possible to observe increases or decreases in gene expression and also the magnitude of change. Furthermore, we performed a gene set analysis (GSA) method based on the significance of predefined gene sets instead of individual genes. This procedure is more suitable for analyzing a polygenic disease such as T1DM. GSA analysis enabled the selection of genes involved for example, in the following pathways: I-kappaB kinase/NF-kappaB cascade, regulation of TGF-ß receptor signaling pathway, regulation of JAK-STAT cascade and cytokine and chemokine mediated signaling pathway, from which transcriptional markers can be identified. An unbiased transcriptome analysis of PBMCs allowed the identification of gene sets and genes associated with T1DM, its preferential expression profile in cell types of the immune system and its modulation patterns.
532

Uma abordagem baseada em ontologias e conectores para a integração semântica de ferramentas de análise de expressão gênica / An Approach Based on Ontologies and Connectors for Semantic Integration of Gene Expression Analysis Tools

Flavia Akemi Miyazaki 15 December 2011 (has links)
As pesquisas em biologia molecular têm produzido uma grande quantidade de dados, os quais embutem informações sobre diferentes fenômenos biológicos. Neste sentido, a bioinformática se destaca como uma área de pesquisa multidisciplinar que visa, principalmente, o desenvolvimento de ferramentas (sistemas) computacionais para auxiliar na descoberta de conhecimento a partir de dados biológicos. Dentro da bioinformática, a área de genômica funcional procura estudar as funções gênicas através da medição simultânea e em larga escala dos níveis de expressão gênica de um genoma. Diferentes ferramentas são utilizadas no processo de análise de expressão gênica, cada qual provê suporte a uma atividade de análise específica. Embora alguns ambientes de descoberta de conhecimento ofereçam suporte integrado a este processo de análise e exploração de dados, a maior parte das ferramentas de análise é desenvolvida independentemente de outras ferramentas e ambientes de descoberta de conhecimento. Este cenário representa um desafio para biologistas que precisam combinar e integrar diferentes ferramentas, muitas vezes de forma ad hoc, custosa e sujeita a erros. Modelos conceituais, tais como ontologias, têm contribuído para o sucesso do desenvolvimento de sistemas computacionais em diferentes domínios de aplicação. O desenvolvimento de tais modelos tem por objetivo representar corretamente, em alto nível de abstração, conceitos e situações pertinentes a um dado domínio de interesse. Esta representação abstrata facilita não apenas o entendimento de um dado domínio, mas também serve como base para o processo de desenvolvimento do sistema como um todo. O objetivo deste trabalho é investigar o desenvolvimento e o uso de modelos conceituais em geral e ontologias em particular, na integração de ferramentas na área de análise de expressão gênica. De forma específica, este trabalho tem por objetivo propor uma abordagem para a integração semântica de ferramentas de análise de expressão gênica a partir do uso de conectores e de uma ontologia de domínio. Essa abordagem foi aplicada no desenvolvimento de estudos de caso envolvendo a criação de diferentes ambientes integrados para a análise de expressão gênica e mostrou-se eficaz. / Molecular biology researches are increasingly producing large amounts of data regarding underlying biological phenomena. Bioinformatics is a multidisciplinary research field whose main objective is the development of theories and information systems to help the process of knowledge discovery from biological data. Functional genomics is a field of study bioinformatics concerned with the study of gene function through parallel and large scale expression measurements of a genome. A variety of software tools are usually combined and used in a knowledge discovery process, each providing support for a specific data analysis task. Although some tools are already provided as part of an integrated knowledge discovery environment, most of them are developed independently of other software tools and knowledge discovery environments. This scenario poses a problem and a challenge for biologists that need to combine and integrate different tools in an ad hoc, time consuming and error prone process. Conceptual models, such as ontologies, have contributed to the successful development of information systems in different application domains. The development of such models aims at creating a clear and precise description of the elements of a given domain at a high abstraction level. This abstract and high level description not only promotes a shared understanding of the domain, but also serves as basis for the development process of supporting applications in the domain. This work aims at investigating the development and use of conceptual models in general and ontologies in particular to support the integration of gene expression data analysis systems. Specifically, this work proposes an approach for the semantic integration of gene expression analysis tools using connectors and a domain ontology. This approach was applied in the development of a number of case studies aiming at creating integrated environments for gene expression analysis and proved its effectiveness.
533

Filtragem robusta de SNPs utilizando redes neurais em DNA genômico completo

Silva, Bruno Zonovelli da 25 June 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-02-24T15:10:56Z No. of bitstreams: 1 brunozonovellidasilva.pdf: 11306730 bytes, checksum: d7a7b13a1620f32d885d6b1e8852ae2b (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-02-24T15:40:35Z (GMT) No. of bitstreams: 1 brunozonovellidasilva.pdf: 11306730 bytes, checksum: d7a7b13a1620f32d885d6b1e8852ae2b (MD5) / Made available in DSpace on 2017-02-24T15:40:35Z (GMT). No. of bitstreams: 1 brunozonovellidasilva.pdf: 11306730 bytes, checksum: d7a7b13a1620f32d885d6b1e8852ae2b (MD5) Previous issue date: 2013-06-25 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Com o crescente avanço das plataformas de sequenciamento genômico, surge a necessidade de modelos computacionais capazes de analisar, de forma eficaz, o grande volume de dados disponibilizados. Uma das muitas complexidades, variações e particularidades de um genoma são os polimorfismos de base única (single nucleotide polymorphisms - SNPs), que podem ser encontrados no genoma de indivíduos isoladamente ou em grupos de indivíduos de alguma população, sendo originados a partir de inserções, remoções ou substituições de bases. Alterações de um único nucleotídeo, como no caso de SNPs, podem modificar a produção de uma determinada proteína. O conjunto de tais alterações tende a provocar variações nas características dos indivíduos da espécie, que podem gerar alterações funcionais ou fenotípicas, que, por sua vez, implicam, geralmente, em consequências evolutivas nos indivíduos em que os SNPs se manifestam. Entre os vários desafios em bioinformática, encontram-se a descoberta e filtragem de SNPs em DNA genômico, etapas de relevância no pós-processamento da montagem de um genoma. Este trabalho propõe e desenvolve um método computacional capaz de filtrar SNPs em DNA genômico completo, utilizando genomas remontados a partir de sequências oriundas de plataformas de nova geração. O modelo computacional desenvolvido baseia-se em técnicas de aprendizado de máquina e inteligência computacional, com o objetivo de obter um filtro eficiente, capaz de classificar SNPs no genoma de um indivíduo, independente da plataforma de sequenciamento utilizada. / With the growing advances in genomic sequencing platforms, new developments on computational models are crucial to analyze, effectively, the large volume of data available. One of the main complexities, variations and peculiarities of a genome are single nucleotide polymorphisms (SNPs). The SNPs, which can be found in the genome of isolated individuals or groups of individuals of a specific population, are originated from inserts, removals or substitutions of bases. Single nucleotide variation, such as SNPs, can modify the production of a protein. Combination of all such modifications tend to determine variations on individuals characteristics of the specie. Thus, this phenomenon usually produces functional or phenotypic changes which, in turn, can result in evolutionary consequences for individuals with expressed SNPs. Among the numerous challenges in bioinformatics, the discovery and filtering of SNPs in genomic DNA is considered an important steps of the genome assembling post-processing. This dissertation has proposed and developed a computational method able to filtering SNPs in genome, using the genome assembled from sequences obtained by new generation platforms. The computational model presented is based on machine learning and computational intelligence techniques, aiming to obtain an efficient filter to sort SNPs in the genome of an individual, regardless of the sequencing platform adopted.
534

Problemas de comparação de genomas / Genoma comparison problems

Dias, Ulisses Martins, 1983- 02 August 2012 (has links)
Orientador: Zanoni Dias / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-20T03:52:46Z (GMT). No. of bitstreams: 1 Dias_UlissesMartins_D.pdf: 19168517 bytes, checksum: 463a6e15e1414ce37a0fe80f92de6b07 (MD5) Previous issue date: 2012 / Resumo: Esta tese aborda três aspectos da comparação entre genomas: primeiro, eventos de transposição; segundo, eventos de reversão e de reversão quase-simétrica; terceiro, estudo da distância entre genomas sem ligação com algum tipo específico de rearranjo. O estudo do primeiro aspecto, eventos de transposição, permitiu a criação de um novo algoritmo de aproximação na razão 1.375 e de modelos exatos usando programação em lógica com restrições para o problema da distância de transposição. Ambas as abordagens foram comparadas com outras semelhantes encontradas na literatura e, em ambos os casos, foi mostrado que o produto aqui apresentado é superior 'aqueles previamente conhecidos. Sob o segundo aspecto, eventos de reversões e de reversões quase-simétricas, houve avanços relacionados ao entendimento do processo de diferenciação das espécies na família Pseudomonadaceae e nos gêneros Mycobacterium, Shewanella e Xanthomonas com a criação de uma ferramenta de simulação capaz de gerar um histórico evolutivo com características semelhantes 'as observadas nos referidos grupos. Além disso, foram obtidos avanços em abordagens algorítmicas para o problema de construção de scaffolds usando um genoma de referência. De modo particular, foi obtida uma ferramenta superior 'as demais existentes na literatura para construção de scaffolds de genomas bacteriais. Ainda neste segundo aspecto, tratou-se do problema da distância de reversões quase-simétricas com a geração de um algoritmo guloso que fornece uma sequência de reversões quase-simétricas para ordenar qualquer permutação, além de algoritmos exatos para várias famílias específicas de permutações. No que diz respeito ao terceiro aspecto, foram desenvolvidas duas medidas que podem ser calculadas de forma eficiente (poucos segundos). Uma das medidas é adequada para genomas próximos e a outra é adequada para genomas distantes. Ambas foram avaliadas com genomas bacteriais reais, o que mostrou as vantagens e limitações de cada medida. Com esta tese, espera-se ter contribuído para a área de comparação de genomas em geral e, em particular, para a área de rearranjo de genomas / Abstract: In this PhD thesis, we work on three aspects of genome comparison: first, transposition events; second, inversion and almost-symmetric inversion events; third, whole-genome distance measures that are not connected to any specific kind of rearrangement event. The study of transposition events (first aspect) allowed us to create a new 1.375-approximation algorithm and some exact models using constraint logic programming. These approaches were compared to other published methods and in all cases our methods perform best. The second aspect of this thesis concerns inversion and almost-symmetric inversion events. In this regard, we developed a simulation tool for the study of symmetric inversions in bacterial genomes. Through this work we were able to contribute to the understanding of the evolutionary differentiation process in species of the following groups: the Pseudomonadaceae family, the Xanthomonas genus, the Shewanella genus, and the Mycobacterium genus. We used the knowledge acquired in building our simulation tool to establish a method that uses inversion signatures to generate draft genome sequence scaffolds using a complete genome as a reference. Apart from the practical applications of this research, we contribute to the computer science field by providing a theoretical framework for the almost-symmetric distance problem that can be improved in the future and can serve as a basis for approximation and heuristic algorithms. This framework is comprised of a greedy algorithm for any permutation, exact algorithms for specific families of permutation, and several lemmas and conjectures related to these problems. The third and last aspect of this thesis addresses the need for methods that can quickly and effectively compare large sets of genome sequences. We propose two new methods for efficiently determining whole genome sequence distance measures. One of them is aimed at comparing closely related genomes, and the other is meant to compare more distant genomes. Both measures were evaluated in order to find their limitations and their efficacy. It is our hope that thiswork represents a contribution to knowledge of the genome comparison field in general, and the genome rearrangement field, in particular / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
535

On genome rearrangement models = Sobre modelos de rearranjo de genomas / Sobre modelos de rearranjo de genomas

Feijão, Pedro Cipriano, 1975- 21 August 2018 (has links)
Orientador: João Meidanis / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-21T17:01:05Z (GMT). No. of bitstreams: 1 Feijao_PedroCipriano_D.pdf: 1943126 bytes, checksum: 4c547e8c568bbd0f2eb8235dfde05524 (MD5) Previous issue date: 2012 / Resumo: Rearranjo de genomas é o nome dado a eventos onde grandes blocos de DNA trocam de posição durante o processo evolutivo. Com a crescente disponibilidade de sequências completas de DNA, a análise desse tipo de eventos pode ser uma importante ferramenta para o entendimento da genômica evolutiva. Vários modelos matemáticos de rearranjo de genomas foram propostos ao longo dos últimos vinte anos. Nesta tese, desenvolvemos dois novos modelos. O primeiro foi proposto como uma definição alternativa ao conceito de distância de breakpoint. Essa distância é uma das mais simples medidas de rearranjo, mas ainda não há um consenso quanto à sua definição para o caso de genomas multi-cromossomais. Pevzner e Tesler deram uma definição em 2003 e Tannier et al. a definiram de forma diferente em 2008. Nesta tese, nós desenvolvemos uma outra alternativa, chamada de single-cut-or-join (SCJ). Nós mostramos que, no modelo SCJ, além da distância, vários problemas clássicos de rearranjo, como a mediana de rearranjo, genome halving e pequena parcimônia são fáceis, e apresentamos algoritmos polinomiais para eles. O segundo modelo que apresentamos é o formalismo algébrico por adjacências, uma extensão do formalismo algébrico proposto por Meidanis e Dias, que permite a modelagem de cromossomos lineares. Esta era a principal limitação do formalismo original, que só tratava de cromossomos circulares. Apresentamos algoritmos polinomiais para o cálculo da distância algébrica e também para encontrar cenários de rearranjo entre dois genomas. Também mostramos como calcular a distância algébrica através do grafo de adjacências, para facilitar a comparação com outras distâncias de rearranjo. Por fim, mostramos como modelar todas as operações clássicas de rearranjo de genomas utilizando o formalismo algébrico / Abstract: Genome rearrangements are events where large blocks of DNA exchange places during evolution. With the growing availability of whole genome data, the analysis of these events can be a very important and promising tool for understanding evolutionary genomics. Several mathematical models of genome rearrangement have been proposed in the last 20 years. In this thesis, we propose two new rearrangement models. The first was introduced as an alternative definition of the breakpoint distance. The breakpoint distance is one of the most straightforward genome comparison measures, but when it comes to defining it precisely for multichromosomal genomes, there is more than one way to go about it. Pevzner and Tesler gave a definition in a 2003 paper, and Tannier et al. defined it differently in 2008. In this thesis we provide yet another alternative, calling it single-cut-or-join (SCJ). We show that several genome rearrangement problems, such as genome median, genome halving and small parsimony, become easy for SCJ, and provide polynomial time algorithms for them. The second model we introduce is the Adjacency Algebraic Theory, an extension of the Algebraic Formalism proposed by Meidanis and Dias that allows the modeling of linear chromosomes, the main limitation of the original formalism, which could deal with circular chromosomes only. We believe that the algebraic formalism is an interesting alternative for solving rearrangement problems, with a different perspective that could complement the more commonly used combinatorial graph-theoretic approach. We present polynomial time algorithms to compute the algebraic distance and find rearrangement scenarios between two genomes. We show how to compute the rearrangement distance from the adjacency graph, for an easier comparison with other rearrangement distances. Finally, we show how all classic rearrangement operations can be modeled using the algebraic theory / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
536

Determinação pré-natal não invasiva de paternidade utilizando micro-haplótipos / Noninvasive prenatal paternity determination by microhaplotypes

Jaqueline Yu Ting Wang 24 November 2017 (has links)
Testes de paternidade geralmente são feitos analisando amostras de DNA do suposto pai, mãe e criança. Para realizar esse exame antes de a criança nascer era preciso recorrer à métodos invasivos, tais como amniocentese e biópsia de vilo corial. Com a descoberta de DNA fetal livre (fcfDNA) no soro e plasma materno, hoje é possível utilizar técnicas que usem esse fcfDNA diminuindo assim os riscos à saúde do feto e da mãe. Testes de pa- ternidade que analisam Short Tandem Repeats (STRs) do fcfDNA, embora possíveis, não são confiáveis, pois muitas vezes há degradação do DNA. Por sua vez, Single Nucleotide Polymorphisms (SNPs) têm sido demonstrados como bons candidatos para identificação humana e podem ser obtidos de fragmentos pequenos de DNA (ou seja, mesmo com o DNA degradado). No entanto, SNPs possuem um número limitado de alelos diferentes (entre dois e quatro). Micro-haplótipos são segmentos cromossomais menores do que 200 pb (pares de bases), contendo dois ou mais SNPs que formam pelo menos três haplótipos distintos. Ao utilizá-los como marcadores genéticos, aumentamos o número de possíveis alelos formados a partir dos SNPs. Como o fcfDNA possui um tamanho de aproximada- mente 145 pb, isso é suficiente para conter micro-haplótipos que podem ser sequenciados usando tecnologia de Sequenciamento de Nova Geração (NGS). O objetivo desse projeto é determinar a probabilidade de paternidade usando SNPs dentro de micro-haplótipos. Os micro-haplótipos foram escolhidos com base em literatura prévia e as frequências relativas destes foram calculadas com base nos grupos étnicos dos dados do 1000 Genomes. Dados brutos de sequenciamento de três amostras de DNA são analisados: o suposto pai, a mãe e o plasma materno (mistura de DNA livre da mãe e do feto). Em seguida, desenvolvemos scripts para obter e analisar os genótipos do suposto pai e da mãe, para cada um dos micro-haplótipos escolhidos. Combinando informação genotípica, frequências populacio- nais e frações fetais (plasma), desenvolvemos um método para calcular a probabilidade de paternidade em casos de não exclusão da mesma. / Paternity tests are usually done by analyzing DNA samples from the alleged father, the mother, and the child. To perform this exam before the birth, invasive methods such as am- niocentesis and chorionic villus sampling are usually necessary. Fortunately, the discovery of fetal cell-free DNA (fcfDNA) in maternal plasma and serum, and the development of te- chniques to analyze this fcfDNA have allowed researchers to reduce the health risk for both fetus and mother. Although paternity tests that analyze Short Tandem Repeats (STRs) from fcfDNA are possible, they are not reliable because DNA degradation often occurs. Single Nucleotide Polymorphisms (SNPs) have been demonstrated as good candidates for human identification and they can be obtained from small DNA fragments (even from de- graded DNA). However, SNPs have a limited number of different alleles (between two and four). Microhaplotypes are chromosomal segments smaller than 200 bp (base pairs) con- taining two or more SNPs that form at least three distinct haplotypes. By using them as genetic markers, we increased the number of possible alleles formed from the SNPs. Since fcfDNA has approximately 145 bp, this is sufficient to contain microhaplotypes that can be sequenced using Next Generation Sequencing (NGS) technology. The aim of this project is to determine the probability of paternity using SNPs within microhaplotypes. Microha- plotypes were chosen based on previous literature review. The haplotype frequencies were calculated based on the ethnic groups from 1000 Genomes database. Raw DNA sequence data from three DNA samples were analyzed: the alleged father, the mother, and the maternal plasma (mixture of mother and fcfDNA). Then, we developed scripts to analyse and obtain the genotypes of the alleged father and mother, for each microhaplotype. By combining genotypic information, population frequencies, and fetal fractions (plasma), we developed a method to calculate the probability of paternity in cases of non-exclusion.
537

Desenvolvimento da plataforma CaneRegNet para anotação funcional e análises do transcriptoma da cana-de-açúcar / Development of CaneRegNet platform for functional annotation and analysis of sugarcane transcriptome

Milton Yutaka Nishiyama Junior 13 April 2015 (has links)
A identificação de genes alvos, vias de sinalização e vias metabólicas para melhoramento de cana-de-açúcar associados a características de interesse, ainda são pouco conhecidos e estudados. Alguns estudos do transcriptoma através de plataformas de microarranjo têm buscado identificar listas de genes, para experimentos tecido- específico ou submetidos a condições de estresse bióticos e abióticos. Estudos pontuais destes dados tem sido associados a vias metabólicas ou vias de sinalização já descritas na literatura, de forma a identificar alterações relacionadas a padrões de expressão gênica. Porém, estas relações em cana-de-açúcar são pouco conhecidas e estudadas. O estudo e entendimento de cana-de-açúcar por meio da diversidade genética e de sua adaptação ao ambiente é um grande desafio, principalmente pela ausência de um genoma sequenciado e por possuir um genoma complexo. Apresentamos nossos resultados para tentar superar tais limitações e desafios para estudos de expressão gênica. Foram desenvolvidas metodologias para anotação funcional do transcriptoma, centradas na transferência de anotação, identificação de vias metabólicas e enzimas pelo método de similaridade bi-direcional, predição de genes full-length, análises de ortologia e desenho de oligonucleotídeos para microarranjos customizados, resultando no ORFeoma de cana-de-açúcar, na identificação e classificação de famílias de fatores de transcrição e identificação de genes ortólogos entre gramíneas. Além disso, desenvolvemos uma plataforma para processamento e análise automatizada de experimentos por microarranjo, para armazenamento, recuperação e integração com a anotação funcional. Adicionalmente desenvolvemos e implementamos métodos para seleção de genes diferencialmente e significativamente expressos, e abordagens para análise de enriquecimento de categorias, e escores de atividade de vias metabólicas. De forma a integrar a anotação funcional do transcriptoma aos estudos por expressão gênica, desenvolvemos a plataforma CaneRegNet e uma interface para integração desta rede de dados biológicos e conhecimentos, composta por aplicativos para consulta e prospecção de dados por análises de agrupamento e correlação entre experimentos de microarranjo, possibilitando a geração de novas hipóteses e predições dentro da organização da regulação celular. / The identification of target genes, metabolic and signaling pathways associated with characteristics of interest to the sugarcane improvement are still poorly known and studied. Some transcritptome studies through microarray platforms has tried to identify lists of genes, for tissue-specific experiments or subjected to conditions of biotic and abiotic stress. In the literature specific studies of these data has already been associated with metabolic or signaling pathway, in order to identify changes in these tracks related to patterns of gene expression. However, these relations are still little know and generally defined slightly. The study and understanding of sugarcane by means of genetic diversity and its adaptation to the environment is a major challenge, mainly due to the absence of a sequenced genome and by your complex genome. We present our results to surpass this barrier e challenges for the study of gene expression. Methodologies were developed for the transcriptome functional annotation, focused on the annotation transfer, identification of metabolic pathways and enzymes by the bi- directional method; prediction of full-length genes; ortology analysis and probe design for customized microarrays, resulting in the sugarcane ORFeome, the identification and classification of transcription factor families and identification of ortholog genes between grasses. Besides that, we have developed a plataform for automated processing and analysis for microarray experiments, to store, retrieve and integration with the functional annotation. Additionally, we have developed and implemented methods for identification of differentially and significantly expressed genes, and approaches for over-represented analysis and functional class scoring (FCS). To integrate the functional annotation and the studies by gene expression profile, we have developed the CaneRegNet platform and an interface to integrate this network of biological data and knowledge, composed by searching and data mining tools for clustering and correlations between microarray experiments, enabling the generation of new hypothesis and predictions around the organization of cellular regulation.
538

Identificação de regiões codificantes de proteína através da transformada modificada de Morlet / Identification of Protein Coding Regions through the Modified Morlet Transform

Jesus Pascual Mena Chalco 19 October 2005 (has links)
Um tópico importante na análise de seqüências biológicas é a busca de genes, ou seja, a identificação de regiões codificantes de proteínas. Esta identificação permite a posterior procura de significado, descrição ou categorização biológica do organismo analisado. Atualmente, vários métodos combinam reconhecimento de padrões com conhecimento coletado de conjuntos de treinamento ou de comparações com banco de dados genômicos. Entretanto, a acurácia desses métodos está ainda longe do satisfatório. Novos métodos de processamento de seqüências de DNA e de identificação de genes podem ser criados através da busca por conteúdo (search-by-content). O padrão periódico de DNA em regiões codificantes de proteína, denominada periodicidade de três bases, vem sendo considerado uma propriedade dessas regiões. As técnicas de processamento digital de sinais fornecem uma base robusta para a identificação de regiões com periodicidade de três bases. Nesta dissertação, são apresentados um \\pipeline, os conceitos básicos da identificação genômica, e métodos de processamento digital de sinais utilizados para a identificação de regiões codificantes de proteínas. Introduzimos um novo método para a identificação dessas regiões, baseado na transformada proposta, denominada Transformada Modificada de Morlet. Apresentamos vários resultados experimentais obtidos a partir de seqüências de DNA sintéticas e reais. As principais contribuições do trabalho consistem no desenvolvimento de um pipeline para projetos genoma e na criação de um método de identificação de regiões codificantes onde a periodicidade de três bases seja latente. O método apresenta desempenho superior e vantagens importantes em comparação ao método tradicional baseado na transformada de Fourier de tempo reduzido. / An important topic in biological sequences analysis is gene finding, i.e. the identification of protein coding regions. This identification allows the posterior research for meaning, description or biological categorization of the analyzed organism. Currently, several methods combine pattern recognition with knowledge collected from training datasets or from comparison with genomic databases. Nonetheless, the accuracy of these methods is still far from satisfactory. New methods of DNA sequences processing and genes identification can be created through search-by-content such sequences. The periodic pattern of DNA in protein coding regions, called three-base periodicity, has been considered proper of coding regions. Digital signal processing techniques supply a strong basis for regions identification with three-base periodicity. In this work, we present a bioinformatics pipeline, basic concepts of the genomic identification and digital signal processing methods used for protein coding regions identification. We introduce a new method for identification of these regions, based on a newly proposed transform, called Modified Morlet Transform. We present some obtained experimental results from synthetic and real DNA sequences. The main contributions consist of the bioinformatics pipeline development for genoma projects and the creation of a method for protein coding regions identification where the three-base periodicity is latent. The method presents superior performance and important advantages in comparison to traditional method based on the short time Fourier transform.
539

Implementación del sistema orientado a la fedatación integrada, según el marco de la norma técnica peruana 392.030-2-2015 para la Secretaría General de la RENIEC

Ortega Delgado, Luis Jesús January 2017 (has links)
Publicación a texto completo no autorizada por el autor / Describe el proyecto de implementación de un sistema orientado a la fedatación integrada, el cual cumple los requisitos que exige la norma técnica peruana 392.030-2-2015 MICROFORMAS: requisitos para las organizaciones que operan sistemas de producción de microformas como es el caso de Reniec. El objetivo es la integración en una sola herramienta informática la fedatación Juramentada en el proceso de producción de microformas y consultas generadas en los órganos de línea y apoyo del RENIEC. / Trabajo de suficiencia profesional
540

Understanding Isoform Expression and Alternative Splicing Biology through Single-Cell RNAseq

Arzalluz Luque, Ángeles 27 April 2024 (has links)
[ES] La introducción de la secuenciación de ARN a nivel de célula única (scRNA-seq) en el ámbito de la transcriptómica ha redefinido nuestro entendimiento de la diversidad celular, arrojando luz sobre los mecanismos subyacentes a la heterogeneidad tisular. No obstante, al inicio de esta tesis, las limitaciones de a esta tecnología obstaculizaban su aplicación en el estudio de procesos complejos, entre ellos el splicing alternativo. A pesar de ello, los patrones de splicing a nivel celular planteaban incógnitas que esta tecnología tenía el potencial de resolver: ¿es posible observar, a nivel celular, la misma diversidad de isoformas que se detecta mediante RNA-seq a nivel de tejido? ¿Qué función desempeñan las isoformas alternativas en la constitución de la identidad celular? El objetivo de esta tesis es desbloquear el potencial del scRNA-seq para el análisis de isoformas, abordando sus dificultades técnicas y analíticas mediante el desarrollo de nuevas metodologías computacionales. Para lograrlo, se trazó una hoja de ruta con tres objetivos. Primero, se establecieron cuatro requisitos para el estudio de las isoformas mediante scRNA-seq, llevando a cabo una revisión de la literatura existente para evaluar su cumplimiento. Tras completar este marco con simulaciones computacionales, se identificaron las debilidades y fortalezas de los métodos de scRNA-seq y las herramientas computacionales disponibles. Durante la segunda etapa de la investigación, estos conocimientos se utilizaron para diseñar un protocolo óptimo de procesamiento de datos de scRNA-seq. En concreto, se integraron datos de lecturas largas a nivel de tejido con datos de scRNA-seq para garantizar una identificación adecuada de las isoformas así como su cuantificación a nivel celular. Este proceso permitió ampliar las estrategias computacionales disponibles para la reconstrucción de transcriptomas a partir de lecturas largas, mejoras que fueron implementadas en SQANTI3, software de referencia en transcriptómica. Por último, los datos procesados se utilizaron para desarrollar un nuevo método de análisis de co-expresión de isoformas a fin de desentrañar redes de regulación del splicing alternativo implicadas en la constitución de la identidad celular. Dada la elevada variabilidad de los datos de scRNA-seq, este método se basa en la utilización de una estrategia de correlación basada en percentiles que atenúa el ruido técnico y permite la identificación de grupos de isoformas co-expresadas. Una vez configurada la red de co-expresión, se introdujo una nueva estrategia de análisis para la detección de patrones de co-utilización de isoformas que suceden de forma independiente a la expresión a nivel de gen, denominada co-Differential Isoform Usage. Este enfoque facilita la identificación de una capa de regulación de la identidad celular atribuible únicamente a mecanismos post-transcripcionales. Para una interpretación biológica más profunda, se aplicó una estrategia de anotación computacional de motivos y dominios funcionales en las isoformas definidas con lecturas largas, revelando las propiedades biológicas de las isoformas involucradas en la red de co-expresión. Estas investigaciones culminan en el lanzamiento de acorde, un paquete de R que encapsula las diferentes metodologías desarrolladas en esta tesis, potenciando la reproducibilidad de sus resultados y proporcionando una nueva herramienta para explorar la biología de las isoformas alternativas a nivel de célula única. En resumen, esta tesis describe una serie de esfuerzos destinados a desbloquear el potencial de los datos de scRNA-seq para avanzar en la comprensión del splicing alternativo. Desde un contexto de escasez de herramientas y conocimiento previo, se han desarrollado soluciones de análisis innovadoras que permiten la aplicación de scRNA-seq al estudio de las isoformas alternativas, proporcionando recursos innovadores para profundizar en la regulación post-transcripcional y la función celular. / [CA] La introducció de la seqüenciació d'ARN a escala de cèl·lula única (scRNA-seq) en l'àmbit de la transcriptòmica ha redefinit el nostre enteniment de la diversitat cel·lular, projectant llum sobre els mecanismes subjacents a l'heterogeneïtat tissular. Malgrat les limitacions inicials d'aquesta tecnologia, especialment en el context de processos complexos com l'splicing alternatiu, els patrons d'splicing a escala cel·lular plantejaven incògnites amb potencial de resolució: és possible observar, a escala cel·lular, la mateixa diversitat d'isoformes que es detecta mitjançant RNA-seq en teixits? Quina funció tenen les isoformes alternatives en la constitució de la identitat cel·lular? L'objectiu d'aquesta tesi és desbloquejar el potencial del scRNA-seq per a l'anàlisi d'isoformes alternatives, abordant les seues dificultats tècniques i analítiques amb noves metodologies computacionals. Per a això, es va traçar una ruta amb tres objectius. Primerament, es van establir quatre requisits per a l'estudi de les isoformes mitjançant scRNA-seq, amb una revisió de la literatura existent per avaluar-ne el compliment. Després de completar aquest marc amb simulacions computacionals, es van identificar les debilitats i fortaleses dels mètodes de scRNA-seq i de les eines computacionals disponibles. Durant la segona etapa de la investigació, aquests coneixements es van utilitzar per dissenyar un protocol òptim de processament de dades de scRNA-seq. En concret, es van integrar dades de lectures llargues a escala de teixit amb dades de scRNA-seq per a garantir una identificació adequada de les isoformes així com la seua quantificació a escala cel·lular. Aquest procés va permetre ampliar les estratègies computacionals disponibles per a la reconstrucció de transcriptomes a partir de lectures llargues, millores que van ser implementades en SQANTI3, un programari de referència en transcriptòmica. Finalment, les dades processades es van fer servir per a desenvolupar un nou mètode d'anàlisi de coexpressió d'isoformes amb l'objectiu de desentranyar xarxes de regulació de l'splicing alternatiu implicades en la constitució de la identitat cel·lular. Donada l'elevada variabilitat de les dades de scRNA-seq, aquest mètode es basa en la utilització d'una estratègia de correlació basada en percentils que minimitza el soroll tècnic i permet la identificació de grups d'isoformes coexpressades. Un cop configurada la xarxa de coexpressió, es va introduir una nova estratègia d'anàlisi per a la detecció de patrons de co-utilització d'isoformes que succeeixen de forma independent a l'expressió del seu gen, denominada co-Differential Isoform Usage. Aquest enfocament facilita la identificació d'una capa de regulació de la identitat cel·lular atribuïble únicament a mecanismes post-transcripcionals. Per a una interpretació biològica més profunda, es va aplicar una estratègia d'anotació computacional de motius i dominis funcionals en les isoformes definides amb lectures llargues, revelant les propietats biològiques de les isoformes involucrades en la xarxa de coexpressió. Aquestes investigacions culminen en el llançament d'acorde, un paquet de R que encapsula les diferents metodologies desenvolupades en aquesta tesi, potenciant la reproducibilitat dels seus resultats i proporcionant una nova eina per a explorar la biologia de les isoformes alternatives a escala de cèl·lula única. En resum, aquesta tesi descriu una sèrie d'esforços destinats a desbloquejar el potencial de les dades de scRNA-seq per a avançar en la comprensió de l'splicing alternatiu. Des d'un context de manca d'eines i coneixement previ, s'han desenvolupat solucions d'anàlisi innovadores que permeten l'aplicació de scRNA-seq a l'estudi de les isoformes alternatives, proporcionant recursos innovadors per a aprofundir en la regulació post-transcripcional i la funció cel·lular. / [EN] In the world of transcriptomics, the emergence of single-cell RNA sequencing (scRNA-seq) ignited a revolution in our understanding of cellular diversity, unraveling novel mechanisms in tissue heterogeneity, development and disease. However, when this thesis began, using scRNA-seq to understand Alternative Splicing (AS) was a challenging frontier due the inherent limitations of the technology. In spite of this research gap, pertinent questions persisted regarding cell-level AS patterns, particularly concerning the recapitulation of isoform diversity observed in bulk RNA-seq data at the cellular level and the roles played by cell and cell type-specific isoforms. The work conducted in the present thesis aims to harness the potential of scRNA-seq for alternative isoform analysis, outlining technical and analytical challenges and designing computational methods to overcome them. To achieve this, we established a roadmap with three main aims. First, we set requirements for studying isoforms using scRNA-seq and conducted an extensive review of existing research, interrogating whether these requirements were met. Combining this acquired knowledge with several computational simulations allowed us to delineate the strengths and pitfalls of available data generation methods and computational tools. During the second research stage, this insight was used to design a suitable data processing pipeline, in which we jointly employed bulk long-read and short-read scRNA-seq sequenced from full-length cDNAs to ensure adequate isoform reconstruction as well as sensitive cell-level isoform quantification. Additionally, we refined available transcriptome curation strategies, introducing them as innovative modules in the transcriptome quality control software SQANTI3. Lastly, we harnessed single-cell isoform expression data and the rich biological diversity inherent in scRNA-seq, encompassing various cell types, in the design of a novel isoform co-expression analysis method. Percentile correlations effectively mitigated single-cell noise, unveiling clusters of co-expressed isoforms and exposing a layer of regulation in cellular identity that operated independently of gene expression. We additionally introduced co-Differential Isoform Usage (coDIU) analysis, enhancing our ability to interpret isoform cluster networks. This endeavour, combined with the computational annotation of functional sites and domains in the long read-defined isoform models, unearthed a distinctive functional signature in coDIU genes. This research effort materialized in the release of acorde, an R package that encapsulates all analyses functionalities developed throughout this thesis, providing a reproducible means for the scientific community to further explore the depths of alternative isoform biology within single-cell transcriptomics. This thesis describes a complex journey aimed at unlocking the potential of scRNA-seq data for investigating AS and isoforms: from a landscape marked by the scarcity of tools and guidelines, towards the development of novel analysis solutions and the acquisition of valuable biological insight. In a swiftly evolving field, our methodological contributions constitute a significant leap forward in the application of scRNA-seq to the study of alternative isoform expression, providing innovative resources for delving deeper into the intricacies of post-transcriptional regulation and cellular function through the lens of single-cell transcriptomics. / The research project was funded by the BIO2015-71658 and BES-2016-076994 grants awarded by the Spanish Ministry of Science and Innovation / Arzalluz Luque, Á. (2024). Understanding Isoform Expression and Alternative Splicing Biology through Single-Cell RNAseq [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/203888

Page generated in 0.0646 seconds