• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
381

Uma abordagem para a indução de árvores de decisão voltada para dados de expressão gênica / An Approach for the Induction of Decision Trees Focused on Gene Expression Data

Perez, Pedro Santoro 18 April 2012 (has links)
Estudos de expressão gênica têm sido de extrema importância, permitindo desenvolver terapias, exames diagnósticos, medicamentos e desvendar uma infinidade de processos biológicos. No entanto, estes estudos envolvem uma série de dificuldades: grande quantidade de genes, sendo que geralmente apenas um pequeno número deles está envolvido no problema estudado; presença de ruído nos dados analisados; entre muitas outras. O projeto de pesquisa deste mestrado consiste no estudo de algoritmos de indução de árvores de decisão; na definição de uma metodologia capaz de tratar dados de expressão gênica usando árvores de decisão; e na implementação da metodologia proposta como algoritmos capazes de extrair conhecimento a partir desse tipo de dados. A indução de árvores de decisão procura por características relevantes nos dados que permitam modelar precisamente um conceito, mas tem também a preocupação com a compreensibilidade do modelo gerado, auxiliando os especialistas na descoberta de conhecimento, algo importante nas áreas médica e biológica. Por outro lado, tais indutores apresentam relativa instabilidade, podendo gerar modelos bem diferentes com pequenas mudanças nos dados de treinamento. Este é um dos problemas tratados neste mestrado. Mas o principal problema tratado se refere ao comportamento destes indutores em dados de alta dimensionalidade, mais especificamente dados de expressão gênica: atributos irrelevantes prejudicam o aprendizado e vários modelos com desempenho similar podem ser gerados. Diversas técnicas foram exploradas para atacar os problemas mencionados, mas este estudo se concentrou em duas delas: windowing, que foi a técnica mais explorada e para a qual este mestrado propôs uma série de alterações com vistas à melhoria de seu desempenho; e lookahead, que procura construir a árvore levando em considerações passos subsequentes do processo de indução. Quanto ao windowing, foram explorados aspectos relacionados ao procedimento de poda das árvores geradas durante a execução do algoritmo; uso do erro estimado em substituição ao erro de treinamento; uso de ponderação do erro calculado durante a indução de acordo com o tamanho da janela; e uso da confiança na classificação para decidir quais exemplos utilizar na atualização da janela corrente. Com relação ao lookahead, foi implementada uma versão de um passo à frente, ou seja, para tomar a decisão na iteração corrente, o indutor leva em consideração a razão de ganho de informação do passo seguinte. Os resultados obtidos, principalmente com relação às medidas de desempenho baseadas na compreensibilidade dos modelos induzidos, mostram que os algoritmos aqui propostos superaram algoritmos clássicos de indução de árvores. / Gene expression studies have been of great importance, allowing the development of new therapies, diagnostic exams, drugs and the understanding of a variety of biological processes. Nevertheless, those studies involve some obstacles: a huge number of genes, while only a very few of them are really relevant to the problem at hand; data with the presence of noise; among others. This research project consists of: the study of decision tree induction algorithms; the definition of a methodology capable of handling gene expression data using decision trees; and the implementation of that methodology as algorithms that can extract knowledge from that kind of data. The decision tree induction searches for relevant characteristics in the data which would allow it to precisely model a certain concept, but it also worries about the comprehensibility of the generated model, helping specialists to discover new knowledge, something very important in the medical and biological areas. On the other hand, such inducers present some instability, because small changes in the training data might produce great changes in the generated model. This is one of the problems being handled in this Master\'s project. But the main problem this project handles refers to the behavior of those inducers when it comes to high-dimensional data, more specifically to gene expression data: irrelevant attributes may harm the learning process and many models with similar performance may be generated. A variety of techniques have been explored to treat those problems, but this study focused on two of them: windowing, which was the most explored technique and to which this project has proposed some variations in order to improve its performance; and lookahead, which builds each node of a tree taking into consideration subsequent steps of the induction process. As for windowing, the study explored aspects related to the pruning of the trees generated during intermediary steps of the algorithm; the use of the estimated error instead of the training error; the use of the error weighted according to the size of the current window; and the use of the classification confidence as the window update criterion. As for lookahead, a 1-step version was implemented, i.e., in order to make the decision in the current iteration, the inducer takes into consideration the information gain ratio of the next iteration. The results show that the proposed algorithms outperform the classical ones, especially considering measures of complexity and comprehensibility of the induced models.
382

Estudo da forma, função e expressão gênica em neurociência / Study of form, function and gene expression in neuroscience

Miazaki, Mauro 21 May 2012 (has links)
Durante o desenvolvimento de um neurônio, genes são ativados e desativados, a anatomia se forma e as funcionalidades emergem. Estes três componentes influenciam continuamente uns aos outros. O estudo da forma, função e expressão gênica nos neurônios e no cérebro permanece um tema desafiador e com potencial a ser explorado. Neste contexto, uma importante questão ainda a ser respondida é como quantificar o inter-relacionamento entre forma, função e genes. Para isso, foram realizadas atividades envolvendo caracterização e comparação da forma neuronal, o estudo de processos dinâmicos ocorrendo em redes de estruturas ramificadas, e a comparação entre expressões gênicas. Os dados da base pública NeuroMorpho, que possui quase 6.000 neurônios segmentados, foram caracterizados utilizando-se métodos estatísticos e foram analisados pelo conceito de morfoespaço proposto por McGhee. Outra base pública explorada foi o Mouse Allen Brain Atlas, com imagens de expressão gênica de cérebros de camundongo. Foi proposta a utilização de um método baseado em diagramas de Voronoi para a comparação da distribuição espacial de densidades de expressão gênica entre genes, com o propósito de encontrar correlações entre distribuições. Também foram gerados dados sobre raízes de feijão para o estudo da influência de sua estrutura ramificada na dinâmica de propagação de doenças, seguindo o modelo SIR (Suscetível-Infectado-Recuperado). Integrando os desenvolvimentos anteriores, foi proposto um arcabouço para mensurar a influência da expressão gênica ao longo da escala biológica. Este arcabouço permite mensurar a influência da expressão gênica (escala molecular) na morfologia dos neurônios (escala celular), avançando à escala topológica formada pelas conexões sinápticas, e alcançando o nível funcional das dinâmicas sobre essa rede. Nesse contexto, deve-se ressaltar que a influência da expressão gênica é direta sobre a morfologia e indireta sobre a topologia e a dinâmica. As informações obtidas a partir do arcabouço são relevantes na investigação de como a expressão gênica influencia todo o processo, desde o neurônio individual até o funcionamento cerebral. O arcabouço proposto fornece uma metodologia sistemática, com um conjunto de ferramentas para essas análises. / During the development of a neuron, genes are turned on and off, the anatomy is shaped and the functionality emerges. These three components influence each other continuously. The study of form, function and gene expression in neurons and brain is still challenging and has many issues yet to be explored. In this context, an important question yet to be answered is how to quantify the inter-relationship between form, function and gene expression. In this way, we developed activities involving characterization and comparison of the neuronal form, the study of dynamical processes occurring in networks of branching structures, and the comparison between gene expressions. The data of the public database NeuroMorpho, which comprise almost 6,000 segmented neurons, were characterized using statistical methods and were analyzed by the concept of McGhee\'s morphospace. Another public database that was explored was the Mouse Allen Brain Atlas, with images of gene expression of mouse brains. We proposed to use a method based on Voronoi diagrams to compare the spatial distribution of the gene expression densities between genes, in order to find correlations in the distribution. We also generated data on bean roots to study the influence of their branched structures in the dynamics of disease spread, following the SIR model (Susceptible-Infected-Recovered). Integrating the previous developments, we proposed a framework to measure the gene expression influence through the biological scale. This framework allows the measurement of the gene expression (molecular scale) influence in the morphology of the neurons (cellular scale), advancing towards the topological scale formed by the synaptic connections, and reaching the functional level of the dynamics over this network. In this context, it is worth to note that the gene expression influence is direct on the morphology and indirect on the topology and dynamics. The obtained information through the framework is important on the investigation of how the gene expression influences the whole process, since the individual neuron to the cerebral functioning. The proposed framework yields a systematic methodology with a toolbox to carry out these analyses.
383

Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania / In silico identification and analysis of Leishmania ncRNAs using RNA-seq data

Ruy, Patrícia de Cássia 08 August 2017 (has links)
Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global. / High-throughput data analyses indicated that transcriptomes are more extensive and complex than previously supposed. Currently, it is evident that most eukaryotic genomes are almost entirely transcribed and under regulation tied to developmental stages. Control of gene expression involves regulatory non-coding RNAs (ncRNAs), including post-transcriptional processes. Post-transcriptional regulation is particularly relevant for the regulation of gene expression in trypanosomatids, as compared to other organisms. Parasites of the genus Leishmania (Order Kinetoplastidae, family Trypanosomatidae) causes infectious-parasitic diseases known as leishmaniasis, and their life cycle comprises three development stages: procyclic promastigotes, metacyclic promastigotes and amastigotes. This study aimed to computationally identify and characterize Leishmania putative ncRNAs at different stages of development. Large-scale approaches combined with bioinformatics tools allowed the identification of 11,376 putative ncRNAs in L. braziliensis and, in a preliminary study, of 37 putative ncRNAs in L. donovani. In addition, the L. braziliensis the complete transcriptome was analyzed comparatively between the parasite development stages. In L. donovani, of the 37 putative ncRNAs identified, 34 were in UTRs (Untranslated Regions) and 3 in intergenic regions. Predictors of ncRNAs specific characteristics were used and 32 putative ncRNAs had at least one positive prediction. All candidates are conserved, partially or entirely, in at least three Leishmania species. Five L. donovani ncRNAs were confirmed by Northern blotting experiments. Analysis of the L. braziliensis transcriptome revealed differences in gene expression levels between developmental stages, ranging from 52% to 71%, depending on the compared stages. The boundaries of the 5\'UTRs and 3\'UTRs were also defined for 81% and 38% of the annotated CDSs, respectively. We developed a methodology for the identification of putative ncRNAs using total RNA sequencing data. This methodology allowed the identification of 11,376 putative ncRNAs in L. braziliensis, and all candidates were analyzed by predictive programs of ncRNAs specific characteristics and presented at least one positive prediction, in addition to bearing no similarity to known protein domains. The analysis showed that from 27% to 41% of the putative ncRNAs identified are conserved in other Leishmania species. We found 27% to 38% of putative ncRNAs with regulation associated to the developmental stage, depending on the compared stages. Consequently, besides identification and characterization of ncRNAs in Leishmania, candidates with developmental-related regulation were found and patterns were uncovered with the proposed and implemented analysis. Thus, this work contributes significantly to improve understanding of gene expression regulation processes in Leishmania and will offer to the community important information about the parasite genetics and regulatory differences along the development, besides of L. braziliensis transcriptome information.
384

Desenvolvimento de software para o monitoramento de saúde no Nutritionists\' Health Study / [Software development for health monitoring in the Nutritionist \'Health Study: application in the analysis of the relationship between literacy in nutrition and diet

Folchetti, Luciana Gavilan Dias 26 August 2016 (has links)
Introdução: Nicho interessante de pesquisa sobre o papel de hábitos de vida na saúde são os nutricionistas e estudantes de nutrição. Nesse sentido, surge o Nutritionists Health Study (NutriHS) na FSP-USP. Estudos desta natureza geram quantidade apreciável de informação, sendo desejável o uso de tecnologia para facilitar a obtenção e processamento de dados. Objetivos: O conjunto dos objetivos desta tese, que vão desde a criação de sistema web até sua aplicação no NutriHS, foram: 1) analisar softwares internacionalmente disponíveis, voltados à coleta e análise de dados sobre nutrição e alimentação; 2) desenvolver e implementar o sistema web, o e-NutriHS; 3) elaborar a documentação do sistema web; 4) proceder a validação os dados coletados pelo e-NutriHS; 5) comparar hábitos de vida (dieta e atividade física), medidas antropométricas e perfil bioquímico de estudantes de Nutrição e nutricionistas. Métodos: Realizou-se busca sistemática de estudos que utilizavam sistemas informatizados baseados na web. No desenvolvimento do e-NutriHS empregaram-se linguagens de programação livres: para o banco de dados utilizou-se MySQL 5.0 server via phpMyAdmin, localhost via UNIX socket e para a camada de apresentação Jquery 1.8, PHP 5.6, CSS e HTML 5. A documentação incluiu fluxogramas, arquitetura, código fonte e abordagem IBM Rational Unified Process, permitindo o desenvolvimento guiado por casos de uso, atendendo às recomendações do Instituto Nacional de Propriedade Industrial. Implementou-se a coleta de dados do NutriHS sobre hábitos de vida, eventos precoces da vida, saúde e clínico-laboratoriais, de estudantes de Nutrição em diferentes períodos do curso (1ª metade e 2ª metade) e graduados, por meio eletrônico e presencial. Bland-Altman e Kappa foram usadas para análises de concordância entre dados referidos e aferidos. Subgrupos de participantes foram comparados quanto a diversas variáveis (incluindo índice de dieta saudável) por ANOVA. Resultados: A busca das ferramentas de coleta eletrônica de dados de nutrição resultou em 10 estudos. A documentação do e-NutriHS incluiu detalhamento de fluxogramas, arquitetura, código fonte e casos de uso, atendendo às recomendações para registro de software. 723 indivíduos completaram dados autorreferidos no sistema e 228 realizaram antropometria, medidas de pressão arterial, composição corporal e coleta de materiais biológicos. Detectaram-se fortes correlações entre os valores antropométricos relatados e aferidos. A comparação de subgrupos mostrou tendência a menor consumo de energia, colesterol e carne vermelha e maior consumo de frutas & verduras nos grupos com maior duração da exposição a conhecimentos em nutrição. Os graduados apresentaram melhor escore de componentes do índice de dieta saudável e melhores índices lipídicos. Tais índices associaram-se ao consumo de frutas & verduras e inversamente ao de grãos refinados. Discussão: Instrumentos disponíveis na literatura apontam o meio eletrônico como de utilidade para condução de pesquisa em epidemiologia nutricional. O e-NutriHS atendeu adequadamente aos propósitos, motivando encaminhar seu registro de software. Com ferramenta eletrônica amigável, o NutriHS destacou-se como importante iniciativa de pesquisa em nutrição. Sugeriu que aquisição de conhecimento e habilidades traz benefícios clínicos que poderão, no longo prazo, reduzir o risco cardiometabólico. Conclui-se que o desenvolvimento do e-NutriHS proporcionou rápida implementação do NutriHS, gerando dados de alta qualidade e baixo custo. Abrem-se perspectivas de testar hipóteses sobre mecanismos de doenças e intervenções na sua fase longitudinal que poderão ser úteis para a saúde pública. / Introduction: An interesting field of research on the role of lifestyle on health involves undergraduates and graduates of Nutrition Colleges. In this sense, emerges the Nutritionists\' Health Study (NutriHS) in the FSP-USP. This kind of study generates appreciable amount of information requiring technology to facilitate the data collection and processing. Objectives: The objectives for the development of this thesis began by programing a computerized system to its application in NutriHS. They were: 1) to analyze internationally available softwares addressed to the collection and analysis of data on nutrition; 2) to develop and implement the web system, e-NutriHS; 3) to develop the web system documentation; 4) to validate the data collected by NutriHS system; 5) to compare lifestyle habits (diet and physical activity), anthropometric measurements and biochemical profile of Nutrition undergraduates and nutritionists. Methods: A systematic search of epidemiological studies using web-based systems was performed. For the development of the e-NutriHS system free programming languages were employed: MySQL 5.0 for database server via phpMyAdmin, localhost via UNIX socket; and jQuery 1.8, PHP 5.6, CSS and HTML 5 for the users layer. Its documentation included detailed flowcharts, architecture, source code and the IBM Rational Unified Process approach, according to the National Institute of Industrial Property recommendations. Electronic data collection of the NutriHS participants on lifestyle, early life events, health and clinical laboratory from the undergraduates at different stages of course (1st half and 2nd half) and graduated, as well as face-to-face data collection, were implemented. Bland-Altman and Kappa were used for correlation analysis between reported and measured data. Subgroups of participants were compared according to a number of variables (including healthy eating index) by ANOVA. Results: Ten studies were selected in the search of webbased instruments. The e-NutriHS documentation included flowcharts, architecture, source code and use cases, taking into account the recommendations for software registration. 723 subjects completed self-reported data and 228 had measurements of anthropometry, blood pressure, body composition and collection of biological materials taken. Strong correlations were detected between reported and measured anthropometric values. In subgroups comparisons, a trend to lower energy and cholesterol red meat and higher fruits and vegetables intakes were found in groups with longer exposure to nutrition knowledge. The graduated group had better scores of some components the health eating index and better lipid indices. Lipid indices were associated with the intake fruits & vegetables and inversely with refined grains. Discussion: The systematic review indicates that web-based instruments are useful for conducting research in nutritional epidemiology. The e-NutriHS met its purposes appropriately, which led to referral to the software registration. The NutriHS has represented a major initiative research in nutrition. This suggested that acquisition of knowledge and skills reflects in clinical benefits that could reduce long term cardiometabolic risk. We conclude that the e-NutriHS development accelerate the NutriHS implementation, generating high-quality low-cost data. Perspectives of testing hypotheses about the mechanisms of nutrition-related diseases and interventions in the longitudinal phase are opened with potential use in public health.
385

Diversidade na arquitetura e expressão gênica: uma análise quantitativa de Exon shuffling e splicing alternativo / Diversity in architecture and gene expression: a quantitative analysis of Exon shuffling and alternative splicing

Passetti, Fabio 20 June 2002 (has links)
A função e a arquitetura dos genes está começando a ser elucidada a partir do estudo de genomas completos tanto de procariotos como de eucariotos. Diversos estudos foram ultimamente realizados a respeito de exon shuffling do ponto de vista evolutivo, fenômeno relacionado à origem de novos genes através de recombinações de DNA mediadas por introns. Apesar de eventos de exon shuffling serem responsáveis pelo aumento da modularidade gênica, outros processos foram desenvolvidos ao longo da evolução para que houvesse o aumento da diversidade do proteoma sem a conseqüente expansão dos genomas, sendo splicing alternativo um dos mais freqüentes. Apresentamos nesta dissertação duas extensivas análises: 1) a análise de uma base de dados de genes eucarióticos contendo pelo menos um intron que apresentou excesso de introns de fase 0 e exons simétricos, dados que suportam exon shuffling como um importante mecanismo de evolução gênica. Avaliamos também a confiabilidade de introns preditos por programas de computador através de alinhamento de ESTs; e 2) a análise do uso alternativo de exons (UAE), um tipo de splicing alternativo, em transcritos humanos detectando que cerca de 51% dos genes humanos possuem mais de uma variante de splicing e que este tipo de processamento pós-transcricional parece ser mais freqüentemente encontrado em tecidos tumorais. / Abstract not available.
386

Identificação in-silico de genes humanos submetidos à expressão alélica diferencial / In-silico identification of human genes submitted to allelic differential expression

Souza, Jorge Estefano Santana de 02 December 2008 (has links)
Estudos recentes demonstraram que a variação de expressão alelo-específica é mais comum do que se imaginou, podendo chegar, em humanos, a 50% dos genes. Identificar os genes submetidos ao controle de expressão alelo-específica é muito importante para o entendimento de várias doenças, incluindo o câncer. A identificação dos alvos desse tipo de regulação diferencial é difícil, principalmente devido à dificuldade de se avaliar a expressão de cada alelo individualmente. Neste trabalho, abordamos este problema com uma estratégia de análise in-silico, fundamentada na integração de dados públicos do genoma humano, dados de expressão (como cDNAs, SAGE e MPSS) e dados sobre polimorfismos (SNPs). Desenvolvemos um banco de dados de polimorfismos de base única (Single-Nucleotide Polymorphism - SNPs) associados a etiquetas alternativas de SAGE (Serial Analysis of Gene Expression) e MPSS (massively parallel signature sequencing). SAGE e MPSS são técnicas desenvolvidas para análise da expressão de genes em larga escala. Ambas as técnicas têm como princípio a produção de pequenas seqüências marcadoras (etiquetas), adjacentes aos sítios de enzimas de restrição que estiverem mais próximo da cauda poli-A do RNA mensageiro. Tais etiquetas são seqüenciadas em grande escala e a quantidade de etiquetas é usada para medir a abundância relativa dos RNAs mensageiros correspondentes. A presença de SNPs nos sítios de restrição ou nas seqüências das etiquetas pode gerar etiquetas distintas para alelos do mesmo gene, que denominamos etiquetas alternativas. Neste trabalho, empregamos o banco de dados de etiquetas alternativas associadas a SNPs para identificar genes com expressão alélica diferencial. Usando esta estratégia, identificamos 812 genes com expressão monoalélica, Estudos anteriores comprovaram que, dentre os 812 genes identificados, cinco estão sujeitos ao fenômeno de imprinting genômico. Durante o decorrer deste estudo, trabalhos realizados por outros grupos apontaram outros 73 genes do nosso repertório como genes que apresentam variação no nível de expressão dos alelos em heterozigotos. Com objetivo de confirmar a expressão alélica diferencial dos nossos candidatos, selecionamos 29 genes para validação experimental. Para 12 destes genes não achamos indivíduos heterozigotos, impossibilitando a análise da expressão dos alelos. Dentre os outros 17 genes, três apresentaram expressão bialélica e 14 apresentaram expressão alélica diferencial nos indivíduos heterozigotos, sendo que 3 deles apresentaram expressão monoalélica. Estes resultados sugerem que nossa estratégia pode contribuir significativamente na identificação de genes com expressão alélica diferencial. / Recent studies have shown that variation of allelic-specific gene expression is more common than previously thought, reaching up to 50% of human genes. To identify genes displaying differential expression among alleles it is important for the understanding of several diseases, including the cancer. Identification of genes submitted to allelic-specific differential expression is hard, mostly due to the difficulty in evaluating the expression levels of each allele independently. In this work, we developed an in-silico approach, based on the integration of public data about the human genome, gene expression data (such as cDNAs, SNPs, SAGE and MPSS) and data on polymorphisms (SNPs). We developed a database of Single Nucleotide Polymorphisms (SNPs) associated to alternative SAGE (Serial Analysis of Gene Expression) and MPSS (Massively Parallel Signature Sequencing) tags. SAGE and MPSS are genome-wide techniques developed for analysis of gene expression. Both techniques rely on the production of short marker sequences (known as tags), adjacent to restriction sites closer to the poly-A tail of messenger RNAs. Such tags are sequenced in a large scale and tag counts are used to measure the relative abundance of their corresponding transcripts. The presence of SNPs in the restriction sites or in the tag sequences might generate allelic-specific tags for the same gene, which we call alternative tags. In this work, we used the database of SNPs and associated alternative tags to identify genes submitted to allelic-specific differential gene expression. Using this approach, we identified 812 genes showing allelic-specific differential gene expression. Previous studies have shown that, among the 812 candidates, five genes are targets for genomic imprinting. While this study was being performed, work done by other groups suggested other 73 genes in our candidates list to have different expression levels for alleles in heterozygous. Aiming to verify whether variations in the expression levels of alleles existed among our candidate genes, we submitted 29 genes for experimental validation. For 12 genes, we couldnt find heterozygous individuals, thus rendering it impossible to ascertain whether the supposed expression variation was true. Among the other 17 genes analyzed, three genes presented bi-allelic expression and 14 genes have shown clear differential expression among alleles, three of the last ones displaying strict mono-allelic expression. These results suggest that our approach may contribute significantly to the identification of genes with allelic-specific differential expression.
387

Estudo do gene EMC2 em câncer de mama: abordagens de bioinformática e funcionais / The study of the EMC2 gene in breast cancer: bioinformatics and functional approaches

Castro, Marcela Motta de 15 June 2018 (has links)
Em mulheres, o câncer de mama é o tipo mais incidente depois do tumor de pele não melanoma e é a principal causa de morte por câncer. Apesar dos avanços já alcançados na caracterização da doença, a busca por novos marcadores moleculares para diagnóstico, tratamento e entendimento molecular da doença é de extrema importância. Estudos em nosso laboratório apontaram a proteína EMC1 (do inglês, Endoplasmic Reticulum Complex 1) como relacionada a propriedades malignas em linhagens celulares de câncer de mama e melanoma, assim como aumento no crescimento tumoral em ensaios in vivo. Despertou-se, então, o interesse em nosso laboratório, no estudo das outras proteínas do complexo EMC. Este estudo atual, busca analisar dados em larga escala do banco TCGA em um painel de 32 tipos tumorais, e aponta associação da expressão de diversas proteínas EMCs a pior sobrevida dos pacientes. O gene EMC2, que se localiza na região cromossômica altamente amplificada em diversos tumores (8q23.1), se destaca pela intensidade de pacientes com superexpressão em câncer de mama (40%). Em linhagens desse tipo tumoral, o knockdown de EMC2 aponta redução na taxa proliferativa, assim como associação à progressão do ciclo celular na fase M, quando feito o protocolo de sincronização utilizando a droga nocodazol. Em conjunto, nossos dados sugerem que o complexo EMC pode favorecer o desenvolvimento de tumores e influenciar em sua malignidade. Além disso, a proteína EMC2 parece apresentar funções relacionadas a proliferação e possivelmente, ciclo celular. / In woman, the breast cancer is the most incidence type after skin tumor non melanoma and it is a main cause of cancer death. Despite the advances already achieved in the disease caracterization, the search for novel molecular biomarkers to diagnostic, treatment and disease knowledge is extremely importante. In vitro approaches pointed Endoplasmic Reticulum Complex 1 (EMC1) involvement in malignant properties in breast cancer and melanoma cell lines, and increase in tumor growth in a in vivo assay. It highlighted the study of the other members of EMC complex. In this study, we used a large-scale database from TCGA in a range of 32 tumoral types, and showed association in EMC expression and poor surviving curve. The EMC2 gene, localized in a high amplified chromosome region in cancer (8q23.1), have a interesting upregulation level in breast cancer (40%). In knockdown EMC2 cell lines, the proliferation is less intense and progression in M phase, in a nocodazole sincronization assay, is impaired. Together, the data suggest that the EMC complex favors the tumour development and the EMC2 protein seens to play a role in proliferation and maybe in cell cycle.
388

Algoritmo híbrido multi-objetivo para predição de estrutura terciária de proteínas / Multi-objective approach to protein tertiary structure prediction

Faccioli, Rodrigo Antonio 12 April 2007 (has links)
Muitos problemas de otimização multi-objetivo utilizam os algoritmos evolutivos para encontrar as melhores soluções. Muitos desses algoritmos empregam as fronteiras de Pareto como estratégia para obter tais soluções. Entretando, conforme relatado na literatura, há a limitação da fronteira para problemas com até três objetivos, podendo tornar seu emprego insatisfatório para os problemas com quatro ou mais objetivos. Além disso, as propostas apresentadas muitas vezes eliminam o emprego dos algoritmos evolutivos, os quais utilizam tais fronteiras. Entretanto, as características dos algoritmos evolutivos os qualificam para ser empregados em problemas de otimização, como já vem sendo difundido pela literatura, evitando eliminá-lo por causa da limitação das fronteiras de Pareto. Assim sendo, neste trabalho se buscou eliminar as fronteiras de Pareto e para isso utilizou a lógica Fuzzy, mantendo-se assim o emprego dos algoritmos evolutivos. O problema escolhido para investigar essa substituição foi o problema de predição de estrutura terciária de proteínas, pois além de se encontrar em aberto é de suma relevância para a área de bioinformática. / Several multi-objective optimization problems utilize evolutionary algorithms to find the best solution. Some of these algoritms make use of the Pareto front as a strategy to find these solutions. However, according to the literature, the Pareto front limitation for problems with up to three objectives can make its employment unsatisfactory in problems with four or more objectives. Moreover, many authors, in most cases, propose to remove the evolutionay algorithms because of Pareto front limitation. Nevertheless, characteristics of evolutionay algorithms qualify them to be employed in optimization problems, as it has being spread out by literature, preventing to eliminate it because the Pareto front elimination. Thus being, this work investigated to remove the Pareto front and for this utilized the Fuzzy logic, remaining itself thus the employ of evolutionary algorithms. The choice problem to investigate this remove was the protein tertiary structure prediction, because it is a open problem and extremely relevance to bioinformatic area.
389

A retrotransposição de mRNAs como fator de variabilidade genética no genoma humano e de outros primatas / The retrotransposition of mRNAs as a factor of genetic variability in the human and other primates genomes

Navarro, Fábio Cassarotti Parronchi 24 September 2014 (has links)
Duplicação genica é uma das principais forças levando a evolução dos genomas eucarioto. O impacto de duplicações gênicas/genômicas vem sendo investigado a muito tempo em humanos e outros primatas. Um segundo mecanismo de duplicação gênica, a retrotransposição baseada em RNA maduros, vem sendo menos estudada devido ao seu potencial menor de gerar cópias funcionais. No entanto, recentemente, publicações descreveram retrocópias funcionais em humanos, roedores e mosca de fruta. Nesta tese, para investigar sobre retrocópias causando variabilidade genética no genoma de primatas, nós desenvolvemos a implementamos os métodos para detectar estas inserções. Utilizando nove genomas e transcriptomas publicamente disponíveis (sete primatas e dois roedores) nós confirmamos um número similar, porém, com origem independente, de retrocópias em primatas e roedores. Nós também encontramos um enriquecimento de retrocópias no genoma de Platyrrhini, possivelmente explicado pela expansão de L1PA7 e L1P3 nestes genomas. Posteriormente, nós analisamos a ortologia de retrocópias no genoma de primatas e encontramos 127 eventos específicos à linhagem humana. Nós também exploramos dados do projeto 1000 Genomes para detectar retrocópias polimórficas (retroCNVs germinativos) e encontramos 17 eventos, presentes no genoma referência humano, mas ausentes em mais de um indivíduo. Similarmente, nós investigamos novas retroduplicações de mRNAs no genoma humano, detectando 21 eventos ausentes do genoma referência. Finalmente, investigamos a existência de retroCNVs somáticos e descrevemos sete possíveis retrocópias somáticas. Apesar de sua possível insignificância, nós encontramos que algumas retrocópias compartilhadas entre todos os primatas, espécie específicas, e polimórficas podem ser expressas per se ou como transcritos quiméricos com genes hospedeiros. Sobretudo, nós encontramos que retrocópias são um fator importante da variabilidade genética inter-espécie, intra-espécie e intra-indivíduo e podem estar influenciando a evolução de mamíferos ao criar reservatórios de duplicações potencialmente funcionais. / Gene duplication is a major driving force of evolution in eukaryotic genome. The impact of gene/genomic duplication has long been investigated in human and other primates. A second mechanism of gene duplication, retrotransposition, which is based on mature RNA, has been traditionally less studied due to their lower potential to generate functional copies. Recently, however, publications described functional retrocopies in humans, murines and drosophila. Here, to gain insights of the genetic variability arising from retrocopies on primate genomes, we developed and implemented the methods to detect these insertions. Using nine publicly available reference genomes and transcriptomes (seven primates and two rodents) we described a similar number independently arisen retrocopies in primates and rodents. We also found an enrichment of retrocopies in Platyrhinni genomes, putatively explained by the expansion of L1PA7 and L1P3 in these genomes. Next, we evaluated the orthology of retrocopies in primate genomes and found 127 events specific to human lineage. We also explored 1000 Genomes Project data to detect polymorphic events (germinative retroCNVs) on human populations and found 17 events, present on the reference genome, absent in more than one individual. Conversely, we also investigated new insertions of mRNA retroduplications in the human genome, detecting 21 events absent to the human reference genome. Finally, we evaluated the existence of somatic retroCNVs and described seven putative somatic retrocopies. Despite their putative insignificance, we found that some of these shared, specie-specific and polymorphic events may be expressed per se and as chimeric transcripts within host genes. Taken together, we found that retrocopies are a great factor of genetic variation interspecie, intraspecie e intraindividual and may be affecting mammal evolution by creating reservoirs of potentially functional duplications
390

Avaliação da resposta imunológica de uma formulação vacinal contra leishmaniose visceral constituída de peptídeos sintéticos da gp63 de leishmania major com predição para MHC-I/MHC-II

Paciello, Maurício Oviedo 27 April 2017 (has links)
A leishmaniose é considerada como uma das seis endemias prioritárias no mundo. Sua gravidade vai depender da espécie contaminante, podendo variar de uma lesão cutânea relativamente branda a uma infecção visceral que pode ser fatal na ausência de tratamento. Atualmente, um dos grandes desafios encontrados nos estudos acerca da crescente urbanização da leishmaniose visceral (LV), é o desenvolvimento de vacinas com elevada eficácia para induzir proteção contra infecção por Leishmania. Neste contexto, o presente estudo teve como objetivo avaliar a resposta imune humoral e celular de uma nova formulação vacinal contra a leishmaniose visceral (VL) usando hamster (Mesocricetus auratus) como modelo experimental. A formulação vacinal foi constituída por dois peptídeos sintéticos da protease gp63 na Leishmania major com alta predição de MHC-I e II. A preparação dos peptídeos teve início com a sua predição, utilizando o software SYFPEITHI, seguida da sintetize química destes, usando a metodologia de fase sólida, segundo o protocolo padrão de Merrifield (1963). A purificação e identificação dos peptídeos foi realizada por meio de cromatografia liquida sob condições de baixa pressão. Nove animais com idade de 4-8 semanas foram selecionados de forma aleatória e dividos em três grupos experimentais: o grupo controle, o grupo imunizado com o adjuvante montanide (ISA) e o grupo imunizado com a associação dos peptideos + ajuvante Montanide (Pep+ISA), cada grupo contendo três animais. Os inóculos dos diferentes grupos experimentais foram administrados via subcutânea em três doses vacinais em intervalos de 14 dias. O grupo controle recebeu 100 μL de solução salina estéril a 0,85%, o grupo ISA recebeu 30 μL do adjuvante oleoso Montanide ISA-61VG diluído em 70 μL de solução salina 0,85% e o grupo Pep+ISA recebeu 30 μL do peptídeo MHC-I + 30 μL do peptídeo MHC-II, emulsionados em 30 μL do adjuvante Montanide ISA-61VG e diluídos em 10 μL de solução salina 0,85%. Seis dias após a última dose da vacina, os animais foram sedados com Clortamina® (50 mg/mL) por via intraperitoneal e o sangue coletado para prosseguir com as análises hematológicas, bioquímicas e sorológica. Após 205 dias da última dose vacinal, os animais foram eutanasiados e seus baços coletados para avaliação da resposta linfoproliferativa. Os resultados bioquímicos demostraram que a composição vacinal não teve ação tóxica, apresentando níveis séricos de ureia, creatinina e das enzimas hepatocelulares dentro das taxas normalidade do funcionamento renal e hepático. A formulação vacinal também exibiu níveis significativos de anticorpos e a existência de memória imunológica, evidenciada pelo aumento da atividade linfoproliferativa nas culturas de esplenócitos, quando comparado o grupo que recebeu a vacina com os demais grupos experimentais. / Leishmaniasis is considered one of the six endemics priority in the world. Its severity will depend on the contaminating species, and may range from a relatively mild cutaneous lesion to a visceral infection that can be fatal in the absence of treatment. Now a days, one of the major challenges encountered in studies of the increasing urbanization of visceral leishmaniasis (VL) is the development of highly effective vaccines to induce protection against Leishmania infection. In this context, the present study aimed to evaluate the humoral and cellular immune response of a new vaccine formulation against visceral leishmaniasis (VL) using hamster (Mesocricetus auratus) as an experimental model. The vaccine formulation consists of two synthetic peptides of the gp63 protease in Leishmania major with high prediction of MHC-I and II. The preparation of the peptides started with their prediction, using SYFPEITHI software, followed by their chemical synthesis, using the solid phase methodology, according to the standard protocol of Merrifield (1963). The peptides’ purification and identification of th was performed by liquid chromatography under low pressure conditions. Nine animals aged 4-8 weeks were randomly selected and divided into three experimental groups: the control group, the group immunized with the adjuvant montanide (ISA) and the group immunized with peptide + adjuvant montanide association (Pep + ISA), each group containing three animals. Inoculations of the different experimental groups were administered subcutaneously at three vaccine doses at 14 day intervals. The control group received 100 μL of 0.85% sterile saline, the ISA group received 30 μL of the Montanide ISA-61VG oily adjuvant diluted in 70 μL of 0.85% saline and the Pep + ISA group received 30 μL of the MHC-I peptide + 30 μL of the MHC-II peptide, emulsified in 30 μL of the Montanide ISA-61VG adjuvant and diluted in 10 μL of 0.85% saline solution. Six days after the last vaccine dose, the animals were sedated with Chlortamine® (50 mg / mL) intraperitoneally and the blood collected to proceed with hematological, biochemical and serological analyzes. After 205 days of the last vaccine dose, the animals were euthanized and their spleens collected for evaluation of the lymphoproliferative response. The biochemical results showed that the vaccine composition had no toxic action, presenting serum levels of urea, creatinine and hepatocellular enzymes within the normal range for renal and hepatic functioning. The vaccine formulation also showed significant levels of antibodies and the existence of immunological memory evidenced by the increase in lymphoproliferative activity in splenocyte cultures, when compared to the group that received the vaccine with the other experimental groups.

Page generated in 0.3458 seconds