• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 143
  • 8
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 3
  • 1
  • Tagged with
  • 150
  • 150
  • 54
  • 52
  • 34
  • 31
  • 31
  • 24
  • 22
  • 21
  • 20
  • 20
  • 19
  • 19
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
141

Aplicação do sequenciamento de nova geração no diagnóstico molecular de cardiomiopatia hipertrófica / Application of next-generation sequencing in the molecular diagnostics of hypertrophic cardiomyopathy

Oliveira, Théo Gremen Mimary de 13 July 2015 (has links)
Introdução: A cardiomiopatia hipertrófica (CH) é uma doença cardíaca estrutural primária, caracterizada por hipertrofia do ventrículo esquerdo, sem dilatação, geralmente assimétrica e predominantemente septal. Na população geral a prevalência estimada da CH é de 0,2% (1:500), correspondendo a 0,5% de todas as cardiopatias. Atualmente estão descritas mais de 1400 mutações associadas à CH em 20 genes relacionados com os miofilamentos do sarcômero, o disco-Z e o transporte de cálcio, sendo que os três mais associados são os genes MYH7, MYBPC3 e TNNT2, responsáveis por 50% do casos com diagnóstico molecular positivo no Brasil. Dessa forma, o advento de novas tecnologias de sequenciamento de DNA de alta performance promete revolucionar o diagnóstico molecular, tornando mais rápida e barata a identificação de alterações genéticas, impactando positivamente na custo-efetividade do manejo diagnóstico e terapêutico de pacientes e famílias com o diagnóstico de CH. Materiais e Métodos: Noventa e uma amostras de uma casuística de pacientes não relacionados, portadores de CH com diagnóstico molecular prévio para os 3 genes mais associados (19 positivas e 72 negativas) foram utilizadas juntamente com uma amostra referência do HapMap (NA12878) na validação de um pipeline proposto para a identificação de alterações genéticas em um painel com 74 genes associados à cardiomiopatias hereditárias, utilizando a plataforma Ion Torrent PGM. A etapa de chamada de variantes foi testada em dois limiares diferentes de cobertura de sequenciamento (30x e 10x) e três limiares de frequência de alelo variante (35%, 25% e 20%). A amostra NA12878 foi utilizada na aferição de valores de reprodutibilidade intra e inter-ensaio. As amostras da casuística de CH com diagnóstico molecular prévio negativo foram utilizadas na análise de ganho diagnóstico. Eram consideradas alterações potencialmente patogênicas aquelas que apresentassem associação prévia com CH ou classificação deletéria em dois de três algoritmos de predição de impacto funcional (PROVEAN, SIFT, PolyPhen2) e MAF<0,01, se disponível. Resultados: A plataforma de sequenciamento utilizada apresentou desempenho aceitável, gerando em média 165,9 ±13,1 Mb, com um valor médio de 146,9 ± 11,54 Mb acima de PhredQ>=20, por amostra. O valor médio de cobertura de sequenciamento por amostra foi de 250 ± 23,94x, com 95,2% das regiões alvo cobertas pelo menos 10x. A sensibilidade máxima observada para SNVs foi de 96,7% enquanto que para InDels foi 28,5%. Os valores de reprodutibilidade inter e intra-ensaio de 89,5% e 87,3%, respectivamente. Das 72 amostras negativas, 35 puderam ser reclassificadas como positivas, sendo que os dois genes com mais ocorrências de alterações genéticas foram FLNC e TRIM63, ambos já relacionados com CH. Vinte e duas amostras foram reclassificadas como inconclusivas e 15 permaneceram negativas. O ganho diagnóstico foi de 21,5%. Conclusões: A plataforma Ion Torrent PGM apresenta potencial no sequenciamento de genes relacionados à cardiomiopatias hereditárias e o pipeline validado mostrou valores analíticos praticáveis em uma rotina diagnóstica. A utilização do painel genético ampliado se mostrou viável na detecção de alterações genéticas, propiciando uma boa margem de ganho diagnóstico em comparação com o sequenciamento apenas dos três genes mais associados à CH / Introduction: Hypertrophic cardiomyopathy (HCM) is a primary cardiac disease, mainly characterized by unexplained left ventricle hypertrophy, in the absence of dilatation, usually asymmetric and predominantly septal. The estimated prevalence is 1:500 individuals in the general population, corresponding for 0.5% of all cardiac diseases. Up to now, more than 1400 mutations are associated with HCM in 20 genes related with sarcomeric myofibrils, Z-disc and calcium homeostasis, wherein the 3 most associated genes are MYH7, MYBPC3 and TNNT2, accounting for 50% of cases with positive molecular diagnostics in Brazil. Thus, the advent of new high throughput DNA sequencing technologies promise to revolutionize the use of molecular diagnostics, turning the identification of genetic mutations in a fast and cheap practice, increasing the cost-effectiveness of diagnostic and treatment of patients and families with HCM. Materials and Methods: Ninety one samples from an HCM casuistic of unrelated individuals with previous molecular diagnostics for the three most HCM-associated genes (19 positives and 72 negatives) were processed along with a reference HapMap sample (NA12878) in the validation process of a pipeline proposed for the detection of genetic alterations in a genetic panel composed of 74 genes associated with inherited cardiomyopathies, using Ion Torrent PGM platform. The variant call step was tested for two cutoffs of sequencing coverage (30x and 10x) and three cutoffs of variant allele frequency (35%, 25% and 20%). The sample NA12878 was used in the assessment of intra and inter-assay reproducibility. Negative samples from the HCM casuistic were used in the assessment of diagnostic yield. Variants were considered potentially pathogenic if previously described as associated with HCM or if presenting a deleterious score in at least two of three impact prediction algorithms tested (PROVEAN, SIFT and PolyPhen-2) and MAF < 0.01, if available. Results: The chosen next-generation sequencing platform presented an acceptable performance, with a mean throughput of 165,9 ±13,1 Mb, with a mean value of 146,9 ± 11,54 Mb above PhredQ >= 20. Mean sequencing coverage was 250 ± 23,94x, wherein 95.2% of target bases were covered at least 10x. Maximum achieved sensitivity for SNVs was 96.7% while for InDels was 28.5%. Both values of inter and intra-assay reproducibility were 89.5% and 87.3%, respectively. Of all 72 negative samples, 35 were reclassified as positive with the two most frequently mutated genes being FLNC and TRIM63, both already associated with HCM. Twenty two samples were reclassified as inconclusive and 15 remained negatives. Diagnostic yield was 21.5%. Conclusions: Ion Torrent PGM platform presented a feasible potential for the sequencing of inherited cardiomyopathies-associated genes and the designed pipeline presented reliable analytical values for diagnostic use. The expanded panel proved to be a good strategy for the detection of genetic alteration providing a good value of diagnostic yield in comparison with the sequencing of the three most HCM-associated genes alone
142

Resposta imune contra HERV-K em pacientes com câncer de próstata localizado e metastático / Imune response against HERV-K in patients with localized and metastatic prostate cancer

Dzik, Carlos 27 September 2017 (has links)
Objetivo: Retrovirus Endógeno Humano (HERV) compreende ao redor de 8% do genoma humano. Apesar do fato de que em sua maioria são genes não-funcionais devido a processos de mutação ou perda de material genético no processo de retrotransposição, existem evidências do aumento da expressão de HERVs em tecido de câncer de próstata. Nós estudamos e comparamos a imunogenicidade de peptídeos da família HERV em 2 coortes de pacientes com câncer de próstata. Posteriormente examinamos o estado de ativação e senescência linfocitária nestas coortes. Desenho Experimental: Células Mononucleares de Sangue Periférico (CMSP) de 65 pacientes com câncer localizado da próstata em situação de hormônio-sensibilidade e de 24 pacientes com câncer de próstata metastático e em situação de resistência à castração, comparados a um grupo controle de 12 indivíduos normais foram avaliados em relação ao seu estado de resposta imune pela técnica de ELISPOT contra um conjunto de peptídeos derivados dos exons gag e env do gene da família HERV-K HML-2. Como parte de nosso estudo, foi realizado de forma preliminar uma análise genômica in silico de 500 pacientes com câncer de próstata sequenciados e disponíveis para análise pública do banco de dados TCGA, com o objetivo de reforçar o racional de nossa interrogação científica. Além disso , como estudo de correlação, fizemos uma análise por citometria de fluxo da ativação celular de linfócitos T de nossas coortes para determinarmos a imunofenotipagem e ontogenia linfocitária em nossos indivíduos investigados, no momento de nossa pesquisa de sua resposta imune. Resultados: Nossa análise da resposta imune contra peptídeos de HERV-K HML-2 por ELISPOT-Interferon Gama não mostrou nenhum resultado significativo. Nenhum paciente apresentou dados significativos de resposta de acordo com nossos critérios, apesar de nossos dados preliminares de expressão gênica terem mostrado expressão gênica em torno de 17% em pacientes com doença localizada. Nossos dados de ativação linfocitária mostraram maior ativação e senescência nos pacientes com doença disseminada e resistente à castração. Conclusões: Este parece ser o primeiro estudo a interrogar a presença de resposta celular imune contra peptídeos de HERV-K em pacientes com câncer de próstata. Nosso achados não mostraram resposta imune relevante em doença localizada ou disseminada e em diferentes estados de ativação linfocitária ou status de integridade hormonal. Apesar destes resultados, pesquisa posterior poderia utilizar diferente metodologia, como por exemplo a utilização de citometria de fluxo bem como a busca de diferentes citoquinas envolvidas, tais como as relacionadas a resposta Th2, ao invés de Th1 / Purpose: Human Endogenous Retrovirus (HERV) comprises 8% of human genome. Despite the fact that most of it is non-functional due to mutations or loss of genetic material in the process of retrotransposition, there are some evidence of increased expression of HERV in prostate cancer tissue. We studied the cellular immunogenicity of peptides from HERV-K family in 2 cohorts of prostate cancer patients. Experimental Design: PBMCs from 65 patients with hormone-intact localized prostate cancer and 24 patients with castrate-metastatic disease, matched with 12 normal controls were evaluated for cellular immune response by ELLISPOT against a pool of gag and env peptides from HERV-K family of HML-2 type. As an independent supportive study we did in silico genomic analysis of 500 prostate cancer patients from TCGA database to give another evidence of the prevalence of HERV-K gene expression in prostate cancer genome, reinforcing the rational of our questions. Results: Our analysis of cellular immune response against HERV-K HML-2 peptides by Interferon-gama ELISPOT did not show any meaningful results. No patient showed any minimal criteria of response, despite the fact that in our preliminary genomic analysis we obtained HERV expression in about 17% of a cohort of 500 patients with localized prostate cancer. In regards to the flow cytometry data of the lymphocytes we showed stronger activation and senescence status in the cohort of patients with castration sensitive and resistant disseminated disease, compared to the localized disease cohort. Conclusions: To the authors\'s knowledge this is the first study to look for cellular immune response against peptides derived from coding HERV-K transcripts in prostate cancer patients. Our findings did not show relevant immune response in neither localized nor metastatic castrate prostate cancer patients. Despite those results, further research could continue using different methodology, like flow cytometry as well as looking for different cytokines involved, such as those related to a Th2 response, instead of Th1
143

[en] HEURISTICS FOR THE PROBLEM OF DNA SEQUENCING BY HYBRIDIZATION / [pt] HEURÍSTICAS PARA O PROBLEMA DE SEQÜÊNCIAMENTO DE DNA POR HIBRIDAÇÃO

ERALDO LUIS REZENDE FERNANDES 04 May 2005 (has links)
[pt] O seqüenciamento por hibridação é uma alternativa interessante para a tarefa de seqüenciamento de DNA. Este método ainda está sendo aperfeiçoado e pode superar as técnicas utilizadas em termos de tempo e custo. Uma etapa crucial do método consiste em resolver um problema combinatório que pode ser formulado como um caso especial do problema do caixeiro viajante com coleta de prêmios. Neste trabalho, propõe-se uma nova heurística construtiva multi-partida para resolver este problema. Uma estratégia de aprendizado baseada em uma memória adaptativa e um procedimento de construção de vocabulário são utilizados para melhorar o desempenho da heurística multi-partida. A memória adaptativa é utilizada para intensificar as construções de novas soluções com os elementos que aparecem com uma freqüência maior nas melhores soluções encontradas anteriormente pela heurística multi-partida. O procedimento de construção de vocabulário consiste em construir novas soluções através da combinação de partes comuns a boas soluções. Testes computacionais mostraram que estas duas estratégias aumentam significativamente o desempenho da heurística multi-partida e são particularmente indicadas para problemas de escalonamento nos quais as melhores soluções são na maioria dos casos formadas por blocos de elementos que aparecem juntos com muita freqüência. A heurística proposta supera os resultados dos melhores algoritmos encontrados na literatura, tanto em termos da qualidade das soluções encontradas, como do tempo de computação. / [en] Sequencing by hybridization is an attractive alternative for DNA sequencing. This novel method can be less time and cost consuming than the techniques applied nowadays. A very important step of this method is to solve a combinatorial problem formulated as a special case of the prize-collecting traveling salesman problem. In this work, we propose a new multistart construtive heuristic to solve this problem. A learning strategy based on adaptive memory and a vocabulary building procedure are used to improve the performance of the multistart heuristic. The adaptive memory is used to intensify the construction of new solutions with the elements that appear frequently in the best solutions previously found by the multistart heuristic. The objective of the vocabulary building procedure is to construct new solutions combining parts of good solutions. Computational experiments have shown that these two methods significantly improves the performance of the multistart heuristic and are particularly suitable for scheduling problems whose best solutions are in most cases built by blocks of elements that appear together very often. The proposed heuristic obtains systematically better solutions and is less time consuming than the best algorithms found in the literature.
144

Redes neurais residuais profundas e autômatos celulares como modelos para predição que fornecem informação sobre a formação de estruturas secundárias proteicas / Residual neural networks and cellular automata as protein secondary structure prediction models with information about folding

Pereira, José Geraldo de Carvalho 15 March 2018 (has links)
O processo de auto-organização da estrutura proteica a partir da cadeia de aminoácidos é conhecido como enovelamento. Apesar de conhecermos a estrutura tridimencional de muitas proteínas, para a maioria delas, não possuímos uma compreensão suficiente para descrever em detalhes como a estrutura se organiza a partir da sequência de aminoácidos. É bem conhecido que a formação de núcleos de estruturas locais, conhecida como estrutura secundária, apresenta papel fundamental no enovelamento final da proteína. Desta forma, o desenvolvimento de métodos que permitam não somente predizer a estrutura secundária adotada por um dado resíduo, mas também, a maneira como esse processo deve ocorrer ao longo do tempo é muito relevante em várias áreas da biologia estrutural. Neste trabalho, desenvolvemos dois métodos de predição de estruturas secundárias utilizando modelos com o potencial de fornecer informações mais detalhadas sobre o processo de predição. Um desses modelos foi construído utilizando autômatos celulares, um tipo de modelo dinâmico onde é possível obtermos informações espaciais e temporais. O outro modelo foi desenvolvido utilizando redes neurais residuais profundas. Com este modelo é possível extrair informações espaciais e probabilísticas de suas múltiplas camadas internas de convolução, o que parece refletir, em algum sentido, os estados de formação da estrutura secundária durante o enovelamento. A acurácia da predição obtida por esse modelo foi de ~78% para os resíduos que apresentaram consenso na estrutura atribuída pelos métodos DSSP, STRIDE, KAKSI e PROSS. Tal acurácia, apesar de inferior à obtida pelo PSIPRED, o qual utiliza matrizes PSSM como entrada, é superior à obtida por outros métodos que realizam a predição de estruturas secundárias diretamente a partir da sequência de aminoácidos. / The process of self-organization of the protein structure is known as folding. Although we know the structure of many proteins, for a majority of them, we do not have enough understanding to describe in details how the structure is organized from its amino acid sequence. In this work, we developed two methods for secondary structure prediction using models that have the potential to provide detailed information about the prediction process. One of these models was constructed using cellular automata, a type of dynamic model where it is possible to obtain spatial and temporal information. The other model was developed using deep residual neural networks. With this model it is possible to extract spatial and probabilistic information from its multiple internal layers of convolution. The accuracy of the prediction obtained by this model was ~ 78% for residues that showed consensus in the structure assigned by the DSSP, STRIDE, KAKSI and PROSS methods. Such value is higher than that obtained by other methods which perform the prediction of secondary structures from the amino acid sequence only.
145

Identificação e avaliação da expressão de marcadores moleculares envolvidos na tumorigênese de pulmão.

Henrique, Tiago 05 July 2010 (has links)
Made available in DSpace on 2016-01-26T12:51:36Z (GMT). No. of bitstreams: 1 tiagohenrique_dissert.pdf: 1575194 bytes, checksum: 8271470b67a47a98cbae39ef169a4725 (MD5) Previous issue date: 2010-07-05 / Lung cancer is the most common malignancy in human. The average 5 years survival rate is one of the lowest among aggressive cancers, showing no significant improvement in recent years. When detected early, lung cancer has a good prognosis, but most patients present metastatic disease at the time of diagnostic, which significantly reduces survival rates. Despite all the recent advances in cancer treatment, prognostic of these patients have improved minimally. Objectives: The present study aimed to investigate the molecular profile of non-small cell lung cancer as well as new tumor makers relevant to diagnosis and prognosis of this disease. Methods: Total RNA from frozen surgical tissues was extracted using TRIZOL reagent and RNeasy FFPE kit was used for RNA extraction from formalin fixed, paraffin embedded tissue. Aiming to identify differentially expressed genes involved in lung cancer, we analyzed combined data from normal and tumor SAGE (Serial Analysis of Gene Expression) libraries available in the public domain. Proteome profiling was also analyzed in adenocarcinoma, squamous cell carcinoma and normal surgical margin samples using two-dimensional electrophoresis and mass spectrometry. Results: The statistical analysis of SAGE data indentified a subset of differentially expressed tags between normal surgical margins and adenocarcinoma libraries. Three genes displaying differential regulation in SAGE or proteomic analysis, two up- (COL3A1, CTSB) and one down-regulated (ITGB1) in neoplastic cells, were selected for real-time polymerase chain reaction (PCR) experiments using the same set of samples. Similar to the statistical results, quantitative PCR confirmed the upregulation of COL3A1 and CTSB in carcinomas when compared to tumor free tissues. Conclusion: RNA from frozen and arquived samples is appropriate for amplification experiments by real time PCR, although with lower efficiency among the last ones. Therefore, improved methods of RNA extraction in arquived tissues are suitable for Real Time quantitative RT-PCR, and may be used for gene expression profiling of paraffin embedded tissues from cancer patients. To the best of our knowledge, this is the first study reporting SAGE data analysis in lung cancer. The statistical approach as well as the proteomic evaluation were effective in identifying differentially expressed genes and proteins reportedly involved in cancer development and may be useful to disclose new tumor makers relevant to lung tumorigenesis. / O câncer de pulmão é a neoplasia humana mais comum. As taxas de sobrevida em 5 anos estão entre as mais baixas para tumores agressivos e seus valores não têm mostrado diferenças importantes nos últimos anos. Quando detectado nos estágios precoces, o câncer de pulmão mostra bom prognóstico, mas a maioria dos pacientes apresenta doença metastática no momento do diagnóstico, o que reduz a sobrevida significativamente. Apesar de todo o progresso obtido nos últimos anos em tratamento do câncer, o prognóstico desses pacientes permanece desfavorável. Objetivos: O presente estudo teve como objetivo investigar o perfil molecular de câncer de pulmão de células não pequenas, bem como de novos marcadores tumorais relevantes para diagnóstico e prognóstico dessa doença. Métodos: O RNA total de espécimes cirúrgicos congelados foi extraído pelo método do trizol e o kit RNeasy FFPE foi utilizado para extração de RNA de tecidos fixados em formalina e emblocados em parafina. Com o objetivo de identificar genes diferencialmente expressos envolvidos em câncer de pulmão, dados combinados de bibliotecas SAGE (Serial Analysis of Gene Expression) públicas foram analisados. O perfil protéico foi também avaliado em amostras de adenocarcinoma, carcinoma epidermóide e de margens cirúrgicas normais, utilizando eletroforese bidimensional e espectrometria de massas. Resultados: A análise estatística dos dados de SAGE identificou um conjunto de tags diferencialmente expressas entre as bibliotecas de adenocarcinoma e de margens cirúrgicas. Três genes com expressão alterada na análise de SAGE e de proteômica, dois com níveis elevados (COL3A1, CTSB) e um com nível reduzido (ITGB1) em células neoplásicas, foram selecionados para experimentos de PCR (reação em cadeia da polimerase) em tempo real no mesmo conjunto de amostras. Consistente com os resultados estatísticos, a PCR quantitativa confirmou a expressão elevada de COL3A1 e CTSB em carcinomas quando comparados com o tecido livre de tumor. Conclusão: O RNA de amostras congeladas e arquivadas é adequado para amplificação por PCR em tempo real, embora exiba qualidade mais baixa nessas últimas. Portanto, métodos otimizados para tecidos arquivados permitem análises por PCR quantitativa e podem ser utilizados para avaliação do perfil transcricional de espécimes embebidos em parafina procedentes de pacientes com câncer. Este é aparentemente o primeiro estudo descrevendo a análise de dados de SAGE em câncer de pulmão. As abordagens estatística e proteômica foram efetivas em identificar genes e proteínas diferencialmente expressas envolvidas no desenvolvimento do câncer e podem revelar novos marcadores relevantes para a tumorigênese de pulmão.
146

Caracterização de sítios conformacionais de fosforilação em proteínas / Characterization of phosphorylation conformational sites in proteins

Felipe Augusto Nunes Ferraz 25 April 2016 (has links)
A fosforilação de proteínas é o tipo de modificação pós-traducional mais recorrente nas vias de sinalização, desempenhando papel central numa vasta gama de eventos celulares. Um completo entendimento das circunstâncias que coordenam o evento de fosforilação permanece como um desafio para a ciência, a despeito do crescente número de abordagens e estudos realizados no assunto. Um mecanismo largamente descrito e aceito como essencial para coordenar a fosforilação de proteínas é a existência de sequências de aminoácidos que facilitam a fosforilação, conhecidos como consensos de fosforilação. Nesse modelo, cada proteína quinase reconhece sítios de fosforilação se os mesmos estiverem inseridos em uma sequência específica de resíduos na estrutura primária do substrato. Porém, com o crescente volume de dados sobre fosforilação, é possível notar a existência de sítios que são validados experimentalmente como fosforilados por uma determinada proteína quinase, que não apresentam o consenso de fosforilação. Neste trabalho, foi testada e comprovada a hipótese de que estes sítios de fosforilação sem consenso sequencial apresentam resíduos localizados em regiões da estrutura terciária adjacentes ao sítio de fosforilação, cuja as características estereoquímicas mimetizam um peptídeo substrato contendo o consenso de fosforilação. Para essa avaliação, utilizando substratos da PKA, foi constatado que mais de 90% dos sítios de fosforilação que não apresentam o consenso na estrutura primária, apresentam essa disposição na estrutura terciária. Resíduos distantes na estrutura primária se apresentam próximos espacialmente na estrutura tridimensional, em uma conformação semelhante a de um sítio com o consenso de fosforilação. Com isso nós propomos a existência de sítios conformacionais de fosforilação. Para confirmar que esses sítios conformacionais poderiam ser cruciais no reconhecimento do substrato, foram construídos modelos da interação da proteína quinase com os substratos, visando demonstrar a viabilidade da interação dos resíduos formadores do consenso conformacional com a proteína quinase de maneira análoga a de um substrato com o consenso de fosforilação. Para a comprovação experimental do fenômeno, foi utilizado o modelo de fosforilação da -Tubulina, no qual foi constatada uma fosforilação no resíduo T253 que depende da atuação dos resíduos K163 e K164 para a interação com a proteína quinase, confirmando a coerência do modelo proposto. Diante da novidade da proposta, dos estudos computacionais feitos e da validação conseguida, torna-se clara a relevância de se estudar a estrutura tridimensional dos substratos de fosforilação, não só como uma forma de aprofundar os conhecimentos gerais na área de fosforilação, mas também como uma alternativa com potencial de ser explorada no desenvolvimento de novas tecnologias / Protein phosphorylation is the most frequent type of post-translational modification in signaling pathway, developing a key role in a wide range of cell events. The full understanding of the circumstances that coordinate the phosphorylation event remains a challenge for science, despite the growing number of approaches and studies on the subject. A broadly described and accepted mechanism as essential for the coordination of protein phosphorylation is the existence of amino acids sequences that contribute to phosphorylation occurrence, known as phosphorylation consensus. In this model, each protein kinase is able to recognize phosphorylation sites inserted in a specific sequence on the primary structure. However, as the data about phosphorylation sites increases, it is possible to notice that there are sites that are validated experimentally as phosphorylated by a particular protein kinase, which do not have the consensus phosphorylation. In this work, it was tested and proved that phosphorylation sites without the sequence consensus presents anchors residues, that are close to the phosphorylation site on the tertiary structure, creating a structural conformation that mimics the stereochemical features of a substrate peptide containing the phosphorylation consensus. For this evaluation, using substrates of PKA, it was found that more than 90% of phosphorylation sites that have no consensus on the primary structure, presented this kind of disposition on the tertiary structure. Distant residues in the primary structure are spatially close on the three-dimensional structure, in a conformation similar to a phosphorylation site containing the consensus. Thus we proposed the existence of conformational phosphorylation sites. To confirm that these conformational sites could be crucial in substrate recognition, it was built kinase-substrate models, aiming to demonstrate the feasibility of residues forming the conformational consensus on the substrate to interact with the kinase analogously to a substrate with consensus phosphorylation. For experimental verification of this phenomenon, we used the phosphorylation model of -Tubulin, in which we observed a phosphorylation at residue T253 that depends of residues K163 and K164 to interact with the protein kinase, confirming the consistency of proposed model. Faced with the novelty of the proposal, the computational data and the experimental validation, it becomes clear the importance of studying the three dimensional structure of phosphorylation sites, not only as a way of achieving deeper knowledge on phosphorylation field, but also as a potential prospect to be explored on the development of new technologies
147

Development and application of computational methdologies for Integrated Molecular Systems Biology

Karathia, Hiren Mahendrabhai 30 November 2012 (has links)
L'objectiu del treball presentat en aquesta tesi va ser el desenvolupament i l'aplicació de metodologies computacionals que integren l’anàlisis de informació sobre seqüències proteiques, informació funcional i genòmica per a la reconstrucció, anotació i organització de proteomes complets, de manera que els resultats es poden comparar entre qualsevol nombre d'organismes amb genomes completament seqüenciats. Metodològicament, m'he centrat en la identificació de l'organització molecular dins d'un proteoma complet d'un organisme de referència i comparació amb proteomes d'altres organismes, en espacial, estructural i funcional, el teixit cel • lular de desenvolupament, o els nivells de la fisiologia. La metodologia es va aplicar per abordar la qüestió de la identificació de organismes model adequats per a estudiar diferents fenòmens biològics. Això es va fer mitjançant la comparació d’un conjunt de proteines involucrades en diferents fenòmens biològics en Saccharomyces cerevisiae i Homo sapiens amb els conjunts corresponents d'altres organismes amb genomes. La tesi conclou amb la presentació d'un servidor web, Homol-MetReS, en què s'implementa la metodologia. Homol-MetReS proporciona un entorn de codi obert a la comunitat científica en què es poden realitzar múltiples nivells de comparació i anàlisi de proteomes. / El objetivo del trabajo presentado en esta tesis fue el desarrollo y la aplicación de metodologías computacionales que integran el análisis de la secuencia y de la información funcional y genómica, con el objetivo de reconstruir, anotar y organizar proteomas completos, de tal manera que estos proteomas se puedan comparar entre cualquier número de organismos con genomas completamente secuenciados. Metodológicamente, I centrado en la identificación de organización molecular dentro de un proteoma completo de un organismo de referencia, vinculando cada proteína en que proteoma a las proteínas de otros organismos, de tal manera que cualquiera puede comparar los dos proteomas en espacial, estructural, funcional tejido, celular, el desarrollo o los niveles de la fisiología. La metodología se aplicó para abordar la cuestión de la identificación de organismos modelo adecuados para estudiar diferentes fenómenos biológicos. Esto se hizo comparando conjuntos de proteínas involucradas en diferentes fenómenos biológicos en Saccharomyces cerevisiae y Homo sapiens con los conjuntos correspondientes de otros organismos con genomas completamente secuenciados. La tesis concluye con la presentación de un servidor web, Homol-MetReS, en el que se implementa la metodología. Homol-MetReS proporciona un entorno de código abierto a la comunidad científica en la que se pueden realizar múltiples niveles de comparación y análisis de proteomas. / The aim of the work presented in this thesis was the development and application of computational methodologies that integrate sequence, functional, and genomic information to provide tools for the reconstruction, annotation and organization of complete proteomes in such a way that the results can be compared between any number of organisms with fully sequenced genomes. Methodologically, I focused on identifying molecular organization within a complete proteome of a reference organism and comparing with proteomes of other organisms at spatial, structural, functional, cellular tissue, development or physiology levels. The methodology was applied to address the issue of identifying appropriate model organisms to study different biological phenomena. This was done by comparing the protein sets involved in different biological phenomena in Saccharomyces cerevisiae and Homo sapiens. This thesis concludes by presenting a web server, Homol-MetReS, on which the methodology is implemented. It provides an open source environment to the scientific community on which they can perform multi-level comparison and analysis of proteomes.
148

Aplicação do sequenciamento de nova geração no diagnóstico molecular de cardiomiopatia hipertrófica / Application of next-generation sequencing in the molecular diagnostics of hypertrophic cardiomyopathy

Théo Gremen Mimary de Oliveira 13 July 2015 (has links)
Introdução: A cardiomiopatia hipertrófica (CH) é uma doença cardíaca estrutural primária, caracterizada por hipertrofia do ventrículo esquerdo, sem dilatação, geralmente assimétrica e predominantemente septal. Na população geral a prevalência estimada da CH é de 0,2% (1:500), correspondendo a 0,5% de todas as cardiopatias. Atualmente estão descritas mais de 1400 mutações associadas à CH em 20 genes relacionados com os miofilamentos do sarcômero, o disco-Z e o transporte de cálcio, sendo que os três mais associados são os genes MYH7, MYBPC3 e TNNT2, responsáveis por 50% do casos com diagnóstico molecular positivo no Brasil. Dessa forma, o advento de novas tecnologias de sequenciamento de DNA de alta performance promete revolucionar o diagnóstico molecular, tornando mais rápida e barata a identificação de alterações genéticas, impactando positivamente na custo-efetividade do manejo diagnóstico e terapêutico de pacientes e famílias com o diagnóstico de CH. Materiais e Métodos: Noventa e uma amostras de uma casuística de pacientes não relacionados, portadores de CH com diagnóstico molecular prévio para os 3 genes mais associados (19 positivas e 72 negativas) foram utilizadas juntamente com uma amostra referência do HapMap (NA12878) na validação de um pipeline proposto para a identificação de alterações genéticas em um painel com 74 genes associados à cardiomiopatias hereditárias, utilizando a plataforma Ion Torrent PGM. A etapa de chamada de variantes foi testada em dois limiares diferentes de cobertura de sequenciamento (30x e 10x) e três limiares de frequência de alelo variante (35%, 25% e 20%). A amostra NA12878 foi utilizada na aferição de valores de reprodutibilidade intra e inter-ensaio. As amostras da casuística de CH com diagnóstico molecular prévio negativo foram utilizadas na análise de ganho diagnóstico. Eram consideradas alterações potencialmente patogênicas aquelas que apresentassem associação prévia com CH ou classificação deletéria em dois de três algoritmos de predição de impacto funcional (PROVEAN, SIFT, PolyPhen2) e MAF<0,01, se disponível. Resultados: A plataforma de sequenciamento utilizada apresentou desempenho aceitável, gerando em média 165,9 ±13,1 Mb, com um valor médio de 146,9 ± 11,54 Mb acima de PhredQ>=20, por amostra. O valor médio de cobertura de sequenciamento por amostra foi de 250 ± 23,94x, com 95,2% das regiões alvo cobertas pelo menos 10x. A sensibilidade máxima observada para SNVs foi de 96,7% enquanto que para InDels foi 28,5%. Os valores de reprodutibilidade inter e intra-ensaio de 89,5% e 87,3%, respectivamente. Das 72 amostras negativas, 35 puderam ser reclassificadas como positivas, sendo que os dois genes com mais ocorrências de alterações genéticas foram FLNC e TRIM63, ambos já relacionados com CH. Vinte e duas amostras foram reclassificadas como inconclusivas e 15 permaneceram negativas. O ganho diagnóstico foi de 21,5%. Conclusões: A plataforma Ion Torrent PGM apresenta potencial no sequenciamento de genes relacionados à cardiomiopatias hereditárias e o pipeline validado mostrou valores analíticos praticáveis em uma rotina diagnóstica. A utilização do painel genético ampliado se mostrou viável na detecção de alterações genéticas, propiciando uma boa margem de ganho diagnóstico em comparação com o sequenciamento apenas dos três genes mais associados à CH / Introduction: Hypertrophic cardiomyopathy (HCM) is a primary cardiac disease, mainly characterized by unexplained left ventricle hypertrophy, in the absence of dilatation, usually asymmetric and predominantly septal. The estimated prevalence is 1:500 individuals in the general population, corresponding for 0.5% of all cardiac diseases. Up to now, more than 1400 mutations are associated with HCM in 20 genes related with sarcomeric myofibrils, Z-disc and calcium homeostasis, wherein the 3 most associated genes are MYH7, MYBPC3 and TNNT2, accounting for 50% of cases with positive molecular diagnostics in Brazil. Thus, the advent of new high throughput DNA sequencing technologies promise to revolutionize the use of molecular diagnostics, turning the identification of genetic mutations in a fast and cheap practice, increasing the cost-effectiveness of diagnostic and treatment of patients and families with HCM. Materials and Methods: Ninety one samples from an HCM casuistic of unrelated individuals with previous molecular diagnostics for the three most HCM-associated genes (19 positives and 72 negatives) were processed along with a reference HapMap sample (NA12878) in the validation process of a pipeline proposed for the detection of genetic alterations in a genetic panel composed of 74 genes associated with inherited cardiomyopathies, using Ion Torrent PGM platform. The variant call step was tested for two cutoffs of sequencing coverage (30x and 10x) and three cutoffs of variant allele frequency (35%, 25% and 20%). The sample NA12878 was used in the assessment of intra and inter-assay reproducibility. Negative samples from the HCM casuistic were used in the assessment of diagnostic yield. Variants were considered potentially pathogenic if previously described as associated with HCM or if presenting a deleterious score in at least two of three impact prediction algorithms tested (PROVEAN, SIFT and PolyPhen-2) and MAF < 0.01, if available. Results: The chosen next-generation sequencing platform presented an acceptable performance, with a mean throughput of 165,9 ±13,1 Mb, with a mean value of 146,9 ± 11,54 Mb above PhredQ >= 20. Mean sequencing coverage was 250 ± 23,94x, wherein 95.2% of target bases were covered at least 10x. Maximum achieved sensitivity for SNVs was 96.7% while for InDels was 28.5%. Both values of inter and intra-assay reproducibility were 89.5% and 87.3%, respectively. Of all 72 negative samples, 35 were reclassified as positive with the two most frequently mutated genes being FLNC and TRIM63, both already associated with HCM. Twenty two samples were reclassified as inconclusive and 15 remained negatives. Diagnostic yield was 21.5%. Conclusions: Ion Torrent PGM platform presented a feasible potential for the sequencing of inherited cardiomyopathies-associated genes and the designed pipeline presented reliable analytical values for diagnostic use. The expanded panel proved to be a good strategy for the detection of genetic alteration providing a good value of diagnostic yield in comparison with the sequencing of the three most HCM-associated genes alone
149

Resposta imune contra HERV-K em pacientes com câncer de próstata localizado e metastático / Imune response against HERV-K in patients with localized and metastatic prostate cancer

Carlos Dzik 27 September 2017 (has links)
Objetivo: Retrovirus Endógeno Humano (HERV) compreende ao redor de 8% do genoma humano. Apesar do fato de que em sua maioria são genes não-funcionais devido a processos de mutação ou perda de material genético no processo de retrotransposição, existem evidências do aumento da expressão de HERVs em tecido de câncer de próstata. Nós estudamos e comparamos a imunogenicidade de peptídeos da família HERV em 2 coortes de pacientes com câncer de próstata. Posteriormente examinamos o estado de ativação e senescência linfocitária nestas coortes. Desenho Experimental: Células Mononucleares de Sangue Periférico (CMSP) de 65 pacientes com câncer localizado da próstata em situação de hormônio-sensibilidade e de 24 pacientes com câncer de próstata metastático e em situação de resistência à castração, comparados a um grupo controle de 12 indivíduos normais foram avaliados em relação ao seu estado de resposta imune pela técnica de ELISPOT contra um conjunto de peptídeos derivados dos exons gag e env do gene da família HERV-K HML-2. Como parte de nosso estudo, foi realizado de forma preliminar uma análise genômica in silico de 500 pacientes com câncer de próstata sequenciados e disponíveis para análise pública do banco de dados TCGA, com o objetivo de reforçar o racional de nossa interrogação científica. Além disso , como estudo de correlação, fizemos uma análise por citometria de fluxo da ativação celular de linfócitos T de nossas coortes para determinarmos a imunofenotipagem e ontogenia linfocitária em nossos indivíduos investigados, no momento de nossa pesquisa de sua resposta imune. Resultados: Nossa análise da resposta imune contra peptídeos de HERV-K HML-2 por ELISPOT-Interferon Gama não mostrou nenhum resultado significativo. Nenhum paciente apresentou dados significativos de resposta de acordo com nossos critérios, apesar de nossos dados preliminares de expressão gênica terem mostrado expressão gênica em torno de 17% em pacientes com doença localizada. Nossos dados de ativação linfocitária mostraram maior ativação e senescência nos pacientes com doença disseminada e resistente à castração. Conclusões: Este parece ser o primeiro estudo a interrogar a presença de resposta celular imune contra peptídeos de HERV-K em pacientes com câncer de próstata. Nosso achados não mostraram resposta imune relevante em doença localizada ou disseminada e em diferentes estados de ativação linfocitária ou status de integridade hormonal. Apesar destes resultados, pesquisa posterior poderia utilizar diferente metodologia, como por exemplo a utilização de citometria de fluxo bem como a busca de diferentes citoquinas envolvidas, tais como as relacionadas a resposta Th2, ao invés de Th1 / Purpose: Human Endogenous Retrovirus (HERV) comprises 8% of human genome. Despite the fact that most of it is non-functional due to mutations or loss of genetic material in the process of retrotransposition, there are some evidence of increased expression of HERV in prostate cancer tissue. We studied the cellular immunogenicity of peptides from HERV-K family in 2 cohorts of prostate cancer patients. Experimental Design: PBMCs from 65 patients with hormone-intact localized prostate cancer and 24 patients with castrate-metastatic disease, matched with 12 normal controls were evaluated for cellular immune response by ELLISPOT against a pool of gag and env peptides from HERV-K family of HML-2 type. As an independent supportive study we did in silico genomic analysis of 500 prostate cancer patients from TCGA database to give another evidence of the prevalence of HERV-K gene expression in prostate cancer genome, reinforcing the rational of our questions. Results: Our analysis of cellular immune response against HERV-K HML-2 peptides by Interferon-gama ELISPOT did not show any meaningful results. No patient showed any minimal criteria of response, despite the fact that in our preliminary genomic analysis we obtained HERV expression in about 17% of a cohort of 500 patients with localized prostate cancer. In regards to the flow cytometry data of the lymphocytes we showed stronger activation and senescence status in the cohort of patients with castration sensitive and resistant disseminated disease, compared to the localized disease cohort. Conclusions: To the authors\'s knowledge this is the first study to look for cellular immune response against peptides derived from coding HERV-K transcripts in prostate cancer patients. Our findings did not show relevant immune response in neither localized nor metastatic castrate prostate cancer patients. Despite those results, further research could continue using different methodology, like flow cytometry as well as looking for different cytokines involved, such as those related to a Th2 response, instead of Th1
150

Redes neurais residuais profundas e autômatos celulares como modelos para predição que fornecem informação sobre a formação de estruturas secundárias proteicas / Residual neural networks and cellular automata as protein secondary structure prediction models with information about folding

José Geraldo de Carvalho Pereira 15 March 2018 (has links)
O processo de auto-organização da estrutura proteica a partir da cadeia de aminoácidos é conhecido como enovelamento. Apesar de conhecermos a estrutura tridimencional de muitas proteínas, para a maioria delas, não possuímos uma compreensão suficiente para descrever em detalhes como a estrutura se organiza a partir da sequência de aminoácidos. É bem conhecido que a formação de núcleos de estruturas locais, conhecida como estrutura secundária, apresenta papel fundamental no enovelamento final da proteína. Desta forma, o desenvolvimento de métodos que permitam não somente predizer a estrutura secundária adotada por um dado resíduo, mas também, a maneira como esse processo deve ocorrer ao longo do tempo é muito relevante em várias áreas da biologia estrutural. Neste trabalho, desenvolvemos dois métodos de predição de estruturas secundárias utilizando modelos com o potencial de fornecer informações mais detalhadas sobre o processo de predição. Um desses modelos foi construído utilizando autômatos celulares, um tipo de modelo dinâmico onde é possível obtermos informações espaciais e temporais. O outro modelo foi desenvolvido utilizando redes neurais residuais profundas. Com este modelo é possível extrair informações espaciais e probabilísticas de suas múltiplas camadas internas de convolução, o que parece refletir, em algum sentido, os estados de formação da estrutura secundária durante o enovelamento. A acurácia da predição obtida por esse modelo foi de ~78% para os resíduos que apresentaram consenso na estrutura atribuída pelos métodos DSSP, STRIDE, KAKSI e PROSS. Tal acurácia, apesar de inferior à obtida pelo PSIPRED, o qual utiliza matrizes PSSM como entrada, é superior à obtida por outros métodos que realizam a predição de estruturas secundárias diretamente a partir da sequência de aminoácidos. / The process of self-organization of the protein structure is known as folding. Although we know the structure of many proteins, for a majority of them, we do not have enough understanding to describe in details how the structure is organized from its amino acid sequence. In this work, we developed two methods for secondary structure prediction using models that have the potential to provide detailed information about the prediction process. One of these models was constructed using cellular automata, a type of dynamic model where it is possible to obtain spatial and temporal information. The other model was developed using deep residual neural networks. With this model it is possible to extract spatial and probabilistic information from its multiple internal layers of convolution. The accuracy of the prediction obtained by this model was ~ 78% for residues that showed consensus in the structure assigned by the DSSP, STRIDE, KAKSI and PROSS methods. Such value is higher than that obtained by other methods which perform the prediction of secondary structures from the amino acid sequence only.

Page generated in 0.0643 seconds