• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • 1
  • Tagged with
  • 4
  • 4
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Noninvasive prenatal test for detection of genetic diseases using next-generation sequencing / Teste pré-natal não invasivo para detecção de doenças genéticas utilizando sequenciamento de nova geração

Silva, Carolina Malcher Amorim de Carvalho 09 August 2017 (has links)
Since 2011 the prenatal diagnosis field has undergone a revolution with the introduction of a noninvasive prenatal test (NIPT) for genetic diseases relying on analysis of fetal cell-free DNA present in maternal plasma. Although available in Brazil, we rely on outsourcing the technology developed abroad or the test itself. Therefore, our objective was to develop and implement a comprehensive NIPT using high-coverage targeted next-generation sequencing to: 1) estimate fetal fraction; 2) determine fetal sex; 3) detect trisomy; 4) detect monogenic disease. We developed a robust and accurate model (r2= 0.994, p-value < 2.2e-16) for fetal fraction estimation based on distribution of SNP minor allele fraction (MAF). We used Z-score for fetal sex determination (100% accuracy) and trisomy detection of chromosomes 21 (T21) and 18 (T18), achieving a sensitivity of 100% (95% CI: 63.06% - 100.00%) and a specificity of 98.53% (95% CI: 92.08% - 99.96%) for T21, and 40% (95% CI: 5.27% - 85.34%) and 98.59% (95% CI: 92.40% - 99.96%) for T18. For monogenic disease detection (skeletal dysplasia) we performed variant analysis, with 71% (5/7) of detection rate. To our knowledge, this is the first work to integrate all analysis in one single test, and to perform monogenic disease detection without using parental genotype. We showed in this work that it is possible to implement such techniques in our country, using available resources and/or engaging in collaboration with reference research groups abroad. It shows the potential of developing internal technologies, and applying it to other noninvasive fields, such as cancer and organ rejection diagnostic and monitoring / Desde 2011 a área de diagnóstico pré-natal sofreu uma revolução com a introdução de teste pré-natal não-invasivo (NIPT) de doenças genéticas, que se baseia na análise de DNA fetal livre de células presente no plasma materno. Apesar de estar disponível no Brasil, nós dependemos em terceirizar a tecnologia desenvolvida no exterior, ou o teste em si. Sendo assim, nosso objetivo foi desenvolver e implementar um teste NIPT abrangente utilizando sequenciamento de nova geração de alta cobertura targeted para: 1) estimar fração fetal; 2) determinar sexo fetal; 3) detectar trissomia; 4) detectar doença monogênica. Nós desenvolvemos um modelo robusto e preciso (r2= 0.994, p-value < 2.2e-16) para estimativa de fração fetal baseado na distribuição da fração alélica de SNPs. Nós utilizamos Z-score para determinação de sexo fetal (100% de precisão) e detecção de trissomia dos cromossomos 21 (T21) e 18 (T18), atingindo uma sensibilidade de 100% (95% IC: 63.06% - 100.00%) e especificidade de 98.53% (95% IC: 92.08% - 99.96%) para T21, e 40% (95% IC: 5.27% - 85.34%) e 98.59% (95% IC: 92.40% - 99.96%) para T18. Para detecção de doença monogênica (displasia esquelética) nós realizamos análise de variante, com uma taxa de detecção de 71% (5/7). Até onde sabemos, este é o primeiro trabalho a integrar todas as análises em um único teste, e a realizar detecção de doença monogênica sem utilizar genótipo parental. Nós mostramos neste trabalho que é possível implementar essas técnicas no nosso país, utilizando recursos disponíveis e/ou desenvolvendo colaborações com grupos referência internacionais. Isto demonstra o potencial de desenvolver tecnologias internas, e aplicá-las à outras áreas não-invasivas, como diagnóstico e monitoramento de câncer e rejeição de transplante
2

Abordagem Computacional para Identificar Novos SNVs em Bases de Dados de ESTs / Computational Approach to Identify new SNVs in ESTs Data Set

Rodrigo Guarischi Mattos Amaral de Sousa 08 August 2012 (has links)
Indivíduos não relacionados apresentam apenas 1% de diferenças entre seus genomas. Estas variações ocorrem na forma de substituições, inserções, deleções, rearranjos complexos ou até estruturais. Dentre essas variações, aquelas que apresentam uma frequência populacional acima de 1% são denominadas de polimorfismos. Tais variações são responsáveis por diferenças que vão desde a resposta imunológica até o tratamento com drogas, incluindo sensitividade das células tumorais, níveis de plasma, efeitos colaterais e toxicidade. A forma mais comum de polimorfismo genético entre humanos são os polimorfismo de base única ou Single Nucleotide Polymorphisms (SNPs), sendo mais de 47 milhões descritos no dbSNP, um banco de dados de pequenos polimorfismos do NCBI. No presente estudo, foi estabelecida uma abordagem computacional, com etapas de exclusão de regiões parálogas ou de baixa qualidade, com o objetivo de identificar variantes genéticas em sequências expressas gerados pelo método de Open Reading Frame ESTs (ORESTES) durante o Projeto Genoma Humano do Câncer. Diferentemente de outros softwares de detecção de polimorfismos, a abordagem computacional descrita neste estudo leva em consideração a informação a priori do número de bibliotecas distintas que reportaram a mesma variação. Foram identificadas 1900 mutações (853 sinônimas e 1047 não-sinônimas) presentes em duas ou mais bibliotecas distintas, que foram validados in-silico contra o dbSNP v130. O resultado da análise identificou 901 mutações já descritas no dbSNP (47,42%). Para confirmação da análise, foram selecionadas 10 mutações (6 novas e 4 já presentes no dbSNP) para validação pelo método de High Resolution Melt (HRM), seguido da caracterização por sequenciamento de DNA. Nesse caso, o resultado foi a validação de 50% das mutações selecionadas. A análise de interação protéica, Protein-Protein Interaction (PPI), realizada com as mutações não-sinônimas localizadas em domínios funcionais, revelou redes gênicas mais complexas em tecidos tumorais do que nos tecidos normais. Esta observação ratificou a literatura a respeito da transformação tumorigênica ser desencadeada pela combinação de mutações que ativam uma série de processos biológicos, para isso, afetando genes, vias gênicas e networks de vias gênicas relacionados. Em resumo, o presente estudo descreve uma abordagem computacional eficiente para identificação de mutações em dados de sequências expressas, além de avaliar o papel das mutações na tumorigênese. / Unrelated humans have only 1% of non-simularity in their genome. These variations occur as substitutions, insertions, deletions, or even complex structural rearrangements. Among these variations, those which show a population frequency above 1% are called polymorphisms. Such variations are responsible for differences ranging from the immune response to treatment with drugs, including sensitivity of tumor cells, plasma levels, toxicity and side effects. The most common form of genetic polymorphism among human are Single Nucleotide Polymorphisms (SNPs), with more than 47 million reported in dbSNP, a database of small polymorphisms from NCBI. In this study, we established a computational approach, with steps to exclude low quality and paralogous regions, aiming to identify genetic variants in expressed sequences generated by the method of Open Reading Frame ESTs (ORESTES) for the Human Cancer Genome Project. Unlike other polymorphisms detection softwares, the computational approach described in this study takes into account the a priori information about the number of different libraries that reported the same variation. We identified 1900 mutations (853 synonymous and 1047 nonsynonymous) present in two or more different libraries, these mutations were in-silico validated against the dbSNP V130. The analysis result showed 901 mutations already described in dbSNP (47.42%). To confirm the analysis, we selected 10 mutations (six new and four already present in dbSNP) for validation by the method of High Resolution Melt (HRM), followed by characterization by DNA sequencing. In this case, the result was the validation of 50 % of the selected mutations. The Protein-Protein Interaction analysis (PPI), performed with non-synonymous mutations located in functional domains, showed more complex gene networks in tumor tissues than in normal tissues. This observation confirmed the literature regarding the tumorigenic transformation is triggered by the combination of mutations that activate a number of biological processes, thereby, affecting genes, gene pathways and networks of related gene pathways. In summary, this study describes an efficient computational approach to identify mutations in expressed sequence data, besides to evaluate the role of mutations in tumorigenesis.
3

Abordagem Computacional para Identificar Novos SNVs em Bases de Dados de ESTs / Computational Approach to Identify new SNVs in ESTs Data Set

Sousa, Rodrigo Guarischi Mattos Amaral de 08 August 2012 (has links)
Indivíduos não relacionados apresentam apenas 1% de diferenças entre seus genomas. Estas variações ocorrem na forma de substituições, inserções, deleções, rearranjos complexos ou até estruturais. Dentre essas variações, aquelas que apresentam uma frequência populacional acima de 1% são denominadas de polimorfismos. Tais variações são responsáveis por diferenças que vão desde a resposta imunológica até o tratamento com drogas, incluindo sensitividade das células tumorais, níveis de plasma, efeitos colaterais e toxicidade. A forma mais comum de polimorfismo genético entre humanos são os polimorfismo de base única ou Single Nucleotide Polymorphisms (SNPs), sendo mais de 47 milhões descritos no dbSNP, um banco de dados de pequenos polimorfismos do NCBI. No presente estudo, foi estabelecida uma abordagem computacional, com etapas de exclusão de regiões parálogas ou de baixa qualidade, com o objetivo de identificar variantes genéticas em sequências expressas gerados pelo método de Open Reading Frame ESTs (ORESTES) durante o Projeto Genoma Humano do Câncer. Diferentemente de outros softwares de detecção de polimorfismos, a abordagem computacional descrita neste estudo leva em consideração a informação a priori do número de bibliotecas distintas que reportaram a mesma variação. Foram identificadas 1900 mutações (853 sinônimas e 1047 não-sinônimas) presentes em duas ou mais bibliotecas distintas, que foram validados in-silico contra o dbSNP v130. O resultado da análise identificou 901 mutações já descritas no dbSNP (47,42%). Para confirmação da análise, foram selecionadas 10 mutações (6 novas e 4 já presentes no dbSNP) para validação pelo método de High Resolution Melt (HRM), seguido da caracterização por sequenciamento de DNA. Nesse caso, o resultado foi a validação de 50% das mutações selecionadas. A análise de interação protéica, Protein-Protein Interaction (PPI), realizada com as mutações não-sinônimas localizadas em domínios funcionais, revelou redes gênicas mais complexas em tecidos tumorais do que nos tecidos normais. Esta observação ratificou a literatura a respeito da transformação tumorigênica ser desencadeada pela combinação de mutações que ativam uma série de processos biológicos, para isso, afetando genes, vias gênicas e networks de vias gênicas relacionados. Em resumo, o presente estudo descreve uma abordagem computacional eficiente para identificação de mutações em dados de sequências expressas, além de avaliar o papel das mutações na tumorigênese. / Unrelated humans have only 1% of non-simularity in their genome. These variations occur as substitutions, insertions, deletions, or even complex structural rearrangements. Among these variations, those which show a population frequency above 1% are called polymorphisms. Such variations are responsible for differences ranging from the immune response to treatment with drugs, including sensitivity of tumor cells, plasma levels, toxicity and side effects. The most common form of genetic polymorphism among human are Single Nucleotide Polymorphisms (SNPs), with more than 47 million reported in dbSNP, a database of small polymorphisms from NCBI. In this study, we established a computational approach, with steps to exclude low quality and paralogous regions, aiming to identify genetic variants in expressed sequences generated by the method of Open Reading Frame ESTs (ORESTES) for the Human Cancer Genome Project. Unlike other polymorphisms detection softwares, the computational approach described in this study takes into account the a priori information about the number of different libraries that reported the same variation. We identified 1900 mutations (853 synonymous and 1047 nonsynonymous) present in two or more different libraries, these mutations were in-silico validated against the dbSNP V130. The analysis result showed 901 mutations already described in dbSNP (47.42%). To confirm the analysis, we selected 10 mutations (six new and four already present in dbSNP) for validation by the method of High Resolution Melt (HRM), followed by characterization by DNA sequencing. In this case, the result was the validation of 50 % of the selected mutations. The Protein-Protein Interaction analysis (PPI), performed with non-synonymous mutations located in functional domains, showed more complex gene networks in tumor tissues than in normal tissues. This observation confirmed the literature regarding the tumorigenic transformation is triggered by the combination of mutations that activate a number of biological processes, thereby, affecting genes, gene pathways and networks of related gene pathways. In summary, this study describes an efficient computational approach to identify mutations in expressed sequence data, besides to evaluate the role of mutations in tumorigenesis.
4

Identificação e caracterização de elementos transponíveis da classe II em Colletotrichum graminicola / Identification and characterization of class II transposable elements in Colletotrichum graminicola

Braga, Raíssa Mesquita 31 January 2012 (has links)
Made available in DSpace on 2015-03-26T13:51:56Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1477917 bytes, checksum: 4ab8f5cc2dd481acd067b02bd7abf32d (MD5) Previous issue date: 2012-01-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Colletotrichum is one of the most important genera of plant-pathogenic fungi in the world. The pathogenic species of this genus have hemibiotrophic lifestyle and cause diseases in several economically significant crops. Besides the economic importance, Colletotrichum has great significance as a model system for studying the molecular and cellular bases of fungal pathogenicity. The species C. graminicola, causal agent of corn anthracnose (Zea mays), has rare sexual stage and was the first species of the genus to have its genome completely sequenced. The transposable elements are ubiquitous and constitute a source of new mutations, being an important source of genetic variability. These elements are divided into two classes according to the presence or absence of an RNA intermediate in transposition. Elements of class I transpose via RNA intermediate, while class II elements transpose directly as DNA. The transposable elements can be applied as mutagenic agents aimed at the identification and labeling of genes and in phylogenetic and population studies. Given the importance of transposable elements in the generation of genetic variability and its applications in research, the aim of this study was to identify and characterize the class II transposable elements in the genome of C. graminicola. For this purpose, we used a bioinformatic approach combined with experimental activities. We identified 132 complete sequences of transposable elements in the sequenced genome of C. graminicola, which represent a significant proportion of the genome (0.47%). The elements were classified into six families according to similarity, all elements have characteristics of Tc1-mariner superfamily. Although some of these elements possess putative transposases with conserved DDE domain, all are interrupted by multiple stop codons. None of the elements identified has all the necessary features to be considered an active element. In silico analysis revealed evidence that these sequences are mutated by RIP (repeat point induced mutation) mechanism. TCg1 element was amplified by PCR from a Brazilian isolate and has imperfect terminal inverted repeats and the putative transposase sequence has three conserved domains characteristic of transposases: DDE, CENPB and HTH. However, this sequence is interrupted by stop codons and lacks the initiation codon and termination codon, therefore, is probably inactive. The genomic DNA from 49 different isolates were analyzed by hybridization with a probe derived from the inner region of TCg1 and different profiles were identified. The strategy allowed the efficient identification of a variety of Tc1-Mariner transposable elements degenerated by mutations characteristics of RIP in C. graminicola. It is unlikely that any of the identified elements is autonomous, however, these elements must have an important role in the genetic variability of this fungus. The TCg1 element is present in the genomes of different isolates of C. graminicola and has the potential to be used as a molecular marker in population analyzes. / Colletotrichum é um dos gêneros mais importantes de fungos fitopatogênicos em todo o mundo. As espécies fitopatogênicas desse gênero apresentam ciclo de vida hemibiotrófico e causam doenças em diversas culturas economicamente importantes. Além da importância econômica, Colletotrichum possui grande relevância como um sistema modelo para o estudo das bases celulares e moleculares da patogenicidade fúngica. A espécie Colletotrichum graminicola, agente causal da antracnose do milho (Zea mays), possui ciclo sexual raro e foi a primeira espécie do gênero a ter o seu genoma completamente sequenciado. Os elementos transponíveis são ubíquos e constituem uma fonte de novas mutações, sendo, portanto, uma importante fonte de variabilidade genética. Esses elementos são divididos em duas classes de acordo com a presença ou ausência de um intermediário de RNA na transposição. Os elementos da classe I se transpõem via intermediário de RNA, enquanto os elementos da classe II se transpõem diretamente como DNA. Os elementos transponíveis podem ser utilizados como agentes mutagênicos visando à identificação e etiquetagem de genes e em estudos filogenéticos e populacionais. Tendo em vista a importância dos elementos transponíveis na geração de variabilidade genética e as suas aplicações na pesquisa, o objetivo deste trabalho foi identificar e caracterizar elementos transponíveis da classe II no genoma de C. graminicola. Para tanto, foi utilizada uma abordagem de bioinformática (análises in silico) aliada às atividades experimentais. Foram identificadas 133 sequências completas de elementos transponíveis no genoma sequenciado de C. graminicola, que representam uma proporção relevante do genoma (0,47%). Os elementos foram classificados em 6 famílias de acordo com a identidade e apresentam características da superfamília Tc1-Mariner. Apesar de algumas transposases putativas codificadas por esses elementos possuírem domínio DDE conservado, todas estão interrompidas por vários códons de parada. Nenhum elemento identificado possui todas as características necessárias para um elemento autônomo. A análise in silico revelou evidências de mutações geradas pelo mecanismo de RIP (Mutação de ponto induzida por repetição). O elemento TCg1, amplificado por PCR a partir de um isolado brasileiro de C. graminicola, possui extremidades repetidas invertidas imperfeitas e a sequência putativa da transposase apresenta os três domínios característicos conservados: DDE, HTH e CENPB. Entretanto, essa sequência está interrompida por códons de parada e não foram localizados os códons de iniciação e de terminação, sendo, portanto, provavelmente inativa. O DNA genômico de 49 diferentes isolados foi analisado por hibridização com uma sequência derivada da região interna de TCg1 e apresentaram diferentes perfis. A estratégia utilizada permitiu uma identificação eficiente de uma variedade de elementos transponíveis Tc1-Mariner degenerados por mutações características de RIP em C. graminicola. É improvável que algum dos elementos identificados seja autônomo, entretanto, esses elementos devem possuir um importante papel na variabilidade genética desse fungo. O elemento TCg1 está presente no genoma de diferentes isolados de C. graminicola e possui potencial para ser utilizado como marcador molecular em análises populacionais.

Page generated in 0.0523 seconds