1 |
Structural Variant Detection: A Novel ApproachJanuary 2014 (has links)
abstract: Genomic structural variation (SV) is defined as gross alterations in the genome broadly classified as insertions/duplications, deletions inversions and translocations. DNA sequencing ushered structural variant discovery beyond laboratory detection techniques to high resolution informatics approaches. Bioinformatics tools for computational discovery of SVs however are still missing variants in the complex cancer genome. This study aimed to define genomic context leading to tool failure and design novel algorithm addressing this context. Methods: The study tested the widely held but unproven hypothesis that tools fail to detect variants which lie in repeat regions. Publicly available 1000-Genomes dataset with experimentally validated variants was tested with SVDetect-tool for presence of true positives (TP) SVs versus false negative (FN) SVs, expecting that FNs would be overrepresented in repeat regions. Further, the novel algorithm designed to informatically capture the biological etiology of translocations (non-allelic homologous recombination and 3&ndashD; placement of chromosomes in cells –context) was tested using simulated dataset. Translocations were created in known translocation hotspots and the novel&ndashalgorithm; tool compared with SVDetect and BreakDancer. Results: 53% of false negative (FN) deletions were within repeat structure compared to 81% true positive (TP) deletions. Similarly, 33% FN insertions versus 42% TP, 26% FN duplication versus 57% TP and 54% FN novel sequences versus 62% TP were within repeats. Repeat structure was not driving the tool's inability to detect variants and could not be used as context. The novel algorithm with a redefined context, when tested against SVDetect and BreakDancer was able to detect 10/10 simulated translocations with 30X coverage dataset and 100% allele frequency, while SVDetect captured 4/10 and BreakDancer detected 6/10. For 15X coverage dataset with 100% allele frequency, novel algorithm was able to detect all ten translocations albeit with fewer reads supporting the same. BreakDancer detected 4/10 and SVDetect detected 2/10 Conclusion: This study showed that presence of repetitive elements in general within a structural variant did not influence the tool's ability to capture it. This context-based algorithm proved better than current tools even with half the genome coverage than accepted protocol and provides an important first step for novel translocation discovery in cancer genome. / Dissertation/Thesis / Ph.D. Biomedical Informatics 2014
|
2 |
Investigation of Mechanics of Mutation and Selection by Comparative SequencingZody, Michael C., January 2009 (has links)
Diss. (sammanfattning) Uppsala : Uppsala universitet, 2009.
|
3 |
Structural Variation Discovery and Genotyping from Whole Genome Sequencing: Methodology and Applications: A DissertationZhuang, Jiali 15 September 2015 (has links)
A comprehensive understanding about how genetic variants and mutations contribute to phenotypic variations and alterations entails experimental technologies and analytical methodologies that are able to detect genetic variants/mutations from various biological samples in a timely and accurate manner. High-throughput sequencing technology represents the latest achievement in a series of efforts to facilitate genetic variants discovery and genotyping and promises to transform the way we tackle healthcare and biomedical problems. The tremendous amount of data generated by this new technology, however, needs to be processed and analyzed in an accurate and efficient way in order to fully harness its potential. Structural variation (SV) encompasses a wide range of genetic variations with different sizes and generated by diverse mechanisms. Due to the technical difficulties of reliably detecting SVs, their characterization lags behind that of SNPs and indels. In this dissertation I presented two novel computational methods: one for detecting transposable element (TE) transpositions and the other for detecting SVs in general using a local assembly approach. Both methods are able to pinpoint breakpoint junctions at single-nucleotide resolution and estimate variant allele frequencies in the sample. I also applied those methods to study the impact of TE transpositions on the genomic stability, the inheritance patterns of TE insertions in the population and the molecular mechanisms and potential functional consequences of somatic SVs in cancer genomes.
|
4 |
Avaliação do método de sequenciamento de nova geração no diagnóstico genético de neoplasia endócrina múltipla tipo 1 / Evaluation of next generation sequencing in genetic diagnosis of multiple endocrine neoplasia type 1Carvalho, Rafael Arrabaça de 05 October 2016 (has links)
A neoplasia endócrina múltipla tipo 1 (NEM1) é uma doença genética, de herança autossômica dominante, caracterizada pelo desenvolvimento de tumores endócrinos acometendo, principalmente, hipófise, paratireoide e pâncreas/duodeno endócrinos. É causada, principalmente, por mutação germinativa no gene supressor tumoral MEN1 (11q13). A tumorigênese segue o modelo de Knudson (1971). O diagnóstico genético de famílias com NEM1 reconhece os portadores assintomáticos de mutação MEN1, permite o diagnóstico e tratamento precoce de tumores, promove a redução da morbimortalidade relacionada à NEM1 e exclui familiares não portadores de mutação do rastreamento clínico periódico. O diagnóstico genético de NEM1 tem sido realizado por meio da técnica de sequenciamento Sanger. Entretanto, limitações desta técnica a tornam menos custo efetiva, devido a sua reduzida capacidade de geração de dados, que leva a necessidade de obtenção de produtos de PCR de até 700 pb para adequada leitura do sequenciamento. Além disto, condições específicas do gene MEN1, como a ausência de \"hot spots\" mutacionais, levam a necessidade de sequenciamento de toda sua extensão (7Kb) e contribuem para tornar esta técnica laboriosa e dispendiosa. A subdivisão do gene para sequenciamento Sanger pode ocultar informações, principalmente de regiões intrônicas, que podem ser importantes para o desenvolvimento da doença. Tais dificuldades impedem a incorporação do diagnóstico gênico de NEM1 na prática clínica. Desde 2005, estão disponíveis tecnologias denominadas NGS (Next- Generation Sequencing), que consistem em ferramentas para o sequenciamento genético com capacidade aumentada de geração de dados, tornando-as mais atrativas e de melhor custo-benefício. O NGS confere, ainda, maior velocidade ao processo de obtenção de dados e detém a capacidade de realizar a leitura completa do gene, incluindo regiões promotoras e intrônicas. Por isto, torna a leitura mais ampla e informativa, sem desconsiderar aspectos qualitativos. Dentre várias opções de NGS disponíveis, plataformas leves são consideradas mais adequadas para aplicação clínica, destacando-se as plataformas Ion PGM e Illumina MiSeq. Uma forte tendência tem sido mostrada de migração do sequenciamento Sanger para o NGS, incluindo a aplicação da mesma em diagnóstico genético de doenças complexas e de câncer hereditário. Entretanto, não há estudos prévios envolvendo NGS em NEM1. Diante disto, foi avaliado a qualidade desta técnica como método de diagnóstico genético em NEM1 em comparação ao sequenciamento Sanger. Objetivos: validação da técnica de NGS utilizando como parâmetro o sequenciamento Sanger; avaliação da sensibilidade, especificidade e relação custo-benefício do NGS. Para tal, foram analisados 76 casos-índices com diagnóstico clínico de NEM1 na plataforma Illumina MiSeq. As análises foram subdivididas em duas fases. O enriquecimento da região genômica do gene MEN1 foi realizado por meio de PCR longa. Com base nos dados obtidos foi possível aferir 96% de reprodutibilidade entre as diferentes fases do estudo e aproximadamente 99% de precisão para detecção de variantes. Exatidão, sensibilidade e especificidade resultaram em 100%. Não houve falsos-positivos ou negativos. A técnica de NGS também se mostrou mais custo-efetiva do que o sequenciamento Sanger. Este estudo permitiu validar e introduzir esta técnica como ferramenta de diagnóstico gênico de NEM1 para rastreamento genético de casos-índices / The multiple endocrine neoplasia type 1 (MEN1) is a genetic, autossomic and dominant disease and is correlated with the development of endocrine tumors affecting pituitary gland, parathyroid, endocrine pancreas or duodenum. It is mainly caused by a germinative mutation in tumor suppressor gene MEN1 (11q13). The tumorigenesis follow the Knudson\'s model (1971). Genetic diagnosis of families with MEN1 is essential to recognizes asymptomatic mutation carriers, and allows an earlier detection and treatment of tumors leading to a reduction of mortality and morbidity associated to MEN1. Furthermore, it can exclude family members that do not carry mutations from the periodical screening. The genetic diagnosis for MEN1 is held using Sanger sequencing. However, limitations of this technique make it less cost-effective, mostly, the less capacity of data generation that leads to the need of PCR products up to 700 bp to obtain a suitable read. Moreover, specific conditions of the MEN1 gene contributes to make this process more laborious and expensive, like the need to read all gene sequence (7kb) to make a correct analysis due to the absence of \"hot spots\". This way, the need of \"fragmentation\" to allow the sequencing can hide important information to disease development, mostly in introns. These limitations preclude the clinical application of genetic diagnosis of MEN1. Since 2005, new technologies are available; they are called Next Generation Sequencing (NGS) and consist in a new tool that allow the same sequencing, but with a larger data generation capacity, making them more attractive and costeffective. The NGS also gives a higher speed to the process of data acquiring and allows the complete read of gene, including promoters and introns. Therefore, it makes the results more informative, not forgetting quality aspects. Among lot of options of NGS available, lighter platforms are recommended, for example, Ion PGM and Illumina MiSeq. A strong tendency has been shown in order to change the Sanger sequencing to NGS, including clinical application to genetic diagnosis of complex diseases and inherited cancer. However, there is not previous studies evaluating NGS to MEN1 genetic diagnosis. Thus, present study evaluated NGS as a genetic diagnosis method for MEN1, comparing with Sanger sequencing. This study aimed to validate the NGS method using as model the Sanger sequencing and evaluated sensibility, specificity and costeffectiveness of NGS. For this purpose, 76 index-cases with clinical MEN1 diagnosis were analyzed on Illumina MiSeq. Analyzes were divided in two phases. After analyzes, 96% of reproducibility and 99% of precision were calculated. Accuracy, sensibility and specificity were resulted in 100%. There were not falses negatives or positives. NGS showed more cost-effectiveness with lower costs. This study allowed validation of genetic screening of MEN1 indexcases applying NGS platform
|
5 |
Avaliação do método de sequenciamento de nova geração no diagnóstico genético de neoplasia endócrina múltipla tipo 1 / Evaluation of next generation sequencing in genetic diagnosis of multiple endocrine neoplasia type 1Rafael Arrabaça de Carvalho 05 October 2016 (has links)
A neoplasia endócrina múltipla tipo 1 (NEM1) é uma doença genética, de herança autossômica dominante, caracterizada pelo desenvolvimento de tumores endócrinos acometendo, principalmente, hipófise, paratireoide e pâncreas/duodeno endócrinos. É causada, principalmente, por mutação germinativa no gene supressor tumoral MEN1 (11q13). A tumorigênese segue o modelo de Knudson (1971). O diagnóstico genético de famílias com NEM1 reconhece os portadores assintomáticos de mutação MEN1, permite o diagnóstico e tratamento precoce de tumores, promove a redução da morbimortalidade relacionada à NEM1 e exclui familiares não portadores de mutação do rastreamento clínico periódico. O diagnóstico genético de NEM1 tem sido realizado por meio da técnica de sequenciamento Sanger. Entretanto, limitações desta técnica a tornam menos custo efetiva, devido a sua reduzida capacidade de geração de dados, que leva a necessidade de obtenção de produtos de PCR de até 700 pb para adequada leitura do sequenciamento. Além disto, condições específicas do gene MEN1, como a ausência de \"hot spots\" mutacionais, levam a necessidade de sequenciamento de toda sua extensão (7Kb) e contribuem para tornar esta técnica laboriosa e dispendiosa. A subdivisão do gene para sequenciamento Sanger pode ocultar informações, principalmente de regiões intrônicas, que podem ser importantes para o desenvolvimento da doença. Tais dificuldades impedem a incorporação do diagnóstico gênico de NEM1 na prática clínica. Desde 2005, estão disponíveis tecnologias denominadas NGS (Next- Generation Sequencing), que consistem em ferramentas para o sequenciamento genético com capacidade aumentada de geração de dados, tornando-as mais atrativas e de melhor custo-benefício. O NGS confere, ainda, maior velocidade ao processo de obtenção de dados e detém a capacidade de realizar a leitura completa do gene, incluindo regiões promotoras e intrônicas. Por isto, torna a leitura mais ampla e informativa, sem desconsiderar aspectos qualitativos. Dentre várias opções de NGS disponíveis, plataformas leves são consideradas mais adequadas para aplicação clínica, destacando-se as plataformas Ion PGM e Illumina MiSeq. Uma forte tendência tem sido mostrada de migração do sequenciamento Sanger para o NGS, incluindo a aplicação da mesma em diagnóstico genético de doenças complexas e de câncer hereditário. Entretanto, não há estudos prévios envolvendo NGS em NEM1. Diante disto, foi avaliado a qualidade desta técnica como método de diagnóstico genético em NEM1 em comparação ao sequenciamento Sanger. Objetivos: validação da técnica de NGS utilizando como parâmetro o sequenciamento Sanger; avaliação da sensibilidade, especificidade e relação custo-benefício do NGS. Para tal, foram analisados 76 casos-índices com diagnóstico clínico de NEM1 na plataforma Illumina MiSeq. As análises foram subdivididas em duas fases. O enriquecimento da região genômica do gene MEN1 foi realizado por meio de PCR longa. Com base nos dados obtidos foi possível aferir 96% de reprodutibilidade entre as diferentes fases do estudo e aproximadamente 99% de precisão para detecção de variantes. Exatidão, sensibilidade e especificidade resultaram em 100%. Não houve falsos-positivos ou negativos. A técnica de NGS também se mostrou mais custo-efetiva do que o sequenciamento Sanger. Este estudo permitiu validar e introduzir esta técnica como ferramenta de diagnóstico gênico de NEM1 para rastreamento genético de casos-índices / The multiple endocrine neoplasia type 1 (MEN1) is a genetic, autossomic and dominant disease and is correlated with the development of endocrine tumors affecting pituitary gland, parathyroid, endocrine pancreas or duodenum. It is mainly caused by a germinative mutation in tumor suppressor gene MEN1 (11q13). The tumorigenesis follow the Knudson\'s model (1971). Genetic diagnosis of families with MEN1 is essential to recognizes asymptomatic mutation carriers, and allows an earlier detection and treatment of tumors leading to a reduction of mortality and morbidity associated to MEN1. Furthermore, it can exclude family members that do not carry mutations from the periodical screening. The genetic diagnosis for MEN1 is held using Sanger sequencing. However, limitations of this technique make it less cost-effective, mostly, the less capacity of data generation that leads to the need of PCR products up to 700 bp to obtain a suitable read. Moreover, specific conditions of the MEN1 gene contributes to make this process more laborious and expensive, like the need to read all gene sequence (7kb) to make a correct analysis due to the absence of \"hot spots\". This way, the need of \"fragmentation\" to allow the sequencing can hide important information to disease development, mostly in introns. These limitations preclude the clinical application of genetic diagnosis of MEN1. Since 2005, new technologies are available; they are called Next Generation Sequencing (NGS) and consist in a new tool that allow the same sequencing, but with a larger data generation capacity, making them more attractive and costeffective. The NGS also gives a higher speed to the process of data acquiring and allows the complete read of gene, including promoters and introns. Therefore, it makes the results more informative, not forgetting quality aspects. Among lot of options of NGS available, lighter platforms are recommended, for example, Ion PGM and Illumina MiSeq. A strong tendency has been shown in order to change the Sanger sequencing to NGS, including clinical application to genetic diagnosis of complex diseases and inherited cancer. However, there is not previous studies evaluating NGS to MEN1 genetic diagnosis. Thus, present study evaluated NGS as a genetic diagnosis method for MEN1, comparing with Sanger sequencing. This study aimed to validate the NGS method using as model the Sanger sequencing and evaluated sensibility, specificity and costeffectiveness of NGS. For this purpose, 76 index-cases with clinical MEN1 diagnosis were analyzed on Illumina MiSeq. Analyzes were divided in two phases. After analyzes, 96% of reproducibility and 99% of precision were calculated. Accuracy, sensibility and specificity were resulted in 100%. There were not falses negatives or positives. NGS showed more cost-effectiveness with lower costs. This study allowed validation of genetic screening of MEN1 indexcases applying NGS platform
|
6 |
Sequenciamento de nova geração dos pontos de quebra do DNA para investigação dos mecanismos de formação em rearranjos genômicos / Next Generation Sequencing of DNA breakpoints for investigation of formation mechanisms in genomic rearrangementsNovo Filho, Gil Monteiro 25 February 2019 (has links)
Rearranjos genômicos são alterações estruturais na molécula de DNA e podem ser a causa de inúmeras doenças genéticas. O mecanismo gerador dessas alterações é bem variável. Ele pode ser recorrente, por intermédio de low copy repeats (LCRs), resultando num rearranjo causado por recombinação homóloga não-alélica (NAHR), ou não recorrente, ou seja, sem intermédio de um hotspot. Dentre os mecanismo não recorrentes temos: a junção das extremidades não-homólogas (NHEJ - non-homologous end joining) e a junção mediada por micro-homologia (MMEJ - microhomology-mediated end joining), a replicação em série por deslizamento (SRS), a SRS induzida por quebra (BISRS), a replicação induzida pela quebra de DNA por homologia (MMBIR - microhomology-mediated break induced replication), o enrolamento da forquilha de replicação e mudança de molde de DNA (FoSTeS - fork stalling and template switching). A análise dos pontos de quebra dos rearranjos genômicos pode fornecer informações importantes para uma maior compreensão da arquitetura genômica e seu papel na geração das anormalidades estruturais. O objetivo deste trabalho foi sequenciar os pontos de quebra genômicos a fim de identificar o mecanismo formador das alterações encontradas. Para isso, investigamos o panorama estrutural de 10 pacientes por sequenciamento por meio de linked reads (10X Genomics) e sequenciamos os pontos de quebra previamente identificados por array CytoSNP-12 (Illumina) de 12 pacientes com rearranjos genômicos estruturais por utilizando a captura por Nextera Rapid Capture (Illumina). A investigação por linked reads revelou rearranjos estruturais em 5 pacientes, destacando translocações encontradas em dois pacientes, impossíveis de serem detectadas por metodologias de sequenciamento que não envolva long reads. Foi possível sugerir os mecanismos causadores dessas alterações como NHEJ. O sequenciamento após a captura por Nextera foi capaz de identificar elementos que permitiram definir o mecanismo em três pacientes (NAHR E FoSTeS/MMBIR) e sugerir em mais dois pacientes (NHEJ). Com a estratégia utilizada foi possível sequenciar pontos de quebra por meio do flanqueamento das regiões identificadas por array, identificar os elementos genômicos presentes nos pontos de quebra e os mecanismos formadores dessas alterações / Genomic rearrangements are structural changes in the DNA molecule and can be the cause of numerous genetic diseases. The mechanisms that generate these alterations can occur in different ways. It can be recurrent, mediated by low copy repeats (LCRs), resulting in a rearrangement cause by non-alellic homologue recombination (NAHR), or non-recurrent, without a hotspot. Among non-recurrent mechanisms there are: non-homologous end joining (NHEJ), microhomology-mediated end joining (MMEJ), serial replication slippage (SRS), break-induced serial replication slippage (BISRS), microhomology-mediated break induced replication (MMBIR) and fork stalling and template switching (FoSTeS). Analysis of the breakpoints of genomic rearrangements may provide important information for a better understanding of genomic architecture and its role in generating structural abnormalities. The aim of this work was to sequence the genomic breakpoints in order to identify the mechanism that formed the alterations found. To do this, we investigated the genomic structure of 10 patients by linked reads (10X Genomics) sequencing and sequenced the breakpoints previously identified by Illumina CytoSNP-12 array of 12 patients with structural genomic imbalances by using Nextera Rapid Capture (Illumina). The research by linked reads revealed structural rearrangements in 5 patients, highlighting translocations found in two patients, impossible to be detected by sequencing methodologies that did not involve long reads. It was possible to suggest the mechanisms causing these changes as NHEJ. The sequencing after capture by Nextera was able to identify elements that allowed us to determine the formation mechanism in three patients (NAHR and FoSTeS / MMBIR) and to suggest in two patients (NHEJ). With the approach employed here, it was possible to sequencing breakpoints by flanking the regions identified by array, identifying the genomic elements present at breakpoints and the formation mechanisms of the alterations
|
7 |
Algorithms to Resolve Large Scale and Complex StructuralVariants in the Human GenomeHayes, Matthew 23 August 2013 (has links)
No description available.
|
Page generated in 0.1595 seconds