Global ETD Search

1	Modelagem e informatização do processo de análise do sequenciamento de exoma humano / Computational modeling and implementation of the human exome sequencing analysis process Paula, Marcelo Gomes de 11 October 2018 (has links) O sequenciamento de nova geração tornou-se recentemente uma opção economicamente viável para a realização de aconselhamento genético, tendo proporcionado oportunidades sem precedentes para a pesquisa genômica personalizada, uma vez que o sequenciamento permite identificar a presença de variantes patogênicas. O teste genético que permite identificar as variantes patogênicas possui procedimentos laboratoriais como a coleta, preparação e sequenciamento do material e outros computacionais como o alinhamento, anotação e análise do exoma. A despeito do fato de que a grande quantidade de dados gerados no sequenciamento torna a atividade de análise relativamente complexa, esta tem sido realizada de forma manual por pesquisadores e profissionais da saúde, apesar de existir uma variedade de ferramentas computacionais disponíveis para auxiliar a análise e a interpretação de variações genéticas pontuais. Isto acontece porque a maioria destas ferramentas são generalistas, pouco amigáveis e não atendem às necessidades em pesquisa e atendimento clínico, não sendo utilizadas rotineiramente nesses ambientes. A análise manual, por sua vez, caracteriza-se por gerar resultados altamente dependentes tanto do conhecimento do pesquisador quanto da especificidade do procedimento realizado. O presente trabalho tem por objetivo desenvolver a modelagem do processo de análise de exoma, considerando a presença e a interação de diferentes papéis de usuário, num processo padronizado, porém flexível, juntamente com a implementação de uma ferramenta computacional amigável para a execução da análise baseada na modelagem proposta de forma organizada e otimizada, oferecendo suporte a atividades relacionadas à pesquisa e ao atendimento clínico. As análises processadas com a ferramenta também têm seus parâmetros e resultados armazenados e disponibilizados para uso em investigações futuras, possibilitando o compartilhamento do conhecimento para geração de novas descobertas. Nas avaliações realizadas para validação da proposta o modelo e a ferramenta mostram-se eficientes e apresentam boa usabilidade para a realização das análises / New generation sequencing has recently become an economically viable option for genetic counseling and has provided unprecedented opportunities for personalized genomic research since sequencing allows the identification of the presence of pathogenic variants. The genetic test that allows to identify the pathogenic variants has laboratory procedures like the collection, preparation and sequencing of the material and other computational as the alignment, annotation and analysis of the exoma. In spite of the fact that the large amount of data generated in the sequencing makes the analysis activity relatively complex, it has been performed manually by researchers and health professionals, although a variety of computational tools are available to aid analysis and the interpretation of specific genetic variations. This is because most of these tools are generalist, unfriendly and do not meet clinical research and care needs and are not routinely used in these settings. The manual analysis, in turn, is characterized by generating results highly dependent on both the knowledge of the researcher and the specificity of the procedure performed. The present work aims to develop the modeling of the exoma analysis process, considering the presence and interaction of different user roles, in a standardized but flexible process, together with the implementation of a user-friendly computational tool for performing the analysis based in the proposed modeling in an organized and optimized way, supporting activities related to research and clinical care. The analyzes processed with the tool also have their parameters and results stored and made available for use in future investigations, allowing the sharing of knowledge to generate new discoveries. In the evaluations carried out to validate the proposal, the model, and the tool are efficient and have good usability for carrying out the analysis Read more
2	Sequenciamento de nova geração : explorando aplicações clínicas de dados de Targeted Gene Panel e Whole Exome Sequencing Leão, Delva Pereira January 2017 (has links) A tecnologia de sequenciamento de nova geração (next-generation sequencing – NGS) e suas aplicações tem sido cada vez mais utilizada na prática médica para elucidar a base molecular de doenças Mendelianas. Embora seja uma poderosa ferramenta de pesquisa, ainda existe uma importante transição quanto à análise dos dados entre as tecnologias tradicionais de sequenciamento e o NGS. A primeira parte deste trabalho aborda aspectos analíticos envolvidos nesta mudança, com foco na plataforma Ion Torrent Personal Genome Machine. Esta é uma plataforma amplamente utilizada para sequenciar painéis de genes, já que esta aplicação requer menor rendimento de dados. Este trabalho demonstra indicadores adequados para avaliar a qualidade de corridas de sequenciamento e também uma estratégia baseada em valores de profundidade de cobertura para avaliar a performance de amplicons em diferentes cenários. Por outro lado, o NGS permitiu a realização de estudos populacionais em larga escala que estão mudando nossa compreensão sobre as variações genéticas humanas. Um desses exemplos são as mutações até então chamadas de silenciosas, que estão sendo implicadas como causadoras de doenças humanas. A segunda parte deste trabalho investiga a patogenicidade de polimorfismos de núcleotídeo único sinônimos (synonymous single nucleotide polymorphisms – sSNP) baseado em dados públicos obtidos do Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) utilizando o software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) e outros recursos para reunir informações adicionais sobre consequências funcionais visando fornecer um panorama dos efeitos patogênicos de sSNP em mais de 60.000 exomas humanos. Nós demonstramos que de 1,691,045 variantes sinônimas, um total de 26,034 foram classificadas como patogênicas pelo SilVA, com frequência alélica menor que 0,05. Análises funcionais in silico revelaram que as variantes sinônimas patogênicas estão envolvidas em processos biológicos importantes, como regulação celular, metabolismo e transporte. Ao expor um cenário de variações sinônimas patogênicas em exomas humanos, nós concluímos que filtrar sSNP em workflows de priorização é razoável, no entanto em situações específicas os sSNP podem ser considerados. Pesquisas futuras neste campo poderão fornecer uma imagem clara do papel de tais variações em doenças genéticas. / Next-generation sequencing (NGS) technologies and its applications are increasingly used in medicine to elucidate the molecular basis of Mendelian diseases. Although it is a powerful research tool, there is still an important transition regarding data analysis between traditional sequencing techniques and NGS. The first part of this work addresses analytical aspects involved on this switch-over, focusing on the Ion Torrent Personal Genome Machine platform. This is a widely used platform for sequencing gene panels, as this application demands lower throughput of data. We present indicators suitable to evaluate quality of sequencing runs and also a strategy based on depth of coverage values to evaluate amplicon performance on different scenarios. On the other hand, NGS enabled large-scale population studies that are changing our understanding about human genetic variations. One of these examples are the so-called silent mutations, that are being implied as causative of human diseases. The second part of this work investigates the pathogenicity of synonymous single nucleotide polymorphisms (sSNP) based on public data obtained from the Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) using the software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) and other sources to gather additional information about affected protein domains, mRNA folding and functional consequences aiming to provide a landscape of harmfulness of sSNP on more than 60,000 human exomes. We show that from 1,691,045 synonymous variants a total of 26,034 were classified as pathogenic and by SilVA, with allele frequency lower than 0.05. In silico functional analysis revealed that pathogenic synonymous variants found are involved in important biological process, such as cellular regulation, metabolism and transport. By exposing a scenario of pathogenic synonymous variants on human exomes we conclude that filtering out sSNP on prioritization workflows is reasonable, although in some specific cases sSNP should be considered. Future research on this field will provide a clear picture of such variations on genetic diseases. Read more Sequenciamento de nova geração Sequenciamento completo do genoma Sequenciamento de exoma completo
3	Sequenciamento de nova geração : explorando aplicações clínicas de dados de Targeted Gene Panel e Whole Exome Sequencing Leão, Delva Pereira January 2017 (has links) A tecnologia de sequenciamento de nova geração (next-generation sequencing – NGS) e suas aplicações tem sido cada vez mais utilizada na prática médica para elucidar a base molecular de doenças Mendelianas. Embora seja uma poderosa ferramenta de pesquisa, ainda existe uma importante transição quanto à análise dos dados entre as tecnologias tradicionais de sequenciamento e o NGS. A primeira parte deste trabalho aborda aspectos analíticos envolvidos nesta mudança, com foco na plataforma Ion Torrent Personal Genome Machine. Esta é uma plataforma amplamente utilizada para sequenciar painéis de genes, já que esta aplicação requer menor rendimento de dados. Este trabalho demonstra indicadores adequados para avaliar a qualidade de corridas de sequenciamento e também uma estratégia baseada em valores de profundidade de cobertura para avaliar a performance de amplicons em diferentes cenários. Por outro lado, o NGS permitiu a realização de estudos populacionais em larga escala que estão mudando nossa compreensão sobre as variações genéticas humanas. Um desses exemplos são as mutações até então chamadas de silenciosas, que estão sendo implicadas como causadoras de doenças humanas. A segunda parte deste trabalho investiga a patogenicidade de polimorfismos de núcleotídeo único sinônimos (synonymous single nucleotide polymorphisms – sSNP) baseado em dados públicos obtidos do Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) utilizando o software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) e outros recursos para reunir informações adicionais sobre consequências funcionais visando fornecer um panorama dos efeitos patogênicos de sSNP em mais de 60.000 exomas humanos. Nós demonstramos que de 1,691,045 variantes sinônimas, um total de 26,034 foram classificadas como patogênicas pelo SilVA, com frequência alélica menor que 0,05. Análises funcionais in silico revelaram que as variantes sinônimas patogênicas estão envolvidas em processos biológicos importantes, como regulação celular, metabolismo e transporte. Ao expor um cenário de variações sinônimas patogênicas em exomas humanos, nós concluímos que filtrar sSNP em workflows de priorização é razoável, no entanto em situações específicas os sSNP podem ser considerados. Pesquisas futuras neste campo poderão fornecer uma imagem clara do papel de tais variações em doenças genéticas. / Next-generation sequencing (NGS) technologies and its applications are increasingly used in medicine to elucidate the molecular basis of Mendelian diseases. Although it is a powerful research tool, there is still an important transition regarding data analysis between traditional sequencing techniques and NGS. The first part of this work addresses analytical aspects involved on this switch-over, focusing on the Ion Torrent Personal Genome Machine platform. This is a widely used platform for sequencing gene panels, as this application demands lower throughput of data. We present indicators suitable to evaluate quality of sequencing runs and also a strategy based on depth of coverage values to evaluate amplicon performance on different scenarios. On the other hand, NGS enabled large-scale population studies that are changing our understanding about human genetic variations. One of these examples are the so-called silent mutations, that are being implied as causative of human diseases. The second part of this work investigates the pathogenicity of synonymous single nucleotide polymorphisms (sSNP) based on public data obtained from the Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) using the software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) and other sources to gather additional information about affected protein domains, mRNA folding and functional consequences aiming to provide a landscape of harmfulness of sSNP on more than 60,000 human exomes. We show that from 1,691,045 synonymous variants a total of 26,034 were classified as pathogenic and by SilVA, with allele frequency lower than 0.05. In silico functional analysis revealed that pathogenic synonymous variants found are involved in important biological process, such as cellular regulation, metabolism and transport. By exposing a scenario of pathogenic synonymous variants on human exomes we conclude that filtering out sSNP on prioritization workflows is reasonable, although in some specific cases sSNP should be considered. Future research on this field will provide a clear picture of such variations on genetic diseases. Read more Sequenciamento de nova geração Sequenciamento de genoma completo Sequenciamento de exoma completo
4	Identificação de regiões cromossômicas, genes e polimorfismos de DNA associados ao desempenho de equinos de corrida da raça quarto de milha / Identification of chromosomal regions, genes and DNA polymorphisms associated with performance of quarter horse race horses Pereira, Guilherme Luis [UNESP] 28 April 2017 (has links) Submitted by GUILHERME LUÍS PEREIRA null (guipicoia@hotmail.com) on 2017-05-22T14:29:57Z No. of bitstreams: 1 Tese_Guilherme_Luis_Pereira.pdf: 2598868 bytes, checksum: aeb7dc177e4d5e4c0f7a8c7a59a11697 (MD5) / Approved for entry into archive by Luiz Galeffi (luizgaleffi@gmail.com) on 2017-05-23T17:26:30Z (GMT) No. of bitstreams: 1 pereira_gl_dr_jabo.pdf: 2598868 bytes, checksum: aeb7dc177e4d5e4c0f7a8c7a59a11697 (MD5) / Made available in DSpace on 2017-05-23T17:26:30Z (GMT). No. of bitstreams: 1 pereira_gl_dr_jabo.pdf: 2598868 bytes, checksum: aeb7dc177e4d5e4c0f7a8c7a59a11697 (MD5) Previous issue date: 2017-04-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Dentre os equinos selecionados para velocidade, a linhagem de corrida da raça Quarto de Milha se destaca pelo alto desempenho em provas de curtas distâncias, sendo considerados os mais velozes do mundo. Apesar de, no Brasil, o efetivo de animais ser relativamente menor na linhagem de corrida do que nas demais, sua importância econômica é substancial. Tendo em vista o interesse econômico e científico relacionado a esta característica atlética, poucos esforços têm sido realizados para a maior compreensão de seus mecanismos genéticos e fisiológicos. Este trabalho teve como objetivos: 1) realizar a imputação de genótipos em duas vias entre indivíduos de uma amostra populacional relativamente pequena de cavalos de corrida da raça Quarto de Milha genotipados com painéis de 54k ou de 65k, bem como avaliar a acurácia de imputação por meio de simulações; 2) realizar estudo de associação ampla do genoma (GWAS) em cavalos da linhagem de corrida da raça Quarto de Milha por meio da utilização de chips equinos de genotipagem de SNPs, visando a prospecção de regiões cromossômicas, genes e polimorfismos relacionados ao desempenho; 3) analisar exomas de equinos de corrida da raça Quarto de Milha contrastantes para Índice de Velocidade máximo (IV max) em regiões previamente associadas à característica por meio de GWAS, visando a prospecção de polimorfismos gênicos causais, ligados ou em forte desequilíbrio de ligação com o desempenho em corridas. A imputação foi realizada utilizando 116 cavalos genotipados com o arranjo de SNPs de 54k e 233 genotipados com arranjo de 65k. Nas simulações foram escolhidas amostras aleatórias para constituírem as populações imputadas e referências em dois cenários. O cenário A simulou a imputação genótipos na primeira via (65k para 54k) e o cenário B na segunda (54k para 65k). No cenário A foram considerados 113 indivíduos para a população referência e 236 para a imputada, dos quais 116 e 120 foram genotipados com os arranjos de 54k e 65k, respectivamente. No cenário B foram considerados 50 indivíduos para a população referência e 299 para a imputada, dos quais 66 e 233 foram genotipados com os arranjos de 54k e 65k, respectivamente. Com isso, após o controle de qualidade, os painéis de 54k e de 65k contaram com 7.048 e 16.940 marcadores exclusivos, respectivamente. As médias de taxa de concordância para os cenários A e B foram 0,9815 e 0,9751 e para r2 alélico foram 0,9791 e 0,9740, respectivamente. O GWAS foi realizado com base no método single step GBLUP por meio de duas abordagens: ssGWAS1, em que somente efeitos de SNPs são reestimados a cada iteração, e ssGWAS2, em que a cada iteração são reestimados efeitos de SNPs a partir de valores genético genômico (GEBVs) reestimados. Vinte e uma regiões foram encontradas explicando mais que 1% da variância genética total (gVar) da característica índice de velocidade máximo (IV max) para ssGWAS1 e doze parassGWAS2. No total mais de 40% da gVar foi explicada por estas regiões para ssGWAS1 e cerca de 30% para ssGWAS2. Entre os cromossomos que explicaram mais de 1% da variância genética, cinco foram comuns aos dois métodos (ECA 3, 10, 15, 22, 25). Foram identificados 108 genes na primeira abordagem e 59 na segunda. A partir de informações de GEBVs de cada cavalo foram formados dois grupos de animais contrastantes para desempenho em corridas (20 animais de IV max superior e 20 IV max inferior), para ser sequenciados. Foram observadas leituras de boa qualidade para toda extensão das reads sequenciadas (até 100pb) e cobertura média de 43x. Foram identificadas 1.203 variantes (1.105 SNPs e 93 InDels) em 33 regiões de interesse obtidas, anteriormente, por meio de estudo de GWAS, das quais 61,3% não estavam registradas/depositadas no banco de dados de variantes equino. Do total de polimorfismos, 29 (24 SNPs e 5 InDels) foram considerados de importância com base em três abordagens distintas e independentes: escores SIFT classificado como deletério (<0,05), grau de impacto na região consenso de cada polimorfismo, e frequências alélicas diferentes, identificadas pelo teste de Fisher (p< 0,01), entre os grupos de cavalos contrastantes para IV max. Com isso, oito genes descritos como candidatos em trabalhos anteriores (ABCG5, COL11A1, GEN1, SOCS3, MICAL1, SPTBN1, EPB41L3 e SHQ1), e oito genes candidatos novos (AKNA, ARMC2, FKBP15, LHX1, NOL10, TMEM192, ZFP37, FIG4 e HNRNPU) foram relacionados ao desempenho em corridas de cavalos da raça Quarto de Milha. Assim, os resultados obtidos neste trabalho mostraram que o desempenho em corridas na raça Quarto de Milha, dado pelo IV max, é característica quantitativa e que não há ocorrência de major genes. / Among horses selected for speed, the racing line of Quarter Horses is characterized by high performance in sprint races, with these animals being considered the fastest horses in the world. Although in Brazil the effective number of animals in the racing line is relatively smaller compared to the other lines, its economic importance is substantial. Despite economic and scientific interest in this athletic trait, few efforts have been made to better understand the genetic and physiological mechanisms underlying this trait. The objectives of this study were: 1) to perform two-step genotype imputation between individuals in a relatively small population sample of racing Quarter Horses genotyped with the 54k or 65k panel, and to evaluate the accuracy of imputation through simulations; 2) to perform genome-wide association studies (GWAS) in Quarter Horses of the racing line using equine SNP genotyping chips for prospecting chromosome regions, genes and polymorphisms related to performance; 3) analyze exomes and UTRs in regions previously associated with this trait by GWAS in Quarter Horse racehorses with contrasting maximum speed index (SImax), prospecting causal gene polymorphisms that are related to or are in strong linkage disequilibrium with racing performance. Genotypes were imputed using 116 horses genotyped with the 54k SNP array and 233 animals genotyped with the 65k array. For the simulations, random samples were chosen to compose the imputed and reference populations in two scenarios. Scenario A simulated the genotype imputation in the first step (from 65k to 54k) and scenario B in the second step (from 54k to 65k). Thus, after quality control, the 54k and 65k panels contained 7,048 and 16,940 exclusive markers, respectively. The mean concordance rate was 0.9815 and 0.9751 for scenarios A and B, and the mean allelic r2 was 0.9791 and 0.974, respectively. After imputation was performed by the single-step GBLUP method using two approaches: ssGWAS1 in which only SNP effects are recalculated at each iteration, and ssGWAS2 in which SNP effects are recalculated from genomic estimated breeding values (GEBVs) at each iteration. Twenty-one regions that explained more than 1% of the total genetic variance (gVar) in the maximum speed index were identified by ssGWAS1 and 12 by ssGWAS2. More than 40% of gVar was explained by these regions in ssGWAS1 and about 30% in ssGWAS2. Among chromosomes that explained more than 1% of genetic variance, five were common to both methods (ECA 3, 10, 15, 22, 25). A total of 108 genes were identified with the first approach and 59 with the second approach. To exome sequencing, GEBVs were used for the formation of two groups of animals with contrasting racing performance (20 animals with superior SI max and 20 with inferior SI max). Good quality data were obtained throughout the reads sequenced, with an average coverage of 43x. A total of 1,203 variants (1,105 SNPs and 93 InDels) were identified in 33 regions of interest obtained previously by GWAS; of these, 61.3% were not registered/deposited in the horse genomic variant database. Twenty-nine of the polymorphisms (24 SNPs and 5 InDels) were considered to be important based on three different and independent approaches: SIFT scores classified as deleterious (<0.05), degree of impact on the consensus region of each polymorphism, and different allele frequencies identified by Fisher’s exact test (p< 0.01) between the groups of horses with contrasting SImax. Thus, eight genes described as functional and positional candidates in previous studies (ABCG5, COL11A1, GEN1, SOCS3, MICAL1, SPTBN1, EPB41L3, and SHQ1) and eight new candidate genes (AKNA, ARMC2, FKBP15, LHX1, NOL10, TMEM192, ZFP37, FIG4, and HNRNPU), some of them with known function, were related to racing performance in Quarter Horses. Taken together, the present results show that the racing performance of Quarter Horses, given by the maximum speed index, is a quantitative trait and that no major genes exist. Read more Exoma GWAS Imputação de genótipos InDels Índice de velocidade SNPs
5	Identificação de genes de predisposição à síndrome dos carcinomas de mama e tireoide por sequenciamento total do exoma Pinheiro, Maísa January 2016 (has links) Orientador: Silvia Regina Rogatto / Resumo: A identificação de fatores de predisposição e a caracterização de fatores genéticos de risco para odesenvolvimento do câncer são essenciais para o diagnóstico, prognóstico e aconselhamento genéticodos pacientes afetados e seus familiares. Há uma alta incidência de pacientes que possuem carcinomasde mama (CM) e/ou carcinoma de tireoide (CT) e com história familial destes tumores, sugerindo oenvolvimento de gene(s) associado(s) com a predisposição hereditária ao câncer. O objetivo destetrabalho foi investigar a presença de genes de predisposição ao desenvolvimento de CM e CT pormeio do sequenciamento total do exoma, em pacientes que sejam afetados por pelo menos um destestumores e possuam história familial de câncer. Foram incluídas seis pacientes que apresentavam CM,12 com CT e seis com ambos os tumores, todos com história destes tumores em suas famílias. O DNAde sangue periférico foi sequenciado pela plataforma HiSeq 1000 (Illumina). Após análise debioinformática foram identificadas alterações em genes de alta e baixa penetrância comuns e raras. Asalterações raras destes genes foram consideradas como patogênicas quando presentes em pelo menostrês bancos de dados e em até dois indivíduos. A paciente 14 teve diagnóstico de síndrome de Cowdenconfirmado pela presença da mutação p.R233X no gene PTEN. Também foram investigadas outrasalterações em novos genes o que resultou em 911 SNVs (single nucleotide variations), sendo 287 não-sinônimas e 50 alteraç... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The identification of predisposing genes and characterization of genetic risk factors for cancer development are essential for the diagnosis, prognosis and genetic counseling of affected patients and their families. A significant number of patients with breast (BC) and papillary thyroid carcinomas (TC) and family history of these tumors suggest the involvement a hereditary cancer predisposition gene. The aim of this study was to evaluate new predisposing genes related to BC and TC by whole exome sequencing, in patients who are affected by at least one of these tumors and have cancer family history. Six patients with CM, 12 with CT and six with both tumors were included in the study, all of them with family history of these tumors. DNA from peripheral blood sample was sequenced by HiSeq 1000 platform (Illumina). After the bioinformatics analysis, variations in high and lowpenetrance genes were identified; most of them were considered common according to 1000 Genomes and 6500 Exomes. Furthermore, rare variations were described in these genes, which were considered pathogenic in at least three databases and observed in up to two patients. Patient 14 presented the p.R233X mutation in PTEN confirming the diagnosis of Cowden Syndrome. Other genes were investigated in order to characterize new variations related to the phenotype studied. This analysis resulted in 911 SNVs (single nucleotide variations), 287 non-synonymous alterations and 50 rare pathogenic variations (detected in at... (Complete abstract click electronic access below) / Doutor Read more Câncer de mama Câncer de tireoide Síndromes de predisposição ao câncer Sequenciamento do exoma
6	Sequenciamento de nova geração : explorando aplicações clínicas de dados de Targeted Gene Panel e Whole Exome Sequencing Leão, Delva Pereira January 2017 (has links) A tecnologia de sequenciamento de nova geração (next-generation sequencing – NGS) e suas aplicações tem sido cada vez mais utilizada na prática médica para elucidar a base molecular de doenças Mendelianas. Embora seja uma poderosa ferramenta de pesquisa, ainda existe uma importante transição quanto à análise dos dados entre as tecnologias tradicionais de sequenciamento e o NGS. A primeira parte deste trabalho aborda aspectos analíticos envolvidos nesta mudança, com foco na plataforma Ion Torrent Personal Genome Machine. Esta é uma plataforma amplamente utilizada para sequenciar painéis de genes, já que esta aplicação requer menor rendimento de dados. Este trabalho demonstra indicadores adequados para avaliar a qualidade de corridas de sequenciamento e também uma estratégia baseada em valores de profundidade de cobertura para avaliar a performance de amplicons em diferentes cenários. Por outro lado, o NGS permitiu a realização de estudos populacionais em larga escala que estão mudando nossa compreensão sobre as variações genéticas humanas. Um desses exemplos são as mutações até então chamadas de silenciosas, que estão sendo implicadas como causadoras de doenças humanas. A segunda parte deste trabalho investiga a patogenicidade de polimorfismos de núcleotídeo único sinônimos (synonymous single nucleotide polymorphisms – sSNP) baseado em dados públicos obtidos do Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) utilizando o software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) e outros recursos para reunir informações adicionais sobre consequências funcionais visando fornecer um panorama dos efeitos patogênicos de sSNP em mais de 60.000 exomas humanos. Nós demonstramos que de 1,691,045 variantes sinônimas, um total de 26,034 foram classificadas como patogênicas pelo SilVA, com frequência alélica menor que 0,05. Análises funcionais in silico revelaram que as variantes sinônimas patogênicas estão envolvidas em processos biológicos importantes, como regulação celular, metabolismo e transporte. Ao expor um cenário de variações sinônimas patogênicas em exomas humanos, nós concluímos que filtrar sSNP em workflows de priorização é razoável, no entanto em situações específicas os sSNP podem ser considerados. Pesquisas futuras neste campo poderão fornecer uma imagem clara do papel de tais variações em doenças genéticas. / Next-generation sequencing (NGS) technologies and its applications are increasingly used in medicine to elucidate the molecular basis of Mendelian diseases. Although it is a powerful research tool, there is still an important transition regarding data analysis between traditional sequencing techniques and NGS. The first part of this work addresses analytical aspects involved on this switch-over, focusing on the Ion Torrent Personal Genome Machine platform. This is a widely used platform for sequencing gene panels, as this application demands lower throughput of data. We present indicators suitable to evaluate quality of sequencing runs and also a strategy based on depth of coverage values to evaluate amplicon performance on different scenarios. On the other hand, NGS enabled large-scale population studies that are changing our understanding about human genetic variations. One of these examples are the so-called silent mutations, that are being implied as causative of human diseases. The second part of this work investigates the pathogenicity of synonymous single nucleotide polymorphisms (sSNP) based on public data obtained from the Exome Aggregation Consortium (ExAC) (exac.broadinstitute.org/) using the software Silent Variant Analysis (SilVA) (compbio.cs.toronto.edu/silva/) and other sources to gather additional information about affected protein domains, mRNA folding and functional consequences aiming to provide a landscape of harmfulness of sSNP on more than 60,000 human exomes. We show that from 1,691,045 synonymous variants a total of 26,034 were classified as pathogenic and by SilVA, with allele frequency lower than 0.05. In silico functional analysis revealed that pathogenic synonymous variants found are involved in important biological process, such as cellular regulation, metabolism and transport. By exposing a scenario of pathogenic synonymous variants on human exomes we conclude that filtering out sSNP on prioritization workflows is reasonable, although in some specific cases sSNP should be considered. Future research on this field will provide a clear picture of such variations on genetic diseases. Read more Sequenciamento de nova geração Sequenciamento de genoma completo Sequenciamento de exoma completo
7	Aplicação de protocolos e métodos em bioinformática para análise de sequenciamento de exomas humanos = Application of bioinformatics protocols and methods for human exome sequencing analysis / Application of bioinformatics protocols and methods for human exome sequencing analysis Borges, Murilo Guimarães, 1989- 27 August 2018 (has links) Orientador: Iscia Teresinha Lopes Cendes / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas / Made available in DSpace on 2018-08-27T18:55:52Z (GMT). No. of bitstreams: 1 Borges_MuriloGuimaraes_M.pdf: 8164302 bytes, checksum: cc367cbf534276995150e7db644f6e94 (MD5) Previous issue date: 2015 / Resumo: Os avanços técnicos em sequenciamento alcançados em menos de uma década, atrelados ao desenvolvimento e barateamento do sequenciamento de alto desempenho, oferecem-nos a possibilidade de aplicação dessas tecnologias na medicina genômica. Nesse contexto, surge o sequenciamento do exoma humano, constituído das regiões codificantes do genoma, menor que 2% de sua totalidade. O sequenciamento do exoma (WES) se estabelece hoje como uma ferramenta custo-efetiva com a finalidade de identificar variantes de sequência relacionadas a várias doenças humanas. A análise através da bioinformática é essencial para lidar com o alto volume de dados gerados e realizar a ligação entre o experimento biológico e os dados obtidos. Objetivo: Aplicar e avaliar protocolos e aplicações disponíveis na análise dos dados gerados pelo sequenciamento de exomas humanos, bem como aplicar e aperfeiçoar protocolos e aplicações disponíveis para predizer variantes como potencialmente patológicas a partir de dados gerados pelo sequenciamento de exomas humanos. Materiais e métodos: Foram utilizadas as seguintes ferramentas: FastQC, Rqc, BWA, Picard, GATK e VEP. Estas foram então aplicadas às sequências do exoma humano possibilitando a identificação de variações nos perfis de qualidade das sequências, realinhamento local ao redor de inserções e deleções, recalibração da qualidade e posterior chamada das variantes potencialmente envolvidas nos fenótipos em estudo. No intuito de avaliar se a cobertura no exoma sofre variações mediante diferenças técnicas e étnicas, selecionamos amostras do Projeto 1000 Genomas. Resultados: A aplicação de nosso protocolo em 27 amostras WES resultou em gráficos de controle de qualidade pré e pós-alinhamento, que nos permitiram avaliar de modo global os perfis de qualidade destas sequências; realinhamento ao redor de inserções e deleções que ocorreu em mais de 15% da definição do exoma, realinhando mais de 79% das sequências; recalibração da qualidade que nos permitiu minimizar sua variação por ciclo da reação. Das sequências empregadas, 72% foram pareadas ao genoma, contudo 46% se estendem para fora da definição do exoma, com uma cobertura média de 59x para o exoma estendido e 66x para o exoma restrito. Temos que a cobertura para WES possui uma tendência a variar de acordo com a metodologia de captura empregada e ao grupo étnico de onde as amostras foram obtidas. Conclusão: A aplicação de um workflow para interrogação de variantes que considera a qualidade das sequências fornecidas pelo sequenciador, o alinhamento contra o genoma, realinhamento ao redor de regiões sabidamente conhecidas como portadoras de variações, recalibração da qualidade e anotação permitiu identificar variantes de sequência. Além disso, através da cobertura obtida pelo sequenciamento do exoma foi possível perceber diferenças técnicas e populacionais, refletindo que a complexidade do genoma pode interferir na reação de captura das sequências, influenciando na efetividade da técnica empregada / Abstract: The technical advances in sequencing made in less than a decade associated with the development and low costs of high throughput sequencing techniques allow their application in genomic medicine. Therefore, Whole Exome Sequencing (WES), which corresponds to less than 2% of the entire genome, emerges as a cost-effective tool that aims to identify variants related to human diseases. Bioinformatics is fundamental to process the big volume of data and link the obtained results with the biology. Objective: We aim to apply and evaluate protocols and applications designed for WES data analysis on human subjects. We also intend to apply and enhance protocols and applications designed to predict variants as potentially pathological from WES data. Materials and Methods: We used the following tools: FastQC, Rqc, BWA, Picard, GATK e VEP. We applied them to exome data, determining variation in quality profiles, local realignment, quality recalibration and variant calls. We also evaluated whether or not technical and population differences affect the depth profiles of samples from the 1000 Genomes Project. Results: We applied our protocol on 27 samples, resulting in pre and post-alignment quality control charts. Local realignment took place at more than 15% of the exome definition, extending to more than 79% of sequences. Quality recalibration minimized per cycle variation. In total, 72% of the sequences were paired against the genome, nevertheless 46% extended off-target. The mean coverage was 59X for the exome. We also detected that depth tends to vary based on technical and population differences between samples. Conclusion: We applied a variant-calling workflow that accounts for sequence quality, the alignment against the genome, local realignment, quality recalibration and annotation. In addition, we concluded that depth depends on technical and population differences, showing that genomic complexity may interfere with the capturing phase, affecting downstream analyses / Mestrado / Fisiopatologia Médica / Mestre em Ciências Read more Exoma Genomas Biologia computacional Exome Genome Computational biology
8	Análise de diferentes métodos de sequenciamento de larga escala dos genes envolvidos no hipopituitarismo e embriogênese hipofisária / Analysis of different methods of high-throughput sequencing of genes involved in hypopituitarism and pituitary embryogenesis Benedetti, Anna Flavia Figueredo 18 April 2019 (has links) Mutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a ela / Mutations in the genes involved in pituitary embryogenesis have been described related to isolated cases of multiple hormonal deficiency and/or associated with extra-pituitary phenotypes. Mutations found in humans were described in genes involved in pituitary embryogenesis by generating phenotypes knockout animals, serving as the starting point for their search in patients with similar phenotype. This strategy is known as gene candidate search and is performed by the traditional Sanger sequencing technique. In the last decade, with the advancement of new sequencing technologies, several genes have been associated with hypopituitarism, mainly using the exome methodology. However, there is still a large portion of this population without molecular diagnosis, as evidenced by a survey in the literature by Fang et al., This trend was also observed in the outpatient clinic of Developmental Endocrinology of Hospital das Clínicas, where only 14% of the patients had their molecular diagnosis. With this, high throughput sequencing technologies have become a promising tool for the molecular determination of patients\' phenotypes. Therefore, we sequenced the exome of some of our patients, and an analysis of the sequencing quality showed very low coverage regions, which harms the researcher\'s ability to reach a conclusion regarding presence or lack of variants in these regions. Among these regions are the SOX2 and SOX3 genes, which have many variants that are known to cause the phenotype. This work aims to analyze the coverage of the genes involved in pituitary embryogenesis as well as those related to congenital hypopituitarism in four different exome library preparation kits in order to identify the best methodology for a molecular diagnosis of the patients and to determine specific variants of the Brazilian population in the region of interest by searching the ABraOM website. A total of 76 genes were analyzed in a total of 119 samples in three groups: the first group of HapMap samples, the second of a patient with hypopituitarism and his mother, and the third group of random Brazilian samples. The kits used were NimbleGen (Roche), Nextera (Illumina), SureSelect and SureSelect + UTR (Agilent). For this, several bioinformatics programs were used, among them FASTQC, BWA, GATK, Annovar, Qualimap and bedTools. Sequencing quality analysis, as well as the mapping and duplication rate, showed that the samples used presented adequate and similar qualities for the comparison. According to the results obtained in relation to the coverage, the NimbleGen kit shows a drop in its coverage of the genes of interest in relation to its capacity to cover the global exome, something that may be due to the high GC rate in the region of interest, once the capacity of the kit in these regions is not as good as the others. The genes with the worst coverage in all four technologies were the HES5 gene, which despite being part of the pituitary embryology, have no phenotype-related variant in humans, and SOX3 which, despite having very low coverage in NimbleGen, is well covered on SureSelect. This corroborates the analysis of coverage capacity in regions with a high GC rate. In addition to this it was observed that the Brazilian population has 885 unique and exclusive variants. Therefore, we conclude that the Agilent\'s SureSelect kit has the best performance in the region of interest, as well as in the global exome, being recommended for studies in hypopituitarism cohorts, and that the Brazilian population has unique variants inherent to it Read more Biologia Computacional Biologia Molecular Computational Biology Exoma Exome Hipopituitarismo Hypopituitarism Kits de Reagente para Diagnóstico Molecular Biology Reagent Kits Diagnostic Sequenciamento Completo do Exoma Whole exome sequencing
9	Análise de polimorfismos associados ao índice de massa corpórea em uma população urbana / Association of Single Nucleotide Polymorphisms with Index Body Mass in an urban population Ribeiro, Diana Oliveira 28 August 2018 (has links) A obesidade, que atinge uma grande parcela da população mundial é resultado do acumulo excessivo de gordura corporal, podendo afetar gravemente a saúde. É considerada multifatorial, com maior susceptibilidade ao ganho de massa em indivíduo que possuírem maior predisposição genética. Além disso, também está associada a doenças como diabetes, hipertensão, neoplasias e disfunções endócrinas. No Brasil, de acordo com a Organização Mundial de Saúde, cerca de 51,7% da população encontra-se com sobrepeso ou obesa. A literatura mostra que polimorfismos de nucleotídeos único (SNPs) são marcadores frequentemente usados em estudos de associação de doenças complexas, e trabalhos sobre obesidade focados em populações tri-híbridas, tal como é a brasileira, ainda são escassos. Este trabalho buscou identificar um conjunto de SNPs relacionados com o aumento do Índice de Massa Corpórea (IMC) a partir do exoma de ameríndios brasileiros e verificar se o padrão seria o mesmo na coorte de Ribeirão Preto - SP. O projeto desenvolvido foi devidamente aprovado pelo projeto pelo Comitê de Ética (CAAE 74509817.4.0000.5440). Um conjunto de 17 SNPs foi selecionado após o sequenciamento do exoma ameríndio, realizado pelo Dr. João Guerreiro, cada SNP foi validado posteriormente mediante a realização da genotipagem por PCR em tempo real, confirmando as mutações encontradas nos ameríndios. Para a coorte de Ribeirão Preto, utilizamos DNA genômico de 180 indivíduos, sendo 89 normais e 91 obesos, coletados previamente no Sistema Único de Saúde (SUS) por Barbieri et al (2006). A ancestralidade tri-híbrida de 45 indivíduos desses indivíduos foi confirmada por um conjunto de 15 polimorfismos do tipo inserção/deleção (InDels) escolhidos do painel desenvolvido por Santos et al. (2010), demostrando predominância europeia (87%), seguida de ameríndia (9%) e africana (4%). Os 17 SNPs selecionados apresentaram somente mutações sinônimas, onde rs2277552 e rs3731900 tiveram predição de patogenicidade positiva. A frequência do alelo mutante na coorte de Ribeirão Preto variou em função do SNP e da população comparada do banco de dados do Ensembl. A exemplo, rs8133052 exibiu diferença em seus valores quando a população comparada com a coorte de Ribeirão Preto era a total, 50% e 37% respectivamente. A análise de componentes principais (PCA) não foi sensível o bastante para separar o grupo obeso do controle. O teste de associação optou-se pelos modelos dominante e recessivo para todos os SNPs, porém nenhuma correlação foi observada quando o fenótipo observado era a obesidade (IMC>30). Entretanto, rs231591 para o MD e rs1824152 para o MR mostraram valores significativos de proteção para a obesidade central (razão entre cintura e estatura), com odds ratio de 0,27 (p = 0.0013) e 0.37 (p = 0.0056), respectivamente. Uma análise mais refinada considerando a influência do sexo dentro da coorte foi realizada e, dependendo do fenótipo e do sexo observado quatro SNPs (rs1824152, rs3732378, rs231591 e rs744224) apresentaram valores significativos de proteção. Destes três (rs1824152, rs231591 e rs744224) ainda não haviam sido relacionados diretamente com seu caráter protetivo para a obesidade. / Obesity affects a big portion of global population and it results from excessive accumulation of body fat, what can seriously affect health. It is known the obesity is multifactorial, and it will be stronger the greater is the individual genetic predisposition. Besides that, it is associated with many diseases like diabetes, hypertension, neoplasms, and endocrine dysfunctions. In Brazil, according to the World Health Organization, about 51.7% of the population is classified as being overweight or obese. Moreover, the literature shows that molecular markers called Single Nucleotide Polymorphisms (SNPs) are widely used in association studies of complex diseases, like obesity, and there are still few genetic researches whose focus is the obesity in mixed populations such as Brazil\'s. Therefore, after we got the acceptance for this work by the Ethics Committee (CAAE 74509817.4.0000.5440), we looked for a set of SNPs, based the obese Brazilian\'s indigenous exome, related to the increase of the Body Mass Index (BMI) and aimed to verify if that pattern is the same in a cohort of Ribeirão Preto (SP, Brazil). A set of 17 SNPs was selected after the indigenous exome was sequenced by Dr. João Guerreiro and each SNP was posteriorly validated by Real-Time PCR and verified by genotyping of the indigenous samples. For the cohort of Ribeirão Preto (SP), we used genomic DNA obtained from 180 individuals (89 normal-weight and 91 obese) from Sistema Único de Saúde (SUS) of Ribeirão Preto, previously collected by Barbieri (2006). We then confirmed the trihybrid ancestry of 45 individuals from the cohort using a set of 15 Insertion Deletion Polymorphisms (InDels) selected from the panel developed by Santos et al. (2010), what showed to be predominantly European, followed by African and Amerindian, with frequencies of 87%, 9% and 4%, respectively. The 17 SNPs showed synonymous mutations, from which rs2277552 and rs3731900 presented pathogenicity prediction. The cohort mutant allele frequency compared to Ensembl database varied in function of the SNP and the population. For example, rs8133052 varied when total population and the Ribeirão Preto cohort were compared, with 37% and 50%, respectively. The Principal Component Analysis (PCA) was not sensitive enough to separate obese from non-obese. The association test used the dominant and the recessive models for all SNPs, and no correlation was observed for the obese phenotype (IBM>30), independently of the model. However, rs231591 and rs1824152, for dominant and recessive models, in this order, showed values significantly associated to the protection against central obesity (ratio between waist and height), with odds ratio of 0,27 (p = 0,0013) and 0,37 (p = 0,0056), respectively. A more refined analysis of the associated test was realized, considering the influence of sex in the observed phenotype within the cohort. Four SNPs (rs1824152, rs3732378, rs231591 and rs744224) showed significant protection values, depending on the sex and the model adopted. From theses, three SNPs (rs1824152, rs231591 e rs744224) had never been directly associated to protection against obesity. Read more Ancestralidade Ancestrality Exoma Exome Obesidade Obesity População urbana SNP SNP Trihybrid population
10	Estudo genético e molecular de famílias com defeitos de membros / Genetic and molecular studies of families with limb defects Alves, Leandro Ucela 28 September 2016 (has links) O desenvolvimento embrionário dos membros é um processo complexo e dinâmico. É controlado por diversos genes e diversos mecanismos morfogenéticos, muitos dos quais ainda não estão completamente elucidados. O objetivo deste estudo é identificar as alterações genéticas responsáveis por defeitos de membros em quatro famílias brasileiras. A família 1 apresenta três indivíduos com um espectro extremamente variável de displasia ectodérmica, ectrodactilia e fenda labiopalatina, características da síndrome EEC. O gene TP63 foi analisado por sequenciamento de Sanger e foi descoberta uma variante nunca descrita anteriormente, c.1037C>A (p.Ala346Gly), em heterozigose, segregando com o fenótipo. Mutações no gene TP63 já foram associadas com casos da síndrome EEC. Concluímos que a variante no gene TP63 é a responsável pelo quadro clínico de EEC na família. A família 2 incluiu cinco indivíduos afetados por polegar trifalângico. O fenótipo de um dos indivíduos é mais grave e se caracteriza por, além do polegar trifalângico, pela presença de braço direito grosseiramente curto e deformado com dedos hipoplásicos, pé direito malformado com metatarsos hipoplásicos e orelha direita pequena e protuberante. Estudos de mapeamento gênico com arrays de SNPs revelaram Lod scores sugestivos de ligação com 8 regiões cromossômicas distintas. O sequenciamento massivo em paralelo do exoma com a amostra de um dos afetados, seguida da seleção das variantes presentes nas regiões com Lod scores sugestivos, revelou a presença da variante c.410dupG (p.Gly138Argfs&lowast;43) no gene SALL4, a qual nunca havia sido descrita. Mutações no SALL4 que alteram a matriz de leitura já foram associadas com casos da síndrome de Okihiro, a qual é caracterizada por defeitos radiais de membros e anomalia oftalmológica de Duane. A segregação da variante entre os indivíduos afetados foi confirmada por sequenciamento de Sanger. Concluimos que esta variante é responsável pelo quadro clínico da família, a qual apresenta a síndrome de Okihiro, porém sem a anomalia de Duane. A análise de todos os casos descritos com variantes no gene SALL4 sugere que há uma correlação entre defeitos nos membros inferiores e o tamanho reduzido da proteína truncada SALL4. A família 3 apresenta três indivíduos afetados por sindactilia completa com polidactilia pré-axial nas mãos, classificada como sindactilia do tipo IV. O sequenciamento massivo em paralelo do exoma com as amostras de três indivíduos afetados e dois normais não revelou a presença de qualquer alteração genética candidata a explicar o quadro clínico. O estudo do array-CGH revelou uma duplicação de aproximadamente 97 kb no gene LMBR1 abrangendo a região de enhancer (ZRS) do gene SHH. Duplicações no ZRS já foram identificadas em casos de sindactilia do tipo IV. Concluímos que a duplicação no ZRS é responsável pelo quadro. A revisão da literatura sobre os casos com duplicação dessa região sugere uma correlação entre duplicações com tamanho ao redor de 97 kb e o fenótipo clássico de sindactilia do tipo IV. A família 4 apresenta seis indivíduos afetados por uma síndrome relativamente nova descrita por nossa equipe em 2008, a síndrome de Santos. Essa síndrome é caracterizada por aplasia/hipoplasia fibular e anoniquia/hipoplasia ungueal dentre outros defeitos de membros. O estudo de ligação com array de SNP e marcadores de microssatélites, com posterior cálculo de Lod score, indicou duas regiões no cromossomo 3 como candidatas a conter a alteração genética responsável pelo fenótipo. Análise dos genes presentes nessas regiões indicou o gene WNT7A como o principal candidato. Alterações neste gene já foram associadas com a síndrome de Fuhrmann e a AARRS (Al-Awadi&frasl;Raas-Rothschild syndrome), de herança recessiva, as quais apresentam fenótipos correlatos aos presentes na síndrome de Santos. O sequenciamento de Sanger deste gene revelou a presença da variante c.934G>A (p.Gly312Ser), não descrita, em homozigose em cinco dos seis indivíduos afetados da família. O sexto indivíduo afetado é heterozigoto e apresenta fenótipo muito menos grave. Não apresenta qualquer defeito fibular e ungueal, característicos da síndrome. Esse é o primeiro relato de um caso de defeitos de membros como resultado da presença de uma variante em heterozigose no gene WNT7A. O sequenciamento massivo em paralelo do exoma foi realizado com as amostras deste indivíduo e de um dos indivíduos afetados. Contudo, nenhuma outra variante se mostrou candidata a explicar o quadro clínico. Concluímos que a síndrome de Santos é o resultado desta mutação no gene WNT7A. Estudos funcionais in situ baseados na atividade da Luciferase estão em andamento para comprovar o efeito deletério desta variante / Limb development is a complex and dynamic process driven by many different genes and morphogenetic mechanisms. Many of them have not been properly clarified yet. The aim of this study is to identify genetic alterations responsible for limb defects in four Brazilian families. Family 1 includes three individuals affected by an extremely variable phenotype of ectrodactyly, ectodermal dysplasia and cleft lip/palate, and other clinical signs of EEC syndrome. The TP63 gene, associated with this condition, was analyzed through Sanger sequencing and a novel variant, c.1037C>A (p.Ala346Gly), was found; the variant segregated in heterozygous state with the EEC phenotype. Mutations in TP63 gene are already known to be associated with EEC syndrome. Due to the extremely variable phenotype presented by the individuals in the family, the possibility of the mutation c.1037C>G being related to acro-dermato-ungual-lacrimal-tooth (ADULT) syndrome and SHFM cannot be ruled out. Family 2 presents five individuals affected by preaxial polydactyly (triphalangeal thumbs). The phenotype of the proband is more severe, being characterized by triphalangeal thumb, with the following manifestations: grossly shortened and deformed forearm, markedly hypoplastic and appendicular thumb and malformed right foot with hypoplastic metatarsals. Linkage studies by SNP-array pointed to suggestive Lod score values in 8 distinct chromosomal regions. Whole exome sequencing with the sample from one affected individual revealed a novel frameshift variant, c.410dupG (p.Gly138Argfs&lowast;43) in the SALL4 gene. Frameshift mutations in the SALL4 were already associated to Okihiro syndrome, which is characterized by radial limb defects and Duane anomaly. The segregation of the variant among the affected individuals was confirmed by Sanger sequencing. We concluded that this variant is the cause of the clinical signs in the family, which was classified as presenting Okihiro syndrome without Duane anomaly. The review of all clinical cases reported with SALL4 variants indicates a possible correlation between the foot malformation and the reduced size of the SALL4 protein. Family 3 has affected individuals with complete hand syndactyly associated to pre-axial polydactyly (syndactyly type IV). Whole exome sequencing was performed with the samples collected from the three affected individuals and two non-affected ones and no pathogenic variant was detected in genes related to limb development segregating with the phenotype. Through array-CGH, nevertheless, a duplication of about 97 kb including the enhancer (ZRS) of the SHH gene was detected. Duplications in ZRS region were already reported in Syndactyly type IV. We concluded that the 97-kb duplication is the cause of the syndactyly type IV in the family. A review of reported cases (including ours) suggested a possible correlation between the duplication with 97 kb size and the classic phenotype of syndactyly type IV. Family 4 has six individuals affected by a new syndrome (Santos syndrome) described by members of our group in 2008, a condition characterized by fibular agenesis/hipoplasia and ungual hypoplasia&frasl;anonychia, among other limb defects. Linkage study by SNP-array and microsatellite markers was performed and Lod score calculation pointed to two candidate regions on chromosome 3. Search for candidate genes revealed the WNT7A as the best candidate. Mutations in WNT7A gene, in homozygous state, are known to cause two other limb defect syndromes, Fuhrmann syndrome and AARRS (Al-Awadi/Raas-Rothschild syndrome), both presenting similar phenotypes to Santos syndrome. Sanger sequencing showed a novel variant, in homozygous state, c.934G>A (p.Gly312Ser) in the WNT7A gene in five out of six affected individuals. One affected individual, much less severely affected than his relatives, carries the mutation in heterozygous state. He does not present fibular or ungual malformations, characteristic signals of the syndrome; instead, he is the carrier of a complex polydactyly in his left hand. This is the first report about a heterozygous variant in WNT7A gene resulting in limb defect. Whole exome sequencing was performed with the samples from two affected individuals. However, no other variant in candidate gene to explain the limb defects was detected. We concluded that Santos syndrome is caused by a mutation in the WNT7A gene. Functional assays, based on Luciferase activity, are in execution to test the deleterious effect of the c.934G>A variant in the WNT7A gene Read more Defeitos de membros Exome sequency Limb defects SALL4 SALL4 Sequenciamento de exoma SHH SHH TP63 TP63 WNT7A WNT7A

Search results