Mutações nos genes envolvidos na embriogênese hipofisária já foram descritas relacionadas a quadros isolados de deficiência hormonal múltipla e/ou associado a fenótipos extra-pituitários. As mutações encontradas em humanos foram descritas em genes envolvidos na embriogênese hipofisária e cujos fenótipos foram gerados em animais a partir de nocaute, servindo de ponto de partida para sua busca em pacientes com fenótipo similar. Essa estratégia é conhecida como busca por gene candidato, e é feita pela técnica de sequenciamento tradicional Sanger. Na última década, com o avanço de novas tecnologias de sequenciamento, diversos genes foram associados ao hipopituitarismo, principalmente utilizando-se a metodologia de exoma. Contudo, ainda há uma grande parcela dessa população sem diagnóstico molecular, como evidenciado em um levantamento na literatura por Fang e colaboradores e cuja tendência foi observada no ambulatório de Endocrinologia do Desenvolvimento do Hospital das Clínicas, onde apenas 14% dos pacientes tiveram o seu diagnóstico molecular determinado. Com isso, as tecnologias de sequenciamento de última geração, passaram a ser uma ferramenta promissora para determinação molecular dos fenótipos dos pacientes. Logo, alguns pacientes em seguimento no ambulatório de endocrinologia do desenvolvimento tiveram o exoma sequenciado, e uma análise das métricas do sequenciamento evidenciou regiões de cobertura muito baixa, o que não permitiu a conclusão sobre a presença ou ausência de variantes nessas regiões. Entre essas regiões estão os genes SOX2 e SOX3, os quais possuem variantes conhecidas causadoras do fenótipo. Esse trabalho tem como objetivo analisar a cobertura dos genes envolvidos na embriogênese hipofisária assim como os relacionados ao hipopituitarismo congênito em quatro diferentes kits de preparação de biblioteca para exoma, a fim de identificar a melhor metodologia para um diagnóstico molecular dos pacientes alem determinar variantes especificas da população brasileira na região de interesse através de busca no site ABraOM. Foram analisados 76 genes em um total de 119 amostras separadas em três grupos, sendo o primeiro grupo de amostras HapMap, o segundo de um paciente com hipopituitarismo e sua mãe e o terceiro de amostras brasileiras aleatórias. Os kits utilizados foram NimbleGen (Roche), Nextera (Illumina), SureSelect e SureSelect+UTR (Agilent). Para isso, foram utilizados diversos programas de bioinformática, tendo entre eles o FASTQC, BWA, GATK, Annovar, Qualimap e bedTools. Análises da qualidade do sequenciamento, assim como a taxa de mapeamento e duplicação mostraram que as amostras utilizadas apresentavam qualidades adequadas e similares entre si para a análise. De acordo com os resultados obtidos em relação a cobertura, o kit da NimbleGen apresenta uma queda em sua cobertura dos genes de interesse em relação a sua capacidade de cobertura do exoma global, algo que pode ser devido à alta taxa de GC na região de interesse, uma vez que a capacidade do kit nessas regiões é deficiente em relação aos demais. Os genes com piores coberturas em todas as quatro tecnologias foram os genes HES5, que apesar de fazer parte da embriologia hipofisária, não possui variante relacionada ao fenótipo em humanos, e o SOX3 que, apesar de ter muita baixa cobertura na NimbleGen, é bem coberto na SureSelect. Isso corrobora com a análise de capacidade de cobertura em regiões com alta taxa de GC. Somado a isso observou-se que a população brasileira tem 885 variantes únicas e exclusivas. Concluímos, portanto, que o kit SureSelect, da Agilent, tem o melhor desempenho na região de interesse, assim como no exoma global, sendo o indicado para estudos em coortes de hipopituitarismo e a população brasileira possui variantes únicas inerentes a ela / Mutations in the genes involved in pituitary embryogenesis have been described related to isolated cases of multiple hormonal deficiency and/or associated with extra-pituitary phenotypes. Mutations found in humans were described in genes involved in pituitary embryogenesis by generating phenotypes knockout animals, serving as the starting point for their search in patients with similar phenotype. This strategy is known as gene candidate search and is performed by the traditional Sanger sequencing technique. In the last decade, with the advancement of new sequencing technologies, several genes have been associated with hypopituitarism, mainly using the exome methodology. However, there is still a large portion of this population without molecular diagnosis, as evidenced by a survey in the literature by Fang et al., This trend was also observed in the outpatient clinic of Developmental Endocrinology of Hospital das Clínicas, where only 14% of the patients had their molecular diagnosis. With this, high throughput sequencing technologies have become a promising tool for the molecular determination of patients\' phenotypes. Therefore, we sequenced the exome of some of our patients, and an analysis of the sequencing quality showed very low coverage regions, which harms the researcher\'s ability to reach a conclusion regarding presence or lack of variants in these regions. Among these regions are the SOX2 and SOX3 genes, which have many variants that are known to cause the phenotype. This work aims to analyze the coverage of the genes involved in pituitary embryogenesis as well as those related to congenital hypopituitarism in four different exome library preparation kits in order to identify the best methodology for a molecular diagnosis of the patients and to determine specific variants of the Brazilian population in the region of interest by searching the ABraOM website. A total of 76 genes were analyzed in a total of 119 samples in three groups: the first group of HapMap samples, the second of a patient with hypopituitarism and his mother, and the third group of random Brazilian samples. The kits used were NimbleGen (Roche), Nextera (Illumina), SureSelect and SureSelect + UTR (Agilent). For this, several bioinformatics programs were used, among them FASTQC, BWA, GATK, Annovar, Qualimap and bedTools. Sequencing quality analysis, as well as the mapping and duplication rate, showed that the samples used presented adequate and similar qualities for the comparison. According to the results obtained in relation to the coverage, the NimbleGen kit shows a drop in its coverage of the genes of interest in relation to its capacity to cover the global exome, something that may be due to the high GC rate in the region of interest, once the capacity of the kit in these regions is not as good as the others. The genes with the worst coverage in all four technologies were the HES5 gene, which despite being part of the pituitary embryology, have no phenotype-related variant in humans, and SOX3 which, despite having very low coverage in NimbleGen, is well covered on SureSelect. This corroborates the analysis of coverage capacity in regions with a high GC rate. In addition to this it was observed that the Brazilian population has 885 unique and exclusive variants. Therefore, we conclude that the Agilent\'s SureSelect kit has the best performance in the region of interest, as well as in the global exome, being recommended for studies in hypopituitarism cohorts, and that the Brazilian population has unique variants inherent to it
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-03072019-102945 |
Date | 18 April 2019 |
Creators | Benedetti, Anna Flavia Figueredo |
Contributors | Carvalho, Luciani Renata Silveira de, Tahira, Ana Carolina |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.003 seconds