Return to search

Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis / Integrative methodology in penile carcinomas

O desenvolvimento de metodologias sobre integração de dados na área de biologia de sistemas é de grande importância devido ao aumento contínuo de dados resultantes de análises globais que são depositados em bancos de dados públicos. Poucas metodologias e ferramentas de bioinformática levam em consideração a diferenciação entre drivers e passengers, fundamental para a identificação de genes importantes para o desenvolvimento e progressão tumoral. Os perfis de expressão gênica têm possibilitado a identificação de assinaturas genéticas em uma grande variedade de tumores humanos. Além disso, as alterações epigenéticas, como a expressão de microRNAs (miRNA) e a metilação do DNA, também contribuem para o desenvolvimento de diversos tipos de doenças. Entretanto, a grande maioria destes estudos não mostra integração dos resultados obtidos pelas diferentes estratégias utilizadas, o que teria maior impacto na identificação de drivers moleculares. Neste estudo foi realizada a integração de quatro níveis de alterações em 31 amostras de câncer de pênis (CaPe): alteração do número de cópias do DNA, metilação de ilhas CpGs, expressão de miRNAs e expressão de transcritos codificadores. O conhecimento das alterações genéticas e epigenéticas relacionadas ao desenvolvimento de câncer de pênis é bastante limitado, devido principalmente a sua rara incidência. Uma parcela significativa dos casos de CaPe tem sido associada com a infecção pelo Papilomavírus Humano (HPV). A metodologia para integração de dados foi aplicada utilizando duas abordagens: (1) estudo das alterações em câncer de pênis (tumor e normal) independente da infecção pelo HPV e (2) estudo das alterações relacionadas à infecção pelo HPV. A análise foi dividida em duas etapas, com a seleção de genes alvos específicos da doença e inferência de módulos a partir desses alvos. Destacam-se na metodologia a seleção de genes candidatos a driver utilizando a atribuição de pesos para cada alteração seguindo critérios pré-determinados, e.g. se o gene estava presente em uma região rara, após classificação pelo DGV (Database of Genomic Variants) e a utilização desses genes como alvos para identificação das possíveis relações entre eles e os módulos. Também foi realizada a adaptação da metodologia de redes em módulos, com a inclusão de genes passengers e interação proteína-proteína (PPI) como um critério para seleção dos módulos. Essa análise se mostrou eficaz na identificação de módulos gênicos bem relacionados com os drivers, resultando na escolha de vias biológicas potencialmente responsáveis pelo desenvolvimento do tumor. Os genes identificados após a comparação entre amostras tumorais e normais (SOX17, TWIST1, CAV1, PPARG, FLI1 e TNFSF10) e no estudo entre amostras positivas e negativas para infecção pelo HPV (PCNA, SOX14 e RFC4) foram validados in situ por técnicas independentes. Para validação in silico das alterações encontradas na metodologia de integração de dados e para validação da metodologia de redes em módulos foram utilizadas 255 amostras de glioblastoma multiforme obtidas no banco de dados TCGA (The Cancer Genome Atlas). Foram identificadas vias biológicas importantes relacionadas ao processo tumoral, como regulação do crescimento celular (GO:0001558, p=0,0062), homeostase (GO:0048872, $p=0,0082) e regulação da transcrição (GO:0003700, p=0,00089). Também foi realizada uma meta-análise utilizando amostras do TCGA, que encontrou um perfil similar de expressão para os genes CAV1, DLC1,FLI1, MSX1, NRN1, PML, PPARG e SOX17 (T vs N) e PCNA e RFC4 (HPV+ vs HPV-). Para o nosso conhecimento, esse é o primeiro estudo em CaPe utilizando análise integrada de quatro níveis de alteração. Além disso, foram encontradas alterações não randômicas capazes de modificar transcritos específicos e contribuir para o conhecimento da patobiologia dos tumores de pênis. / Methodologies for data integration in systems biology area have great importance due to continuous increase of public data resulting from large-scale analysis, which are deposited in public databases. Few methodologies and bioinformatics tools take into consideration the differentiation between drivers and passengers, fundamental for the identification of important genes for tumor development and progression. The gene expression profiles have allowed the identification of genetic signatures in a wide variety of human tumors. In addition, epigenetic changes, such as the expression of microRNA (miRNA) and DNA methylation, also contribute to the development of a veriety of diseases. However, most of these studies did not show integration of results obtained by different strategies used, which would have increased impact to identify molecular drivers. This study provides a methodology for integration of four levels of changes in 31 samples of penile cancer (PeCa): copy number alterations, DNA methylation of CpG islands, miRNA expression and gene expression of coding transcripts. Knowledge about genetic and epigenetic changes related to the development of penile cancer is very limited, mainly due to its rare incidence. A significant portion of PeCa samples has been associated with infection by Human papillomavirus (HPV). The methodology for integrative data was applied using two approaches: (1) the study considering alterations in penile carcinoma (tumor and normal), independent of HPV infection and (2) the study considering alteration related to HPV infection in PeCa. In each study, the methodology was divided into two stages, with the selection of target genes and the inference of disease specific modules from these targets. It is highlighted in the methodology the selection of candidate genes using the driver assigning weights to each change following predetermined criteria, e.g if the gene was present in a rare region after classification using the DGV database (Database of Genomic Variants) and the use of these genes as seeds for identification of possible relationships between them and the modules. For this, another contribution of this study was the adaptation of module network methodology, with the inclusion of passengers genes and protein-protein interaction (PPI) as a criteria to select the modules. This analysis was effective in identifying gene modules and related drivers, resulting in the choice of biological pathway potentially responsible for the tumor development. The genes identified after comparing tumor and normal samples (SOX17, TWIST1, CAV1, PPARG, FLI1 and TNFSF10) and the genes identified in the study of positive and negative samples for HPV infection (PCNA, SOX14 and RFC4) were validated in situ by independent techniques. For in silico validation of the changes found in the integrative methodology and the modules network were used 255 samples of glioblastoma multiforme obtained at TCGA database (The Cancer Genome Atlas). Biological pathways have been identified related to the tumoral process, such as cell growth regulation (GO:0001558, p=0,0062), homeostasis (GO:0048872, p=0,0082) and transcription regulation (GO:0003700, p=0,00089). Also, a meta-analysis was performed using samples from TCGA, who found a similar expression profile for CAV1, DLC1, FLI1, MSX1, NRN1, PML, PPARG and SOX17 (T vs N) and PCNA and RFC4 genes (HPV + vs HPV-). To our knowledge, this is the first integrative analysis in PeCa using a four-level of gene alterations. In addition, it was found non-random alterations capable to modifying specific transcripts and contribute to the knowledge about the pathobiology of penile tumors.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-24062014-110926
Date14 April 2014
CreatorsMarchi, Fabio Albuquerque
ContributorsRogatto, Silvia Regina
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0029 seconds