A caracterização em larga escala do transcritoma de diferentes organismos revelou um cenário complexo da expressão gênica, levando a identificação de inúmeros transcritos produzidos ao longo dos genomas de eucariotos e procariotos. Esse fenômeno recebeu o nome de transcrição pervasiva e tem sido fonte de estudos na busca de novos RNAs com importâncias regulatórias e também transcritos envolvidos na tradução de proteínas ainda não caracterizadas. A abundância de dados de transcritômica e proteômica, além de informações completas a respeito do genoma, fazem do extremófilo halofílico Halobacterium salinarum, um organismo modelo ideal para os estudos da transcrição pervasiva. Esse micro-organismo pertence ao grupo Archaea, o último dos três domínios da vida a ser descrito e com características compartilhadas entre bactérias e eucariotos. Através do uso da técnica de differential RNA-seq (dRNA-seq), a qual permite a distinção entre transcritos primários e processados, identificamos 179 TSSaRNAs em H. salinarum, esses pequenos RNAs estão associados ao início de transcrição e ainda não haviam sido descritos em archaea. A aplicação do dRNA-seq em amostras de RNA extraídas ao longo da curva de crescimento permitiu a identificação de 4540 TSS no genoma de H. salinarum NRC-1. Parte desses inícios de transcrição está localizada upstream a genes conhecidos, permitindo a identificação de inícios de transcrição em 1545 genes. 59,2% desses inícios de transcrição estão localizados até 10 pb. de distância do códon de início de tradução, confirmando a ausência de regiões UTRs em grande parte dos genes. A análise de expressão, em diferentes condições, das regiões relacionadas a inícios de transcrição antisense a genes revelou que a maioria dessas regiões apresenta um perfil de expressão correlacionado com os genes na fita oposta, indicando um possível papel regulatório desses transcritos. De forma similar, a análise da expressão de inícios de transcrição intergênicos permitiu a identificação de 132 regiões diferencialmente expressas e que não estão relacionadas a nenhum outro elemento no genoma de H. salinarum NRC-1. A análise comparativa com dados de proteômica revela que algumas dessas regiões podem estar envolvidas com a produção de pequenas proteínas. Além disso, a identificação de 1365 inícios de transcrição internos a genes sugere que a produção de transcritos intragênicos (intraRNAs) seja um fenômeno amplamente distribuído no genoma desse halófilo. Experimentos de Northern blot confirmaram a produção de um transcrito correspondente a porção final do gene VNG_RS05220, e experimentos de Western blot revelaram que a tradução desses intraRNAs é responsável pela produção de pequenas proteínas correspondentes a domínios proteicos individuais, com importante papel funcional em condições específicas de crescimento. A análise de inícios de transcrição upstream a regiões codificantes de domínios similares em bactérias e outras archaea sugere que a produção de intraRNAs codificantes é um fenômeno amplamente distribuído em procariotos e pode ser responsável pelo aumento da diversidade do proteoma através da geração de isoformas de proteínas a partir de um único gene. Por fim, a análise de dados de RNA-seq, em conjunto com a busca por assinaturas conhecidas de término de transcrição em archaea, permitiu a identificação da posição final de 58 genes. Os dados obtidos a partir dos experimentos e análises realizados ajudam a traçar um panorama mais completo do transcritoma de H. salinarum NRC-1 e revelam a presença de novos transcritos que podem ser amplamente distribuídos em procariotos e apresentar importantes papéis funcionais. / The large-scale transcriptome characterization of different organisms revealed a highly complex scenario of gene expression, leading to the identification of numerous transcripts in the genomes of eukaryotes and prokaryotes. This phenomenon has been named pervasive transcription and has been an important source for the search of new RNAs with regulatory functions or involved in the translation of unknown proteins. The abundance of transcriptomic and proteomic data, as well as complete information regarding the genome, allowed the halophilic extremophile Halobacterium salinarum to be an ideal model organism for studies of pervasive transcription. This microorganism belongs to the Archaea group, the last one of the three domains of life to be described, which presents shared characteristics with bacteria and eukaryotes. The use of differential RNA-seq (dRNA-seq) approach, which allows the distinction between primary and processed transcripts, allowed the identification of 179 TSSaRNAs, small RNAs associated with the transcription initiation in H. salinarum. The application of dRNA-seq in RNA samples collected along the growth curve allowed the identification of 4540 transcription start sites (TSS) in H. salinarum NRC-1. Some of these transcription initiation are located upstream to known genes, enabling the identification of TSSs for 1545 genes. 59.2% of these positions are located up to 10 bp away from the translation initiation codon, confirming that most of genes are leaderless. The expression analysis of regions related to antisense TSS under different conditions revealed that most of these regions have a correlated expression profile with genes in the opposite strand, indicating a possible regulatory role. Similarly, analysis of the expression of intergenic TSS allowed the identification of 132 differentially expressed regions that are not related to any other element in H. salinarum NRC-1 genome. Integration with proteomic data reveals that some of these regions may be involved in the production of small proteins. The identification of 1365 TSS located within genes suggests that the production of intragenic RNAs (intraRNAs) is a widely distributed phenomenon in H. salinarum NRC-1 genome. Northern blot experiments confirmed the production of a transcript corresponding to the final portion of VNG_RS05220 gene and Western blot experiments also revealed that the translation of intraRNAs is responsible for producing small proteins corresponding to individual protein domains with important functional role in specific growth conditions. Analysis of TSS upstream to the coding regions of similar protein domains in bacteria and other archaea suggests that the production of coding intraRNAs is a widely distributed phenomenon in prokaryotes and may be responsible for the increased proteome diversity through the generation of protein isoforms from a unique gene. Finally, the RNA-seq data analysis, combined with a search for known signatures for transcription termination in archaea, allowed the identification of the final position of 58 genes. The present work help to give a more complete picture of H. salinarum transcriptional landscape and reveals the presence of new transcripts that can be widely distributed in prokaryotes, with important functional roles.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-17042019-143232 |
Date | 15 February 2017 |
Creators | Caten, Felipe ten |
Contributors | Koide, Tie, Vencio, Ricardo Zorzetto Nicoliello |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Tese de Doutorado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0025 seconds