• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 3
  • Tagged with
  • 9
  • 9
  • 5
  • 5
  • 5
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Halobacterium salinarum NRC-1: rede de regulação gênica e sua análise probabilística / Halobacterium salinarum NRC-1: genetic regulatory network and it\'s probabilistic analysis.

Crocetti, Guilherme Martins 08 May 2018 (has links)
Este trabalho teve como objetivo principal modelar a Rede de Regulação Gênica do organismo modelo Halobacterium salinarum NRC-1, estabelecendo interações entre as entidades da rede por intermédio de experimentos inéditos de interação física: ChIP- *, RIP-* e dRNA-seq. Em contraponto com as abordagens clássicas de construção de redes, que estimam interações através de medições de expressão gênica, este trabalho as estabeleceu exclusivamente de interações físicas, permitindo que a estrutura final seja uma representação mais fiel ao fenômeno físico de regulação gênica, baseando-se nos fundamentos da Biologia Sistêmica. Em vista da abundância de dados públicos de expressão gênica para o organismo e do objetivo primário, um objetivo secundário foi traçado: identificar, computacionalmente, genes de fato controlados pelas interações fornecidas pela nova rede. Para isso, a estrutura estabelecida foi transformada numa Rede Bayesiana, e a identificação de genes foi efetuada através da análise de suas Tabelas de Probabilidade Condicionais. Finalmente, como os resultados obtidos para o objetivo secundário foram desfavoráveis a utilização de Redes Bayesianas, os resultados efetivos deste trabalho foram a criação de uma nova Rede de Regulação Gênica para a H. salinarum e uma análise em torno da efetividade de Redes Bayesianas neste contexto. / The main goal of this work was modeling the gene regulatory network of the model organism Halobacterium salinarum NRC-1, establishing new interactions between networks entities through unpublished physical interaction experiments: ChIP-*, RIP-* e dRNA-seq. Instead of using classical approaches to build network structures that estimates interactions using gene expression data, this work established them exclusively from physical interactions. Therefore, the final structure is a more reliable representation of the physical phenomenon of gene expression, built using the principles of systems biology. Considering the amount of public available gene expression data and the primary goal, another objective was proposed: a computational analysis to detect genes actually controlled by the interactions of the new network. To achieve this goal the established network was transformed in a Bayesian network, detecting genes through the analysis of their conditional probability tables. Lastly, as the results of the secondary goal went against the use of Bayesian networks, the effective results of this thesis were the creation of a new genetic regulatory network for H. salinarum and an analysis around Bayesian networks in this context.
2

Halobacterium salinarum NRC-1: rede de regulação gênica e sua análise probabilística / Halobacterium salinarum NRC-1: genetic regulatory network and it\'s probabilistic analysis.

Guilherme Martins Crocetti 08 May 2018 (has links)
Este trabalho teve como objetivo principal modelar a Rede de Regulação Gênica do organismo modelo Halobacterium salinarum NRC-1, estabelecendo interações entre as entidades da rede por intermédio de experimentos inéditos de interação física: ChIP- *, RIP-* e dRNA-seq. Em contraponto com as abordagens clássicas de construção de redes, que estimam interações através de medições de expressão gênica, este trabalho as estabeleceu exclusivamente de interações físicas, permitindo que a estrutura final seja uma representação mais fiel ao fenômeno físico de regulação gênica, baseando-se nos fundamentos da Biologia Sistêmica. Em vista da abundância de dados públicos de expressão gênica para o organismo e do objetivo primário, um objetivo secundário foi traçado: identificar, computacionalmente, genes de fato controlados pelas interações fornecidas pela nova rede. Para isso, a estrutura estabelecida foi transformada numa Rede Bayesiana, e a identificação de genes foi efetuada através da análise de suas Tabelas de Probabilidade Condicionais. Finalmente, como os resultados obtidos para o objetivo secundário foram desfavoráveis a utilização de Redes Bayesianas, os resultados efetivos deste trabalho foram a criação de uma nova Rede de Regulação Gênica para a H. salinarum e uma análise em torno da efetividade de Redes Bayesianas neste contexto. / The main goal of this work was modeling the gene regulatory network of the model organism Halobacterium salinarum NRC-1, establishing new interactions between networks entities through unpublished physical interaction experiments: ChIP-*, RIP-* e dRNA-seq. Instead of using classical approaches to build network structures that estimates interactions using gene expression data, this work established them exclusively from physical interactions. Therefore, the final structure is a more reliable representation of the physical phenomenon of gene expression, built using the principles of systems biology. Considering the amount of public available gene expression data and the primary goal, another objective was proposed: a computational analysis to detect genes actually controlled by the interactions of the new network. To achieve this goal the established network was transformed in a Bayesian network, detecting genes through the analysis of their conditional probability tables. Lastly, as the results of the secondary goal went against the use of Bayesian networks, the effective results of this thesis were the creation of a new genetic regulatory network for H. salinarum and an analysis around Bayesian networks in this context.
3

Single Amplified Genomes as Source for Novel Extremozymes: Annotation, Expression and Functional Assessment

Grötzinger, Stefan 12 1900 (has links)
Enzymes, as nature’s catalysts, show remarkable abilities that can revolutionize the chemical, biotechnological, bioremediation, agricultural and pharmaceutical industries. However, the narrow range of stability of the majority of described biocatalysts limits their use for many applications. To overcome these restrictions, extremozymes derived from microorganisms thriving under harsh conditions can be used. Extremophiles living in high salinity are especially interesting as they operate at low water activity, which is similar to conditions used in standard chemical applications. Because only about 0.1 % of all microorganisms can be cultured, the traditional way of culture-based enzyme function determination needs to be overcome. The rise of high-throughput next-generation-sequencing technologies allows for deep insight into nature’s variety. Single amplified genomes (SAGs) specifically allow for whole genome assemblies from small sample volumes with low cell yields, as are typical for extreme environments. Although these technologies have been available for years, the expected boost in biotechnology has held off. One of the main reasons is the lack of reliable functional annotation of the genomic data, which is caused by the low amount (0.15 %) of experimentally described genes. Here, we present a novel annotation algorithm, designed to annotate the enzymatic function of genomes from microorganisms with low homologies to described microorganisms. The algorithm was established on SAGs from the extreme environment of selected hypersaline Red Sea brine pools with 4.3 M salinity and temperatures up to 68°C. Additionally, a novel consensus pattern for the identification of γ-carbonic anhydrases was created and applied in the algorithm. To verify the annotation, selected genes were expressed in the hypersaline expression system Halobacterium salinarum. This expression system was established and optimized in a continuously stirred tank reactor, leading to substantially increased cell amounts and protein yields. The resulting gene expression products were assessed for function in vivo and/or in vitro. Our functional evaluation of the tested genes confirmed our annotation algorithm. Our developed strategy offers a general guide for using SAGs as a source of scientific and industrial investigations into “microbial dark matter” and may help to develop new catalysts, applicable for novel reactions in green chemistry.
4

Identificação in silico de ncRNAs no organismo modelo Halobacterium salinarum NRC-1 / In Silico identification of non-coding RNAs in Halobacterium salinarum NRC-1 model archeon organism

Marcos Abraão de Souza Fonseca 25 April 2016 (has links)
A regulação da expressão gênica ocorre como um fenômeno essencial nos processos celulares em resposta a dinamicidade mútua estabelecida entre um organismo e seu meio. Além dos elementos reguladores já conhecidos, como fatores de transcrição ou modificações pós-transcricionais, observa-se um crescente interesse no papel de regulação desempenhado por moléculas de RNA não codificadores (ncRNA), que podem atuar em vários níveis de processamento da informação biológica. Organismos modelos oferecem uma forma conveniente de pesquisa e diferentes grupos buscam direcionar seus estudos para um entendimento mais amplo no que se refere aos mecanismos celulares presentes nesses organismos. Apesar da existência de alguns elementos conhecidos para o organismo modelo Halobacterium salinarum, acreditamos que nem todos seus elementos de ncRNAs foram identificados. Nesse contexto, desenvolvemos uma análise in silico para a identificação de novos ncRNAs em H. salinarum NRC-1 e aplicamos metodologias para a predição de possíveis interações RNA-Proteína. Com base em uma pespectiva de integração de dados e diferentes metodologias existentes, modelos de Aprendizado de Máquina (AM) foram criados e utilizados para a definição de regiões candidatas a ncRNAs. De acordo com os resultados, 42 novos ncRNAs puderam ser identificados e possibilitaram completar o catálogo de genes ncRNAs de H. salinarum NRC-1 e aumentar o universo conhecido destes em 82%. A análise dos resultados obtidos por outras abordagens disponíveis para a identificação de ncRNAs corroboram com alguns dos candidatos sugeridos neste trabalho. Adicionalmente, foram aplicados e avaliados métodos, também baseados em AM, para a identificação de candidatos à interação com a proteína de interesse LSm, presente no organismo em estudo, no intuito de incluir uma possível caracterização funcional de ncRNAs. Os resultados alcançados na aplicação metodologias para a predição de interações RNA-Proteína não foram suficientes para a criação de um modelo com predições de alto grau de acurácia porém, contribuem como estudos preliminares e discussões para o desenvolvimento de outras estratégias. / The gene expression regulation occurs on different cell levels in response to dynamics established between an organism and its environment. In addition to the regulatory elements already known, for instance, transcription factors or post-translation modifications, there is growing interests in the regulatory role played by non-coding RNA molecules (ncRNA) whose functions can be performed on different level of biological information processing. Model organisms allow a convenient way to work on laboratory and different research groups aiming to guide their studies for a mutual and wide understanding of the cellular mechanisms present on these organisms. Although some ncRNAs elements have been found in Halobacterium salinarum model organism we believe that not enough is knowing about these genomic regions. In these context, an in silico analysis for ncRNAs identification and RNA-protein prediction approach were applied to H. salinarum NRC-1. Considering a data integration perspective and some available methodologies, several machine learning models was built and used to designate candidate ncRNAs genome regions. According to achieve results, 42 new ncRNAs could be identified, increasing 82% the total of known ncRNAs in H. salinarum NRC-1. Combing analysis with other available tools, it had been observed that some suggested candidates also was found with different methodologies and thus, it highlights the proposed results. Additionally, we developed and analyzed methods, also machine learning based, to predict ncRNAs candidates to interact with LSm protein, present on the interested model organism aiming a basic ncRNA characterization. The achieved results in this part was not satisfactory since the applied models were not substantially accurate predictions. However, we believe that these preliminary results can contribute with some discussions to new different approaches.
5

Identificação in silico de ncRNAs no organismo modelo Halobacterium salinarum NRC-1 / In Silico identification of non-coding RNAs in Halobacterium salinarum NRC-1 model archeon organism

Fonseca, Marcos Abraão de Souza 25 April 2016 (has links)
A regulação da expressão gênica ocorre como um fenômeno essencial nos processos celulares em resposta a dinamicidade mútua estabelecida entre um organismo e seu meio. Além dos elementos reguladores já conhecidos, como fatores de transcrição ou modificações pós-transcricionais, observa-se um crescente interesse no papel de regulação desempenhado por moléculas de RNA não codificadores (ncRNA), que podem atuar em vários níveis de processamento da informação biológica. Organismos modelos oferecem uma forma conveniente de pesquisa e diferentes grupos buscam direcionar seus estudos para um entendimento mais amplo no que se refere aos mecanismos celulares presentes nesses organismos. Apesar da existência de alguns elementos conhecidos para o organismo modelo Halobacterium salinarum, acreditamos que nem todos seus elementos de ncRNAs foram identificados. Nesse contexto, desenvolvemos uma análise in silico para a identificação de novos ncRNAs em H. salinarum NRC-1 e aplicamos metodologias para a predição de possíveis interações RNA-Proteína. Com base em uma pespectiva de integração de dados e diferentes metodologias existentes, modelos de Aprendizado de Máquina (AM) foram criados e utilizados para a definição de regiões candidatas a ncRNAs. De acordo com os resultados, 42 novos ncRNAs puderam ser identificados e possibilitaram completar o catálogo de genes ncRNAs de H. salinarum NRC-1 e aumentar o universo conhecido destes em 82%. A análise dos resultados obtidos por outras abordagens disponíveis para a identificação de ncRNAs corroboram com alguns dos candidatos sugeridos neste trabalho. Adicionalmente, foram aplicados e avaliados métodos, também baseados em AM, para a identificação de candidatos à interação com a proteína de interesse LSm, presente no organismo em estudo, no intuito de incluir uma possível caracterização funcional de ncRNAs. Os resultados alcançados na aplicação metodologias para a predição de interações RNA-Proteína não foram suficientes para a criação de um modelo com predições de alto grau de acurácia porém, contribuem como estudos preliminares e discussões para o desenvolvimento de outras estratégias. / The gene expression regulation occurs on different cell levels in response to dynamics established between an organism and its environment. In addition to the regulatory elements already known, for instance, transcription factors or post-translation modifications, there is growing interests in the regulatory role played by non-coding RNA molecules (ncRNA) whose functions can be performed on different level of biological information processing. Model organisms allow a convenient way to work on laboratory and different research groups aiming to guide their studies for a mutual and wide understanding of the cellular mechanisms present on these organisms. Although some ncRNAs elements have been found in Halobacterium salinarum model organism we believe that not enough is knowing about these genomic regions. In these context, an in silico analysis for ncRNAs identification and RNA-protein prediction approach were applied to H. salinarum NRC-1. Considering a data integration perspective and some available methodologies, several machine learning models was built and used to designate candidate ncRNAs genome regions. According to achieve results, 42 new ncRNAs could be identified, increasing 82% the total of known ncRNAs in H. salinarum NRC-1. Combing analysis with other available tools, it had been observed that some suggested candidates also was found with different methodologies and thus, it highlights the proposed results. Additionally, we developed and analyzed methods, also machine learning based, to predict ncRNAs candidates to interact with LSm protein, present on the interested model organism aiming a basic ncRNA characterization. The achieved results in this part was not satisfactory since the applied models were not substantially accurate predictions. However, we believe that these preliminary results can contribute with some discussions to new different approaches.
6

O transcritoma antisense primário de Halobacterium salinarum NRC-1 / The antisense primary transcriptome of Halobacterium salinarum NRC-1

João Paulo Pereira de Almeida 04 September 2018 (has links)
Em procariotos, RNAs antisense (asRNAs) constituem a classe de RNAs não codificantes (ncRNAs) mais numerosa detectada por métodos de avaliação de transcritoma em larga escala. Apesar da grande abundância, pouco se sabe sobre mecanismos regulatórios e aspectos da conservação evolutiva dessas moléculas, principalmente em arquéias, onde o mecanismo de degradação de RNAs dupla fita (dsRNAs) é um fenômeno pouco conhecido. No presente estudo, utilizando dados de dRNA-seq, identificamos 1626 inícios de transcrição primários antisense (aTSSs) no genoma de Halobacterium salinarum NRC-1, importante organismo modelo para estudos de regulação gênica no domínio Archaea. Integrando dados de expressão gênica obtidos a partir de 18 bibliotecas de RNA-seq paired-end, anotamos 846 asRNAs a partir dos aTSSs mapeados. Encontramos asRNAs em ~21% dos genes anotados, alguns desses relacionados a importantes características desse organismo como: codificadores de proteínas que constituem vesículas de gás e da proteína bacteriorodopsina, além de vários genes relacionados a maquinaria de tradução e transposases. Além desses, encontramos asRNAs em genes pertencentes a sistemas de toxinas-antitoxinas do tipo II e utilizando dados públicos de dRNA-seq, evidenciamos que esse é um fenômeno que ocorre em bactérias e arquéias. A interação de um ncRNA com seu RNA alvo pode ser dependente de proteínas, em arquéias, a proteína LSm é uma chaperona de RNA homóloga a Hfq de bactérias, implicada no controle pós-transcricional. Utilizamos dados de RIP-seq de RNAs imunoprecipitados com LSm e identificamos 91 asRNAs interagindo com essa proteína, para 81 desses, o mRNA do gene sense também foi encontrado interagindo. Buscando por aTSSs presentes nas mesmas regiões de genes ortólogos, identificamos 160 aTSSs que dão origem a asRNAs em H. salinarum possivelmente conservados em Haloferax volcanii. A expressão dos asRNAs anotados foi avaliada ao longo de uma curva de crescimento e em uma linhagem knockout de um gene que codifica uma RNase R, possível degradadora de dsRNAs em arquéias. Encontramos um total de 144 asRNAs diferencialmente expressos ao longo da curva de crescimento, para 56 desses o gene sense também está diferencialmente expresso, caracterizando possíveis mecanismos de regulação em cis por esses RNAs. Na linhagem knockout, encontramos cinco asRNAs diferencialmente expressos e apenas para um desses o gene sense também está diferencialmente expresso, resultado que não nos permitiu inferir um possível papel de degradação de dsRNAs da RNAse R em H. salinarum NRC-1. Nesse trabalho apresentamos um mapeamento completo do transcritoma antisense primário de H. salinarum NRC-1 com resultados que consistem em um importante passo na direção da compreensão do envolvimento da transcrição antisense na regulação gênica pós-transcricional desse organismo modelo do terceiro domínio da vida. / Antisense RNAs (asRNAs) constitute the most numerous class of non-coding RNAs (ncRNAs) detected by transcriptome highthroughput methods in prokaryotes. Despite this abundance, little is known about regulatory mechanisms and evolutionary aspects of these molecules, mainly in archaea, where the mechanism of double-strand RNA (dsRNA) degradation remains poorly understood. In this study, using dRNA-seq data, we identified 1626 antisense transcription start sites (aTSSs) in the genome of Halobacterium salinarum NRC-1, an important model organism for gene expression regulation studies in Archaea. By integrating gene expression data from 18 RNA-seq paired-end libraries, we were able to annotate 846 asRNAs from mapped aTSSs. We found asRNAs in ~21% of annotated genes including genes related to important characteristics of this organism, such as: gas vesicle proteins, bacteriorhodopsin, translation machinery and transposases. We also found asRNAs in type II toxin-antitoxin systems and using public dRNA-seq data, we show evidences that this phenomenon might be conserved in archaea and bacteria. The interaction of a ncRNA with its target may depend on intermediary proteins action. In archaea, the LSm protein is a RNA chaperone homologous to bacterial Hfq, involved in post-transcriptional regulation. We used RIP-seq data from RNAs immunoprecipitated with LSm and identified 91 asRNAs interacting with this protein, for 81 of these the mRNA of the sense gene is also interacting. We searched for aTSSs present in the same region of orthologous genes in the Haloferax volcanii. We found 160 aTSSs that originated asRNAs in H. salinarum NRC-1 that might be conserved in this two archaea. The expression of annotated asRNAs was analyzed over a growth curve and in a knockout strain for RNase R gene. We found 144 asRNA differentially expressed over the growth curve, for 56 of these the sense gene was also differentially expressed, characterizing possible cis regulators asRNAs. In the knockout strain we found five differentially expressed asRNAs and only one asRNA/gene pair, this result does not allow us to infer a dsRNA degradation in vivo activity for this RNase in H. salinarum NRC- 1. This work contributes to the discovery of the antisense transcriptome in H. salinarum NRC- 1 a relevant step to uncover the post-transcriptional gene regulatory network in this archaeon.
7

O transcritoma antisense primário de Halobacterium salinarum NRC-1 / The antisense primary transcriptome of Halobacterium salinarum NRC-1

Almeida, João Paulo Pereira de 04 September 2018 (has links)
Em procariotos, RNAs antisense (asRNAs) constituem a classe de RNAs não codificantes (ncRNAs) mais numerosa detectada por métodos de avaliação de transcritoma em larga escala. Apesar da grande abundância, pouco se sabe sobre mecanismos regulatórios e aspectos da conservação evolutiva dessas moléculas, principalmente em arquéias, onde o mecanismo de degradação de RNAs dupla fita (dsRNAs) é um fenômeno pouco conhecido. No presente estudo, utilizando dados de dRNA-seq, identificamos 1626 inícios de transcrição primários antisense (aTSSs) no genoma de Halobacterium salinarum NRC-1, importante organismo modelo para estudos de regulação gênica no domínio Archaea. Integrando dados de expressão gênica obtidos a partir de 18 bibliotecas de RNA-seq paired-end, anotamos 846 asRNAs a partir dos aTSSs mapeados. Encontramos asRNAs em ~21% dos genes anotados, alguns desses relacionados a importantes características desse organismo como: codificadores de proteínas que constituem vesículas de gás e da proteína bacteriorodopsina, além de vários genes relacionados a maquinaria de tradução e transposases. Além desses, encontramos asRNAs em genes pertencentes a sistemas de toxinas-antitoxinas do tipo II e utilizando dados públicos de dRNA-seq, evidenciamos que esse é um fenômeno que ocorre em bactérias e arquéias. A interação de um ncRNA com seu RNA alvo pode ser dependente de proteínas, em arquéias, a proteína LSm é uma chaperona de RNA homóloga a Hfq de bactérias, implicada no controle pós-transcricional. Utilizamos dados de RIP-seq de RNAs imunoprecipitados com LSm e identificamos 91 asRNAs interagindo com essa proteína, para 81 desses, o mRNA do gene sense também foi encontrado interagindo. Buscando por aTSSs presentes nas mesmas regiões de genes ortólogos, identificamos 160 aTSSs que dão origem a asRNAs em H. salinarum possivelmente conservados em Haloferax volcanii. A expressão dos asRNAs anotados foi avaliada ao longo de uma curva de crescimento e em uma linhagem knockout de um gene que codifica uma RNase R, possível degradadora de dsRNAs em arquéias. Encontramos um total de 144 asRNAs diferencialmente expressos ao longo da curva de crescimento, para 56 desses o gene sense também está diferencialmente expresso, caracterizando possíveis mecanismos de regulação em cis por esses RNAs. Na linhagem knockout, encontramos cinco asRNAs diferencialmente expressos e apenas para um desses o gene sense também está diferencialmente expresso, resultado que não nos permitiu inferir um possível papel de degradação de dsRNAs da RNAse R em H. salinarum NRC-1. Nesse trabalho apresentamos um mapeamento completo do transcritoma antisense primário de H. salinarum NRC-1 com resultados que consistem em um importante passo na direção da compreensão do envolvimento da transcrição antisense na regulação gênica pós-transcricional desse organismo modelo do terceiro domínio da vida. / Antisense RNAs (asRNAs) constitute the most numerous class of non-coding RNAs (ncRNAs) detected by transcriptome highthroughput methods in prokaryotes. Despite this abundance, little is known about regulatory mechanisms and evolutionary aspects of these molecules, mainly in archaea, where the mechanism of double-strand RNA (dsRNA) degradation remains poorly understood. In this study, using dRNA-seq data, we identified 1626 antisense transcription start sites (aTSSs) in the genome of Halobacterium salinarum NRC-1, an important model organism for gene expression regulation studies in Archaea. By integrating gene expression data from 18 RNA-seq paired-end libraries, we were able to annotate 846 asRNAs from mapped aTSSs. We found asRNAs in ~21% of annotated genes including genes related to important characteristics of this organism, such as: gas vesicle proteins, bacteriorhodopsin, translation machinery and transposases. We also found asRNAs in type II toxin-antitoxin systems and using public dRNA-seq data, we show evidences that this phenomenon might be conserved in archaea and bacteria. The interaction of a ncRNA with its target may depend on intermediary proteins action. In archaea, the LSm protein is a RNA chaperone homologous to bacterial Hfq, involved in post-transcriptional regulation. We used RIP-seq data from RNAs immunoprecipitated with LSm and identified 91 asRNAs interacting with this protein, for 81 of these the mRNA of the sense gene is also interacting. We searched for aTSSs present in the same region of orthologous genes in the Haloferax volcanii. We found 160 aTSSs that originated asRNAs in H. salinarum NRC-1 that might be conserved in this two archaea. The expression of annotated asRNAs was analyzed over a growth curve and in a knockout strain for RNase R gene. We found 144 asRNA differentially expressed over the growth curve, for 56 of these the sense gene was also differentially expressed, characterizing possible cis regulators asRNAs. In the knockout strain we found five differentially expressed asRNAs and only one asRNA/gene pair, this result does not allow us to infer a dsRNA degradation in vivo activity for this RNase in H. salinarum NRC- 1. This work contributes to the discovery of the antisense transcriptome in H. salinarum NRC- 1 a relevant step to uncover the post-transcriptional gene regulatory network in this archaeon.
8

Function prediction of transcription start site associated RNAs (TSSaRNAs) in Halobacterium salinarum NRC-1 / Predição de função para TSSaRNAs (transcritos associados a sitios de início de transcrição) em Halobacterium salinarum NRC-1

Adam, Yagoub Ali Ibrahim 07 February 2019 (has links)
The Transcription Start Site Associated non-coding RNAs (TSSaRNAs) have been predicted across the three domain of life. However, still, there are no reliable annotation efforts to identify their biological functions and their underline molecular machinery. Therefore, this project addresses the question of what are the potential functions of TSSaRNAs regarding their roles in addressing the cellular functions. To answer this question, we aimed to accurately identify TSSaRNAs in the model organism Halobacterium salinarum NRC-1 (an Archean microorganism) that incubated at the standard growth condition. Consequently, we aimed to investigate TSSaRNAs structural stability in the term of the thermodynamic energies. Moreover, we attempted to functionally annotate TSSaRNAs based on Rfam functional classification of non-coding RNAs. Based on the statistical approach we developed an algorithm to predict TSSaRNA using next-generation RNA sequencing data (RNA-Seq). To perform structural annotation of TSSaRNAs, we investigated the structural stability of TSSaRNAs by modeling the secondary structures by minimizing the thermodynamic free energy. We simulated TSSaRNAs tertiary structures based on the secondary structures constrain using the Rosetta-Common RNA tool. The structures of the minimum free energy supposed to be biophysically stable structures. To investigate the higher order structures of TSSaRNAs, we studied the hybridization between TSSaRNAs and their cognate genes as part of RNA based regulation system. Also, based on our hypothesis that TSSaRNAs may bind to protein to trigger their function, we have investigated the interaction between TSSaRNAs and Lsm protein which known as a chaperone protein that mediates RNA function and involved in RNA processing. Our pipeline to perform the functional annotation of TSSaRNAs aimed to classify TSSaRNAs into their corresponding Rfam families based on two steps: either through querying TSSaRNAs sequences against the co-variance models of Rfam families or by querying the Rfam sequences against the co-variance models of the consensus secondary structures in TSSaRNAs. The results showed that the prediction algorithm has succeeded to identify a total of 224 TSSaRNAs that expressed in the same strand of the mRNAs and 58 TSSaRNAs that expressed as antisense of the mRNAs. The identified TSSaRNAs molecules showed a median length of 25 nucleotides. Regarding the structural annotation of TSSaRNAs, the results showed that most of TSSaRNAs possessed thermodynamically stable secondary structures and their tertiary structures were capable of forming more complex structures through binding with other biomolecules. About the formation of higher-order structures, we have observed that most of TSSaRNAs (92.2%) were capable of hybridizing into their cognate genes also 55 TSSaRNAs indicated putative interactions with Lsm protein. Furthermore, the computation docking experiments demonstrated the TSSaRNAs-Lsm complexes associated with favorable binding energy of a median of -542900 kcal mole -¹. Regarding the functional annotation of TSSaRNAs, the results showed that the majority of TSSaRNAs (42.05%) considered as potential cis-acting regulators such as cis-regulatory element and sRNAs, but still, there are potential trans-acting regulators to regulate distant molecules such as CRISPR and antisense RNA. Moreover, the results indicated that TSSaRNAs could trigger more complex function as a catalytic function such as Riboswitch or to play a role in the defense against a virus such as CRISPR. As a conclusion; based on the results of this study we could state that TSSaRNAs have several potential functions opening the experimental validation perspective. / Os RNA não codificantes associados ao sítio de início da transcrição - em inglês, transcription start site associated non-coding RNAs (TSSaRNA) - foram observados nos três domínios da vida. No entanto, sem esforço confiável de anotação para identificar suas funções biológicas e seus mecanismos moleculares. Portanto, esse projeto levanta a questão de quais são as funções em potencial dos TSSaRNAs a respeito de seus papeis nas funções celulares. Para responder esta questão, nós objetivamos em identificar de forma eficaz os TSSaRNAs no organismo modelo Halobacterium salinarum NRC-1 (um microrganismo do domínio Arqueia) encubado em uma condição de crescimento padrão. Consequentemente, nós investigamos a estabilidade estrutural dos TSSaRNAs em relação a energias termodinâmicas. Ainda, fizemos a anotação funcional dos TSSaRNAs baseado na classificação funcional Rfam dos RNAs não-codificantes. Baseada em uma abordagem estatística nós desenvolvemos um algoritmo para predizer TSSaRNA usando dados de sequenciamento de RNA de nova geração (RNA-Seq). Para investigar a estabilidade estrutural dos TSSaRNAs nós modelamos as estruturas secundárias minimizando a energia livre termodinâmica para alcançar a estrutura mais estável biofisicamente. Nós simulamos estruturas terciárias de TSSaRNAs baseado nas restrições das estruturas secundárias usando a ferramenta Rosetta-Common RNA. As estruturas de energia livre mínima seriam supostamente estruturas estáveis biofisicamente. Para investigar as estruturas de ordem superior (quaternária) dos TSSaRNAs, nós estudamos a hibridização entre os TSSaRNAs e seus genes cognatos como parte de um possível sistema de regulação baseado em RNA. Ainda, baseada na hipótese que os TSSaRNAs podem ligar à proteína para habilitar sua função, nós investigamos a interação entre TSSaRNAs e proteína Lsm que é conhecida por ser uma proteína chaperone que media função do RNA e está envolvida no processamento do RNA. Nosso pipeline para executar a anotação funcional dos TSSaRNAs objetivou classificar as TSSaRNAs em suas correspondentes classes Rfam baseado em dois passos: por meio de consulta das sequências TSSaRNA em relação a modelos de covariância de famílias Rfam ou por consulta de sequências Rfam em relação a modelos de covariância das estruturas de secundárias de consenso das estruturas secundárias nos TSSaRNAs. Os resultados mostraram que o algoritmo de detecção teve sucesso em identificar um total de 224 TSSaRNAs que expressaram na mesma direção dos mRNAs e 58 TSSaRNAs que expressaram no sentido oposto (antisenso) dos mRNAs. As moléculas TSSaRNAs identificadas mostraram um comprimento mediano de 25 nucleotídeos. A respeito da anotação estrutural dos TSSaRNAs, os resultados mostraram que a maioria dos TSSaRNAs possuíam estruturas secundárias estáveis termodinamicamente e suas estruturas terciárias foram capazes de formar estruturas mais complexas por meio de vínculos com outras biomoléculas. Quanto à formação de estruturas de maior de estruturas de alta ordem nos observamos que a maioria dos TSSaRNAs (92.2%) são capazes, pelo menos em princípio, de hibridizar em seus genes cognatos e, também, 55 TSSaRNAs evidenciaram interagir com a proteína Lsm. Além disso, os experimentos computacionais de docking demonstratam os complexos TSSaRNAs-Lsm associados com energia de ligação favorável com uma média de - 542900 kcal mole -¹. Quanto à anotação funcional dos TSSaRNAs, os resultados mostraram que a maioria dos TSSaRNAs (42.05%) podem ser consideradas potenciais reguladores atuando em cis tais como elemento cis-regulamentar e sRNAs, mas ainda há pontenciais reguladores atuando em trans para regular moléculas em loci distantes, tais como CRISPR e RNA antisense. Além disso, os resultados mostraram que TSSaRNAs podem potencialmente ativar funções mais complexas como uma função catalítica, tal como Riboswitch ou executar um papel de defesa contra vírus, tal como CRISPR. Como conclusão; baseado nos resultados desse estudo, nós podemos afirmar que TSSaRNAs possuem várias funções em potencial abrindo a perspecitiva de validação experimental.
9

Transcriptional regulation and physiological importance of the kdp-system from the halophilic archaeon Halobacterium salinarum

Kixmüller, Dorthe 03 April 2012 (has links)
The high affinity, ATP-dependent K+ uptake system KdpFABC of Halobacterium salinarum, is highly induced under K+ limitation. In contrast to the well-characterized Kdp system in Escherichia coli, in which the kdpFABC genes are transcriptionally regulated by the sensor kinase/response regulator system KdpD/KdpE, transcriptional regulation of the kdp genes in H. salinarum was unknown due to the absence of halobacterial homologues of KdpD/KdpE. Furthermore, the physiological relevance of the KdpFABC K+ uptake system of H. salinarum was puzzling, since hypersaline habitats usually comprise K+ concentrations which do not induce kdp expression. In order to analyze the regulation of kdp gene expression, it was essential to gain information about the transcriptional unit(s) involved. Northern blotting, primer extension analysis and real-time RT-PCR revealed the presence of a polycistronic leaderless kdpFABCQ transcript with a putative kdp terminator or at least a potential mRNA processing site downstream of kdpQ. Furthermore, promoter truncation studies verified the so far only predicted basal transcription elements together with an upstream-located operator sequence. Since deletions of this putative operator sequence did not lead to a constitutive expression, a further component has to be involved in the regulation of the kdpFABCQ genes. However, truncation and scanning mutagenesis analyses of the kdp promoter as well as translational fusions of a halophilic beta-galactosidase to the kdp promoter excluded an additional regulatory element up- or downstream of the basal transcription elements and in the kdp-coding region. These results lead to speculations of multiple basal transcription factors to be involved. Furthermore, an inducible expression vector (shuttle vector) was constructed based on the promoter of the kdpFABCQ operon due to its, K+-sensitive features. Inducible expression systems are yet not available for H. salinarum. The resulting, replicating vector pKIX is functional and enables a K+-dependent expression from the kdp promoter with rather high induction ratios of 50-fold. Expression levels could further be improved by plasmid- and additional chromosomally encoded kdpQ and mutations generated in the kdp promoter. Since transcript levels from pKIX were found to be independent of differential target genes, the general application of pKIX as an inducible expression system is strongly supported and pKIX could, thus, be made accessible to the scientific community. To decipher the physiological relevance of the halobacterial Kdp system, H. salinarum was encountered to desiccation stress and salt crystal (halite) entombment. Halite crystals grown under non-inducing K+ concentrations with entombed strains of H. salinarum and H. salinarum deleted in the kdpFABCQ genes revealed a significantly reduced survival rate of the deletion strain upon recultivation. Additionally, a kdpFABCQ-inducing desiccation stress could already be determined on agar plates under non-limiting K+ concentrations. Furthermore, the cell morphology of H. salinarum entrapped in halite crystals resembled that of H. salinarum grown under K+-limiting conditions. Therefore, the Kdp system promotes survival of H. salinarum under desiccation stress. Furthermore, the Kdp system could be identified as at least one of the systems important for long-term survival of H. salinarum in halite.

Page generated in 0.0931 seconds